計畫名稱:語言典藏
計畫主持人︰何大安 Dah-An Ho
主要典藏說明︰
「語言典藏」計畫是以「語言」為數位化典藏對象,包含「臺灣南島語典藏」及「漢語典藏與典藏架構」兩部份;典藏品型態包含語料文獻、聲音、多媒體語音。
「漢語典藏與典藏架構」的計畫目標,是針對時間軸上的歷代詞彙進行典藏,包括:
「臺灣南島語典藏」目的在保存瀕臨滅絕的臺灣南島語言。臺灣原住民語言屬於一個分佈很廣,語言現象又極為豐富的語族,稱為「南島語族」;南島語族現今分佈遍及整個太平洋及印度洋。臺灣的南島語言呈現極大的變異,其中有很多仍未被探索。大多數的臺灣南島語言仍未有文字記載,幾乎面臨消失的命運,一旦語言或方言的使用者不復存在,這個語言或方言也就跟著消失,毫無記錄可循。因此目前除了以各種方式延續語言的生命外,更實際的作法即是蒐集和保存現有的語料。本計畫建立「臺灣南島語數位典藏」的目的之一為蒐集、彙整、編輯、流通這些語料並利用網際網路(Internet)散播;除了聲音的數位化與記音保存,分析語言結構、標記、中英文翻譯也是重要的執行工作之一。預計典藏的語言有十一種:魯凱語、雅美語、鄒語、賽夏語、泰雅語、排灣語、布農語、阿美語、卑南語、卡那卡那富語、巴宰語。
網路資源︰
語言典藏 http://languagearchives.sinica.edu.tw 漢語典藏與典藏架構- 近代漢語詞彙庫 http://www.sinica.edu.tw/Early_Mandarin/ 先秦金文簡牘詞彙資料庫 http://inscription.sinica.edu.tw/ 二十世紀漢語語料庫與句法結構資料庫 http://www.sinica.edu.tw/SinicaCorpus/ 中央研究中文句結構樹資料庫 http://treebank.sinica.edu.tw/ 新世紀語料庫-多媒體的語言呈現與典藏 http://mmc.sinica.edu.tw/ 閩南語典藏-歷史語言與分佈變遷資料庫 http://southernmin.sinica.edu.tw/ 臺灣南島語典藏- 臺灣南島語語料庫,詞彙庫,與語法 http://formosan.sinica.edu.tw