計畫名稱:語言典藏
計畫主持人︰何大安 Dah-An Ho
主要典藏說明︰
「語言典藏」計畫是以「語言」為數位化典藏對象,包含「臺灣南島語典藏」及「漢語典藏與典藏架構」兩部份;典藏品型態包含語料文獻、聲音、多媒體語音。
「漢語典藏與典藏架構」的計畫目標,是針對時間軸上的歷代詞彙進行典藏,包括:
「臺灣南島語典藏」目的在保存瀕臨滅絕的臺灣南島語言。臺灣原住民語言屬於一個分佈很廣,語言現象又極為豐富的語族,稱為「南島語族」;南島語族現今分佈遍及整個太平洋及印度洋。臺灣的南島語言呈現極大的變異,其中有很多仍未被探索。大多數的臺灣南島語言仍未有文字記載,幾乎面臨消失的命運,一旦語言或方言的使用者不復存在,這個語言或方言也就跟著消失,毫無記錄可循。因此目前除了以各種方式延續語言的生命外,更實際的作法即是蒐集和保存現有的語料。本計畫建立「臺灣南島語數位典藏」的目的之一為蒐集、彙整、編輯、流通這些語料並利用網際網路(Internet)散播;除了聲音的數位化與記音保存,分析語言結構、標記、中英文翻譯也是重要的執行工作之一。預計典藏的語言有十一種:魯凱語、雅美語、鄒語、賽夏語、泰雅語、排灣語、布農語、阿美語、卑南語、卡那卡那富語、巴宰語。
網路資源︰
語言典藏 http://languagearchives.sinica.edu.tw 漢語典藏與典藏架構- 近代漢語詞彙庫 http://www.sinica.edu.tw/Early_Mandarin/ 先秦金文簡牘詞彙資料庫 http://inscription.sinica.edu.tw/ 二十世紀漢語語料庫與句法結構資料庫 http://www.sinica.edu.tw/SinicaCorpus/ 中央研究中文句結構樹資料庫 http://treebank.sinica.edu.tw/ 新世紀語料庫-多媒體的語言呈現與典藏 http://mmc.sinica.edu.tw/ 閩南語典藏-歷史語言與分佈變遷資料庫 http://southernmin.sinica.edu.tw/ 臺灣南島語典藏- 臺灣南島語語料庫,詞彙庫,與語法 http://formosan.sinica.edu.tw
計畫名稱
計畫主持人
執行單位
語言學研究所
資料庫連絡人
蔡瑋芬
填表日期
97 年 12 月 15 日
連絡人email
uihun@gate.sinica.edu.tw
資料庫名稱
目錄 開放程度
後設資料 開放程度
小圖影像 開放程度
大圖影像 開放程度
全文資料 開放程度
線上會員機制
資料庫網址與開放政策
原有 96年後新增 閩南語典藏—歷史語言與分佈變遷資料庫
開放,不需申請帳號。完全對外開放。
除歌仔冊及客家歌本為開放,需申請帳號。只對院內開放。;其餘資料皆為開放,不需申請帳號。完全對外開放。
除歌仔冊及客家歌本為放,需申請帳號。只對院內開放。;其餘資料皆為開放,不需申請帳號。完全對外開放。
無 有,尚未上線 有,已上線
cc釋出 自訂授權條款,請詳見說明網頁或說明附件。
原有 96年後新增 閩客語典藏資料庫
http://minhakka.ling.sinica.edu.tw
語言典藏--臺灣南島語數位典藏計畫
齊莉莎
中央研究院語言學研究所
林志憲
97 年 12 月 11 日
farchive@sinica.edu.tw
原有 96年後新增
網址
http://formosan.sinica.edu.tw
cc釋出 自訂授權條款,請詳見說明網頁或說明附件。 版權宣告:http://formosan.sinica.edu.tw/ch/usage/copyright.htm
語言典藏-上古漢語文獻標記語料庫
魏培泉
盧秋蓉
crlu@gate.sinica.edu.tw
原有 96年後新增 近代漢語標記語料庫
原有 96年後新增 上古漢語標記語料庫
http://www.sinica.edu.tw/Ancient_Chinese_tagged/