計畫名稱:語言典藏

計畫主持人︰何大安 Dah-An Ho

主要典藏說明︰

  「語言典藏」計畫是以「語言」為數位化典藏對象,包含「臺灣南島語典藏」及「漢語典藏與典藏架構」兩部份;典藏品型態包含語料文獻、聲音、多媒體語音。

  「漢語典藏與典藏架構」的計畫目標,是針對時間軸上的歷代詞彙進行典藏,包括:

  1. 建立先秦金文簡牘詞彙資料庫,對青銅器銘文和簡牘文字作精確的標誌與分析。  
  2. 建立近代漢語標記語料庫,將近代漢語時期的文獻詞彙進行詞類分析,架構成有系統的知識庫。  
  3. 擴大建立現代漢語平衡語料庫,務求語料能真正呈現時代語言中的多面向內容;並構建現代漢語句結構資料庫,使語料能充份運用於資訊檢索、擷取、自動問答、摘要等典藏處理應用上的附加價值。  
  4. 新世紀語料庫-多媒體的語言呈現與典藏,記錄當代臺灣漢語真正口語使用的情形,再就多元化的主題設計而產生的時間、地點、人物、事物的語言討論內容數位化,並予以後設資料的典藏與保存。  
  5. 建立空間軸上的漢語方言-閩南語典藏,從歷史語言與分佈變遷二個角度,結合文獻與生活語言,進行標誌與分析。目標之一為構建閩南語文獻標記語料庫;目標之二為記錄語言分佈變遷的地理資訊系統,以閩客雜居的新竹縣新豐鄉為對象,調查居民用語變化,分析記錄閩客用語交互之影響。

  「臺灣南島語典藏」目的在保存瀕臨滅絕的臺灣南島語言。臺灣原住民語言屬於一個分佈很廣,語言現象又極為豐富的語族,稱為「南島語族」;南島語族現今分佈遍及整個太平洋及印度洋。臺灣的南島語言呈現極大的變異,其中有很多仍未被探索。大多數的臺灣南島語言仍未有文字記載,幾乎面臨消失的命運,一旦語言或方言的使用者不復存在,這個語言或方言也就跟著消失,毫無記錄可循。因此目前除了以各種方式延續語言的生命外,更實際的作法即是蒐集和保存現有的語料。本計畫建立「臺灣南島語數位典藏」的目的之一為蒐集、彙整、編輯、流通這些語料並利用網際網路(Internet)散播;除了聲音的數位化與記音保存,分析語言結構、標記、中英文翻譯也是重要的執行工作之一。預計典藏的語言有十一種:魯凱語、雅美語、鄒語、賽夏語、泰雅語、排灣語、布農語、阿美語、卑南語、卡那卡那富語、巴宰語。

網路資源︰

語言典藏 http://languagearchives.sinica.edu.tw
漢語典藏與典藏架構-
   近代漢語詞彙庫  http://www.sinica.edu.tw/Early_Mandarin/
   先秦金文簡牘詞彙資料庫  http://inscription.sinica.edu.tw/
   二十世紀漢語語料庫與句法結構資料庫  http://www.sinica.edu.tw/SinicaCorpus/
   中央研究中文句結構樹資料庫  http://treebank.sinica.edu.tw/
   新世紀語料庫-多媒體的語言呈現與典藏  http://mmc.sinica.edu.tw/
   閩南語典藏-歷史語言與分佈變遷資料庫  http://southernmin.sinica.edu.tw/
臺灣南島語典藏-
   臺灣南島語語料庫,詞彙庫,與語法  http://formosan.sinica.edu.tw

語言典藏計畫 資料開放程度調查

計畫名稱

語言典藏計畫

計畫主持人

江敏華

執行單位

語言學研究所

資料庫連絡人

蔡瑋芬

填表日期

97 年 12  月 15 日

連絡人email

uihun@gate.sinica.edu.tw

資料庫名稱

目錄
開放程度

後設資料
開放程度

小圖影像
開放程度

大圖影像
開放程度

全文資料
開放程度

線上會員機制

資料庫網址與開放政策

原有
96年後新增
閩南語典藏—歷史語言與分佈變遷資料庫

開放,不需申請帳號。完全對外開放。

除歌仔冊及客家歌本為開放,需申請帳號。只對院內開放。;其餘資料皆為開放,不需申請帳號。完全對外開放。

開放,不需申請帳號。完全對外開放。

開放,不需申請帳號。完全對外開放。

除歌仔冊及客家歌本為放,需申請帳號。只對院內開放。;其餘資料皆為開放,不需申請帳號。完全對外開放。


有,尚未上線
有,已上線

網址 http://SouthernMin.sinica.edu.tw/

cc釋出
自訂授權條款,請詳見說明網頁或說明附件。

原有
96年後新增
閩客語典藏資料庫

開放,不需申請帳號。完全對外開放。

開放,不需申請帳號。完全對外開放。

開放,不需申請帳號。完全對外開放。

開放,不需申請帳號。完全對外開放。

開放,不需申請帳號。完全對外開放。


有,尚未上線
有,已上線

網址

http://minhakka.ling.sinica.edu.tw

cc釋出
自訂授權條款,請詳見說明網頁或說明附件。


計畫名稱

語言典藏--臺灣南島語數位典藏計畫

計畫主持人

齊莉莎

執行單位

中央研究院語言學研究所

資料庫連絡人

林志憲

填表日期

97 年 12  月 11 日

連絡人email

farchive@sinica.edu.tw

資料庫名稱

目錄
開放程度

後設資料
開放程度

小圖影像
開放程度

大圖影像
開放程度

全文資料
開放程度

線上會員機制

資料庫網址與開放政策

原有
96年後新增

開放,不需申請帳號。完全對外開放。

開放,不需申請帳號。完全對外開放。

 

 

開放,不需申請帳號。完全對外開放。


有,尚未上線
有,已上線

網址

http://formosan.sinica.edu.tw

cc釋出
自訂授權條款,請詳見說明網頁或說明附件。
版權宣告:http://formosan.sinica.edu.tw/ch/usage/copyright.htm

原有
96年後新增

開放,不需申請帳號。完全對外開放。

開放,不需申請帳號。完全對外開放。

 

 

開放,不需申請帳號。完全對外開放。


有,尚未上線
有,已上線

網址

http://formosan.sinica.edu.tw

cc釋出
自訂授權條款,請詳見說明網頁或說明附件。


計畫名稱

語言典藏-上古漢語文獻標記語料庫

計畫主持人

魏培泉

執行單位

語言學研究所

資料庫連絡人

盧秋蓉

填表日期

97 年 12  月 15 日

連絡人email

crlu@gate.sinica.edu.tw

資料庫名稱

目錄
開放程度

後設資料
開放程度

小圖影像
開放程度

大圖影像
開放程度

全文資料
開放程度

線上會員機制

資料庫網址與開放政策

原有
96年後新增
近代漢語標記語料庫

開放,需申請帳號。完全對外開放。 開放,需申請帳號。完全對外開放。      


有,尚未上線
有,已上線

網址 http://www.sinica.edu.tw/Early_Mandarin/

cc釋出
自訂授權條款,請詳見說明網頁或說明附件。

原有
96年後新增
上古漢語標記語料庫

開放,需申請帳號。完全對外開放。 開放,需申請帳號。完全對外開放。      


有,尚未上線
有,已上線

網址

http://www.sinica.edu.tw/Ancient_Chinese_tagged/

cc釋出
自訂授權條款,請詳見說明網頁或說明附件。