計畫簡介

本計畫為中央研究院「語言典藏」第二期的五個子計畫之一,計畫目標在拓展閩語並建立客語的語言典藏,包括長篇語料文本、辭彙與口語語音。

第一期的子計畫「閩南語典藏-歷史語言與分布變遷資料庫」從歷史語言與語言分布變遷這兩個角度建置閩南語文獻標記語料庫與語言分布變遷的地理資訊系統,其中文獻標記語料庫從最早的閩南語文獻嘉靖本《荔鏡記》(1566年)開始著手,輸入、標記、校注了嘉靖、萬曆、順治、光緒年四種版本的《荔鏡記》、類似的戲曲《同窗琴書記》、《金花女》、《蘇六娘》等刊本、以及清末至現代的閩南語歌仔冊等漢字文獻,也包括少數的客語歌冊如《渡台悲歌》等。

第二期計畫將大量拓展閩語與客語的語言典藏,補足閩、客語典藏在聲音、文本典藏之不足,系統化典藏閩南語及客語的各種文字文獻,如漢字文獻、羅馬字文獻、漢羅文獻等,加以標記、提供查詢界面;擴充辭彙庫,建置線上辭典;與「語言分佈微觀」結合,利用地理資訊技術,以閩客雜居的雲林縣崙背鄉、二崙鄉、新竹縣新埔鎮、苗栗縣後龍鎮、南庄鄉為對象,調查居民用語,研究閩客用語交互之影響,進行語言分佈的調查研究,發展語言分佈地理資訊系統。閩語典藏方面將收錄1605年左右在馬尼拉出版的《基督要理》(Doctrina Christiana en letra y lengua china)、早期辭書(如《廈英大辭典》(1873),《英廈辭典》(1883),《廈門音新字典》(1913),《台日大辭典》 (1931, 1932)等)、早期羅馬字(白話字)醫學書籍、報紙(1885-1968的《台灣教會公報》),以及當代的文本與口語。客語典藏方面,預計收錄早期字辭典(如《客英大辭典》(1926)、《客法大辭典》(1926))、傳教士文獻以及台中縣與桃園縣等客語民間文學集,主要目標是建立起臺灣客語語料庫及可供查詢、瀏覽的介面。希望建立以研究為主要目標的客語語音、詞彙、文本及地理資訊的資料庫,並提供完善的檢索,該資料庫亦將同時具有客語教學與社會推廣的功能。