(一) 古文字
1、
漢達文庫(付費)http://www.chant.org/
本站由漢達文庫所製作,內容包括甲骨文,附有標準甲骨文字庫,(自1996年起,收錄13冊《甲骨文合集釋文》及《英國所藏甲骨集》等7種海外所藏甲骨卜辭資料)、竹簡帛書(自1994年起至1996年完成,共收錄出土簡帛文獻包括《武威漢簡》、《馬王堆漢墓帛書》、《銀雀山漢簡》、《睡虎地秦墓竹簡》等多種,附釋文、圖像逐簡對照顯示)、金文(1999年起,以中國社會科學院考古所編纂《殷周金文集成釋文》為據,收錄12021銅器資料,約18000張拓本,包括摹本,約近100萬字器物資料說明,另140000字隸定釋文)等。
2、
先秦金文簡牘詞彙資料庫http://inscription.sinica.edu.tw/
本站由中央研究院歷史語言研究所先秦金文簡牘詞彙庫工作小組製作。「先秦金文簡牘詞彙資料庫」分為金文和簡牘兩個子資料庫,「金文詞彙資料庫」包括三個部分:「詞彙庫查詢」、「詞彙庫索引」以及「詞彙庫管理」。「詞彙庫查詢」可以自行輸入關鍵詞或以《殷周金文集成》青銅器器號進行檢索;若無任何金文的先備知識,也可透過「詞彙庫索引」,以詞類和更精確的內容分類找出符合條件的詞彙,更可以「時代」和「出土地」相關的時空資料縮小檢索範圍。
3、
碑帖菁華 http://res2.nlc.gov.cn:9080/ros/index.htm
本站為中國國家圖書館收藏30000種、230000件之石刻拓片數位化之成果,佔中國總數之6成。系統提供如題名、年代、地點、石刻類名等8項欄目供使用者進行檢索,目前已完成20000餘幅。
4、
西夏碎金http://res2.nlc.gov.cn:9080/wenxian/
本站為中國國家圖書館所藏之西夏文獻數位化之成果,多為西夏與元代時期。本資料庫分設文獻與論著2大部分,可以檢索古籍一百餘冊、原件影像6000餘件。
5、
甲骨世界http://res2.nlc.gov.cn:9080/jiagu/index.htm
本站由中國國家圖書館製作,影像資源庫的大部分拓片來源均選用本館金石組自拓拓本,極少部分拓片因字迹不清晰選用館藏各藏家拓本。在2006年的資料庫當中包括了甲骨條目2964條,影像5932幅;甲骨拓片條目2975條,影像3177幅。
2007年數據庫更新,甲骨條目800條,影像1600幅;甲骨拓片條目800條,影像833幅。
6、
古文字的世界http://ultra.ihp.sinica.edu.tw/~bronze/
本站為中央研究院歷史語言研究所製作,屬於國科會數位博物館先導計畫,分為甲骨文、金文、東周文字等;除了文字外,還附有許多的圖片以供參考輔證。
7、 甲骨文全文影像資料庫 http://libdb.lib.ncku.edu.tw/ttscgi/ttsweb?@0:0:1:shell@@0.25350558952074314
本站由國立成功大學所建置的,收錄 41950 筆甲骨文書目及影像資料,可利用分類、關鍵字及拓片影像等進行檢索;內容包括《甲骨文合集》41596個拓片、《殷墟甲骨刻辭摹釋總集》全部釋文。
8、 北京大學圖書館金石拓片特藏 http://162.105.138.23/tapian/tp.htm
本站是由北京大學圖書館製作,本拓片資料庫選擇了該館藏其中100種拓片的目錄訊息和照片作為樣本,可在概覽目錄之後,根據需要做特定之條目上的檢索。
9、 甲骨文 http://www.lib.cuhk.edu.hk/uclib/bones/bones.htm
香港中文大學聯合書院圖書館所藏甲骨,是其校理學院鄧祖玄同學慨贈給學校的,網站展示了45片文字可讀的甲骨圖片,並附有李棪先生的7條釋說,是以甲骨圖片為主的網站。
10、 甲骨文 http://mcw.hkcampus.net/~mcw-lwl/mcw-hkw/chinese/index.htm
本站是以甲骨文為主,介紹甲骨文的年代起源與材料、內容為何,還有甲骨文的發現時間、風格演變、占卜的方法、甲骨文的分類,探討甲骨文與殷商文獻發展和圖書起源的關係,說明有關甲骨文的基本概念,最後是一份甲骨文字研究、釋義的簡報。
11、
甲骨刻辭
http://www.sinica.edu.tw/~tibe/2-relic/well/ch3-1.html
本站為針對中央研究院歷史語言研究所所藏的甲骨圖片數位化之成果,且對於甲骨刻辭做了簡介;將滑鼠移至圖片位置,會顯示此甲骨的大小,點入後會對此塊甲骨作詳細的介紹,包括它出土的地方和其所記載的內容。
12、
殷墟YINRUINS http://jgw.ayinfo.ha.cn/
本站是由安陽信息港所設立的網站,收集了許多研究人員所著作的文章,以及一些發現和研究,其中有許多是來自北京中國科學院自然科學史研究所,而且它還連結了殷墟資料庫和台灣史語所所整理的世紀考古大發現,以及一些中國甲骨文獻庫、考古所、博物院等,可供參考。
13、
甲骨學概論
http://nuhm.pccu.edu.tw/p4_12_m.htm#01
在甲骨學概論部分,它提供一些參考書籍的書目資料,再來介紹甲骨文的發現時間和發現者、著錄和考釋、甲骨的占卜、刻寫工具和挖掘分期、種類和來源、甲骨四堂等。另外,在甲骨文年鑑中,它提供一些論著的目錄,包括專書和期刊論文的書目資料,及這各計畫研究結果的綜述等。
14、
新華網河南考古頻道
http://www.ha.xinhua.org/fuwu/kaogu/jgwh.htm
河南考古網站的主題以在河南當地甲骨文化、汝瓷文化、與鈞瓷文化的考古研究為主。內容有許多的主題,主要大概有甲骨文相關研究、報導;介紹研究、收藏甲骨(文)的收藏家和有名的研究人員;甲骨的歷史掌故、占卜方法;還有一些甲骨的圖片和拓片。
15、
漢字古文字字體演變 http://web.hku.hk/~jwilam/chinese/change.htm
本資料庫整合了甲骨文、金文、楚帛書、小篆、隸書等字形,只需將關鍵字輸入檢索,即可得到該字行體之演變過程。
16、
中法越國際漢拓研究室
http://www.ccunix.ccu.edu.tw/%7Ehishkm/
本站為中華民國國立中正大學文學院、法國遠東學院與越南社會科學院漢喃研究所共同製作。該站目前已建置《越南漢喃銘文匯編》第1、2輯的目錄資料,部分銘文圖像也已掃描上網;此外還提供中國西南方研究的論著目錄。
17、
文字的故事
http://tech2.npm.gov.tw/DM2003/wcbi/a/dintro01.htm
本站由國立故宮博物院所建置,描述歷代書家以篆、隸、草、行、楷之各種書體,展現漢字不同的風華。介紹從甲骨文至民國以來文字演變的過程,使得漢字不再只是作為紀錄語言的工具,而是昇華為藝術的表現。
18、
殷墟遺文 http://www.npm.gov.tw/exhbition/yin0701/yin0701.htm
由中央研究院歷史語言研究所製作,數位化的內容以其院內所藏之甲骨拓片作為主體;且對於甲骨文的發現與研究成果藉由網站上,都可以得到相關的解答。
19、
銘文話西周 http://tech2.npm.gov.tw/DM2003/wcbi/c/cintro01.htm
該站由國立故宮博物院所建置,其中對於金文的時代美感、社會意義與解讀金文上,藉由影片上的解說,可以對金文有更詳細的認識。
20、
東京大學總合研究博物館 http://www.um.u-tokyo.ac.jp/DM_CD/DM_CONT/KOKOTSU/HOME.HTM
本站為東京大學綜合研究博物館製作,內容為該館所藏之甲骨與其拓本之數位化之成果。
21、
聯合書院圖書館東莞鄧氏舊藏甲骨簡介 http://www.lib.cuhk.edu.hk/uclib/bones/bones.htm
本資料庫為聯合書院製作。1969年5月聯合書院理學院鄧祖玄奉母命以其父爾雅先生遺存龜甲卜辭33片,獸骨卜辭12片,殘骨11片,合計56片,現存於聯合書院圖書館收藏
。此56片甲骨為晚殷武丁第1期,及祖庚、祖甲第2期之物。
22、
瀚堂典藏 http://www.hytung.com.tw/zh-tw/default.aspx
本站為北京時代瀚堂科技有限公司所製作,其內容包括「小學工具」、「出土文獻」、「傳世文獻」與「專題文獻」4大類,可以藉由關鍵字詞的鍵入,查找到該類別的相關資料。
23、
甲骨文拓片
http://catalog.ndap.org.tw/dacs5/System/Catalog/List.jsp?ContentID=38581&CID=38625
本站為數位典藏的一部份,將拓片分為文字、天文、官吏、刑罰等若干類,藉由拓本上的圖影,可以看見古文字的清楚樣貌。
24、
石刻部
http://catalog.ndap.org.tw/dacs5/System/Catalog/List.jsp?ContentID=38581&CID=38582
本站為數位典藏的一部份,藉由石刻拓本的拓本,可以看到碑刻上古文字之樣貌;以滑鼠點選器物拓本,其圖片還可放大。
25、
吉金部
http://catalog.ndap.org.tw/dacs5/System/Catalog/List.jsp?ContentID=38581&CID=38615
本站為數位典藏的一部份,藉由對於古器物的拓本,可以看到古文字的樣貌;以滑鼠點選器物拓本,其圖片還可放大。
26、
東京大學人文科學研究所所藏石刻拓本資料 http://kanji.zinbun.kyoto-u.ac.jp/db-machine/imgsrv/takuhon/index.html
本站為京都大學人文科學研究所所藏石刻拓本資料,內容分為「畫像石」與「文字拓本」二部份,經過點選之後可將圖片放大看見拓本上之古文字之面貌。
27、
王筠《文字蒙求》 http://www.gg-art.com/imgbook/index.php?bookid=38
本站是將清代王筠所著之《文字蒙求》數位化的結果,透過筆畫檢索,即可得其字義。
28、
許慎撰、段玉裁注《說文解字注》 http://www.gg-art.com/imgbook/index.php?bookid=53
本站是將清段玉裁《說文解字注》數位化的結果,透過筆畫之檢索,可得到其許慎《說文解字》之本文與段玉裁為《說文解字》所作的注解。
29、
康殷《文字源流淺析》釋例篇 http://www.gg-art.com/imgbook/index.php?bookid=60
本站是將康殷《文字源流淺析》釋例篇數位化的結果,透過筆畫之檢索,可得到其字甲骨文、金文與小篆之字形演變情形。
30、
殷周金文暨青銅器資料庫(付費) http://db1.sinica.edu.tw/~textdb/bronzePage/
本站資料庫為中央研究院歷史語言研究所金文資料庫工作小組所製作,其內容為《殷周金文集成》拓片圖檔,由中國社會科學院考古研究所授權中央研究院歷史語言研究所在網路上使用,資料庫只有網路使用權,所有圖像均有浮水印保護,嚴禁下載複製。
31、
愛如生中國古籍系列經學類-中國金石庫(付費) http://www.greatman.com.tw/chinsuku1.htm
本站由愛如生數字化技術研究中心製作。中國金石庫收錄上古至民國初年歷代金石文獻,其中金石拓片100000件,金石志書1000種。包括古代銅器銘文和古代石刻的拓片,以及著錄古代銅器銘文和古代石刻的志書。可從分類檢索、條目檢索、全文檢索、高級檢索4條路徑進行快速海量檢索,可運用圖文對照、標點批註、分類收集、下載保存、原文列印等10個輔助功能實現整理和研究的全電子化作業,足資考訂和利用。
32、
甲骨文數位典藏 http://rub.ihp.sinica.edu.tw/%7Eoracle/
本站由中央研究院歷史語言研究所製作,由2004年開始建置甲骨文拓片數位典藏,主要處理對象是藏於史語所的甲骨文拓片,約有40000餘件,可分為考古發掘甲骨之拓片,及購藏所得甲骨之拓片兩類。本資料庫的拓片資料,囊括史語所傅斯年圖書館所藏甲骨文拓片18冊,及考古學門庫房所藏《善齋藏契》拓片9000多張,再加上史語所藏甲骨文拓片,總計超過45000張。
33、
青銅器拓片數位典藏(付費) http://rub.ihp.sinica.edu.tw/~bronze/
本站為中央研究院歷史語言研究所與傅斯年圖書館合製。本站是將傅斯年圖書館現藏有1100餘件的「青銅器全形拓」數位化的結果,例如「希丁手拓」、「甲子孟冬希丁拓于閩縣蠃江」、「金谿周康元手拓金石文字」、「王秀仁手拓」、「郃陽馬子雲手拓金石」等。
34、
金石拓片資料庫 http://rarebook.ncl.edu.tw/gold/
本站由國家圖書館自民國94年開始即將館藏珍貴之金石拓片進行數位化,內容包括所藏金石拓片,共6462件,12462幅。其中以墓誌2820件為最多,次者為刻石2826件、吉金(金文全形)771件。金文部分,以鐘鼎彝器為大宗,旁及度量衡器、兵器、鏡鑑等物,時代起自殷商、西周、春秋戰國以迄漢世。石刻部分,以碑誌為多,間及兩漢刻石文字,有篆有隸,碑碣、摩崖、題記、殘石,能藉以窺探篆隸嬗變的軌跡,再者唐人碑誌已超過千種,其中頗可補《全唐文》所未備。
35、
遼金元拓片數位典藏 http://rub.ihp.sinica.edu.tw/lcyrub/
本站為中央研究院歷史語言研究所製作。傅斯年圖書館藏有遼金元拓片約2000幅,其中以元代(1260-1368)拓片佔絕大多數,
約1400幅;遼(907-1125)、金(1115-1234)拓片各為160、450幅。傅圖遼金元拓片之年代,介於西元946-1382年之間,年月不詳者不少;內容則涵蓋了墓誌、墓碑、刻經、造像、題名、詩詞、道教、佛教、聖旨、令旨、法旨等等。
36、
院藏西周金文 http://tech2.npm.gov.tw/DM2003/wcbi/index.htm
本站由國立故宮博物院所建置,藉由關鍵字詞的鍵入,可以查找出金文的相關資料。
37、
郭店楚簡資料庫 http://bamboo.lib.cuhk.edu.hk/
本站由香港中文大學圖書館與香港中文大學中國語言及文學系張光裕教授共同製作,內容主要為張光裕教授
《郭店楚簡研究‧第一卷‧文字編》一書載錄之16篇釋文修訂本,可按竹簡編號、篇目名稱、或於內容項下輸入有關字詞,作全文檢索。
38、
歷代碑帖 http://staff.whsh.tc.edu.tw/~huanyin/betei.htm#begin
本站搜羅了歷代碑帖,藉由圖影與文字簡介,可以對於拓本碑刻上之字體流變有更深一層之認識。
(二) 語料庫
1、
閩南語典藏-歷史語言與分布變遷資料資料庫 http://140.138.172.55/southernmin/index.htm
本站由中央研究院語言所製作,收錄閩南語大眾文學中的劇本和歌仔冊共6種作為語料,可瀏覽及檢索全文;並有語言分佈調查庫,可勘查臺灣鄉鎮村落語言分佈的狀況,建立語言地圖。
2、
台灣南島語數位典藏
http://formosan.sinica.edu.tw/
本站為中央研究院國家典藏數位化計畫之語言典藏,建置目的在於建立虛擬圖書館,可以透過語言的空間檢索,去瞭解南島語之語言的分布情況及其記音。
3、
中央研究院平衡語料庫 http://www.sinica.edu.tw/ftms-bin/kiwi.sh
本站是由中央研究院資訊所、語言所詞庫小組完成,專門針對語言分析而設計,每個文句都依詞斷開,並標示詞類。
4、
台大資訊系自然語言處理實驗室 http://nlg3.csie.ntu.edu.tw/cindex.html
本站是由台大資訊系自然語言處理實驗室製作,內容由「臺灣本土語言互譯及語音合成系統」、「中文斷詞及人名、組織名辨識系統」和「中文開放領域自動問答系統」三部份所構成。
5、
臺灣南島語空間資料庫查詢系統
http://webgis.sinica.edu.tw/twnlanguage/viewer.htm
本站為中央研究院語言研究所製作。資料庫以臺灣南島語料作為其主體,點選各族之語言,該資料庫即會將其語料所在地以色塊方式呈現其語料分布之所在地。
6、
中央研究院古漢語語料庫 http://www.sinica.edu.tw/~tibe/2-words/old-words/
本站為中央研究院語言研究所製作。語料庫建構始於1990年,可依是否經過斷詞及加標詞類而分成2類,即未加標的素語料庫以及有標注的標記語料庫。目前語料庫所蒐集的語料已含蓋上古漢語(先秦至西漢)、中古漢語(東漢魏晉南北朝)、近代漢語(唐五代以後)大部分的重要語料;在標記語料庫方面,上古漢語及近代漢語都已有部分語料完成標注的工作,並視結果逐步提供上線檢索。
7、
中央研究院近代漢語標記語料庫 http://www.sinica.edu.tw/Early_Mandarin/
本站為中央研究院語言研究所製作。近代漢語的標注從1997年開始規劃,目前提供《紅樓夢》、《金瓶梅》、《平妖傳》、《水滸傳》、《儒林外史》、《醒世姻緣》、《西遊記》
、《關漢卿戲曲集》、《元刊雜劇三十種》、《永樂大典戲文三種》等10部古典文獻語料線上檢索。
8、
中央研究院現代漢語平衡語料庫 http://www.sinica.edu.tw/SinicaCorpus/
本站是由中央研究院資訊所、語言所詞庫小組所設計,是專門針對語言分析而設計的,每個文句都依詞斷開,並標示詞類。語料的蒐集也盡量做到現代漢語分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。
9、
新世紀語料庫 http://mmc.sinica.edu.tw/
本站為中央研究院國家典藏數位化計畫,內容包括了「現代漢語主題對話語音語料庫」、「現代漢語連續口語對話語音語料庫」及「現代漢語地圖導引口語語音語料庫」;
標記集系統則分為「言談標記」、「詳細自發性口語現象」及「特殊語音現象」三大類,通過介面查詢系統,就不同類型的語料庫,進行相關的檢索作業。
10、
中研院語言所字字珠璣語庫查詢系統 http://www.sinica.edu.tw/~tibe/2-words/words/
「字字珠璣」在「搜文解字」大計畫下連結「平衡語料庫」(望文生義)以語境為貴的語詞檢索系統,同時附加線上即時輔佐救援,利用造詞、注音、詞語出處等方法加以搜尋,不但有典籍原文出處,還提供新創語料有五百萬詞之多的語料庫為基礎提供語境上下文來突顯關鍵詞語法和語義的相關信息。
11、
中央研究院中英雙語知識本體詞網 http://bow.sinica.edu.tw/
本站之原始內容(除英語WordNet單語資料庫由普林斯頓大學開發擁有並公開授權。SUMO
由teknowledge.com
管理並公開授權)其智財權由中央研究院與遠見科技股份有限公司共同持有。資料庫以英文WordNet架構為基礎,並以以台灣地區的語言使用為經驗基礎。提供的訊息包含中英雙語跨語言資訊轉換、語言資訊與概念架構(知識本體)的連結、詞義的區分與詞義關係的連結以及使用領域,在使用語言與詞彙資料的基礎上,提供了知識運籌的基本架構(infrastructure)。讓不同來源的典藏知識內容,可以轉換成互通的
(inter-operable)
訊息。
(三) 方言
1、
二十世紀契丹語言文字研究論著目錄 http://www.pku.edu.cn/academic/zggds/004/003/003.htm
契丹語言文字研究是阿爾泰語言學、契丹史和遼史的一項重要課題,自1922年慶陵契丹字哀冊發現以來,契丹語文學便成為中國民族語文學中的一個重要分支。本資料庫收錄研究論著目錄從1900至2000年,以及2001年的部分研究成果。全目按照漢文、日文、蒙文、俄文、英文、法文、德文、朝鮮文的順序編制,且將外文譯為中文。
2、
粵語審音配詞字庫 http://humanum.arts.cuhk.edu.hk/Lexis/lexi-can/
本站為人文電算研究中心所自行開發主要把黃錫凌編的《粵音韻彙》、李卓敏編纂的《李氏中文字典》、周無忌和饒秉才編的《廣州話標準音字彙》及何文匯和朱國藩編著的《粵音正讀字彙》這四本書中所有大五碼漢字的粵音資料兼收並蓄,按每一種讀法配以若干詞例,若遇冷僻字無法配詞者,則作簡單備注。
3、
粵音韻彙 http://humanum.arts.cuhk.edu.hk/Lexis/Canton/
本站是由香港中文大學人文學科研究所人文電算與人文方法研究室粵音電子字典組共同建立,主要取材自黃錫凌《粵音韻彙》(重排本)一書。本網頁除提供粵音檢索和網上發音服務外,亦提供漢字部首索引、漢字筆畫索引、漢字頻序索引、文句自動連線等等多種功能。
4、
粵語音韻集成 http://humanum.arts.cuhk.edu.hk/Lexis/Canton2/
《粵語音韻集成》電子版主要取材自香港語言學學會於1997年出版的《粵語拼音字表》。語音標準以黃錫凌《粵音韻彙》為主,再按順序訂以周無忌、饒秉才《廣州話標準音字彙》,及李卓敏《李氏中文大字典》收錄的材料。此外,本網頁亦收錄了香港語言學會建議的一些口語音。
本網頁除提供粵音檢索及網上發音服務外,更與海內外已上網的字典辭書取得針對漢字義項的直接線上聯繫。此網頁亦提供漢字部首索引、漢字筆畫索引、漢字頻序索引、文句自動連線等等多種功能,務求為使用者提供最大的方便。
5、
國立臺灣大學資訊工程學研究所自然語言處理實驗示-臺灣本土語言互譯及語音合成系統 http://nlg.csie.ntu.edu.tw/systems/TWLLMT/
本站是由國立台灣大學資訊工程學系陳信希教授運用國科會計畫所開發出來的語言處理技術,設計一套本土語言互譯及語音合成系統,使用者以中文輸入,可以國語語音、台語語音及客語語音輸出。網頁上的播放聲鈕,是語音合成的結果。