中國哲學書電子化計劃 - Digital Sinology

文章推薦指數: 80 %
投票人數:10人

中國哲學書電子化計劃(CTP) 是個開源的線上電子圖書館計劃,提供轉錄、閱讀和搜索中國經典和古籍的多項功能。

它的宗旨在於提供容易獲取並準確的文本 ... 中國哲學書電子化計劃 出自DigitalSinology 前往: 導覽、 搜尋 中國哲學書電子化計劃(CTP)是個開源的線上電子圖書館計劃,提供轉錄、閱讀和搜索中國經典和古籍的多項功能。

它的宗旨在於提供容易獲取並準確的文本版本[1],尤其和中國哲學相關的文本。

這個網站被譽為網絡上最大和準確度最高的中國古典文獻庫,[2][3]也被評為用以研究中國上古文獻的最有用文本庫之一。

這個網站以多種功能的整合,以及API等外部工具為基礎,讓用戶得以對古代文獻進行各種數位分析。

藉助CTPAPI和網站的插件系統,中國哲學書電子化計劃和其他數位計劃是互通的,例如TextTools、TextRef和碼庫思。

目錄 1網站內容 2功能 3參考文獻 4鏈接 網站內容 錄文界面 這個網站的基本內容包括中國古籍的經過點校和抄本的電子版,也包括基於這些版本而生成的電子文字版。

圖版和錄文這兩種內容是互為關聯的。

包含這兩種元素的圖文對照界面使得用戶可以在檢閱文字版的同時,參考文字來源的圖錄,並以此有效地進行校對和抄錄工作。

圖文對照的界面也允許眾包用戶對文字進行修訂和加上注釋,例如是修正OCR生成的文字版,或對白文加上標點。

圖文對照界面 網站上的文獻分為先秦兩漢以及漢代之後的文本。

前者以諸子百家來劃分,後者則以朝代來分類。

先秦兩漢部分有超過5百萬字文獻,而漢代之後部分則有超過2000萬字文獻。

可供用戶自由編輯修訂的維基部分有超過5億字的規模。

[4]許多文獻還附上英文和現代漢語譯文,並跟原文逐段或逐句配對顯示,便於用戶比對。

這加強了這個網站的學術價值,不精通或完全不懂中文的用戶也可以加以利用。

[5]許多文獻在這個網站上都有多種版本,其錄文是根據不同的具體的版本,系統會一一記錄。

除了提供適用於中國文獻的高階搜索功能[6][7],網站還提供多項為專家設計的功能,包括多功能辭典、詞彙列表、互文信息[8]、文本來源的圖錄、字詞索引及相關信息[9]、元數據、注釋信息的顯示[10]、羅列公開數位資源的資料庫,以及可連接到本網站任何一條數據的論壇。

[11][12]中國哲學書電子化計劃的「圖書館」包含超過2500萬頁的中國古籍掃描圖版,[13][14]並且跟全文庫逐行關聯。

這其中有許多是OCR生成的,[15]並可通過一個線上、眾包的維基系統編輯和維護。

[16][17]這些文本數據和元數據可以通過API輸出,所以可以跟其他線上工具連接,也方便用於文本挖掘和數位人文計劃。

[16][18] 功能 辭典頁面 系統內嵌了不少功能,而且通過插件和API還可以加入更多功能。

基本工具包括辭典功能,提供來自本系統的關於某字詞的信息,例如是辭典中所記錄的出處引文、各種文獻記載的音韻信息、字詞過去的用法,以及翻譯(如果有的話)等。

辭典也支持以Unicode以外的語言來搜索。

Comparisonoftypicalerrorratesonapageofpre-modernChinesetext 利用為了這個網站特別設計的OCR,這個系統大幅減低了古籍錄文的錯誤率,提供了大量過去沒有的古籍版本之文字。

[19]這些以OCR生成的錄文讓用戶得以對古籍的圖像版進行搜索,其中包括哈佛燕京圖書館中文善本特藏數碼化計劃的內容和其他大學圖書館的提供的館藏內容。

這個網站的用戶可以集體對錄文進行修訂,糾正其中錯誤,也可以對文字加上標點和注釋。

除了提供跟外部工具和其他計劃的整合機制,中國哲學書電子化計劃的CTPAPIandpluginsystem還提供了強大的工鞥呢,使得其中的文本數據可用於文本挖掘研究和數位人文教學。

這些外部工具包括TextTools,實現以下功能:瀏覽器中的字詞統計、互文分析、文本相似度分析,以及對系統上文本的其他面向之互動可視化。

網站還提供一個Python工具包,提供更專門的數據挖掘操作,並和API相關聯。

參考文獻 ↑Elman,BenjaminA.ClassicalHistoriographyforChineseHistory:Databases&electronictexts.PrincetonUniversity.[June3,2016].  ↑AssociationofChinesePhilosophersinNorthAmerica(北美中國哲學學者協會) ↑ChrisFraser,DepartmentofPhilosophy,UniversityofHongKong ↑http://ctext.org/system-statistics ↑Connolly,Tim.LearningChinesePhilosophywithCommentaries.TeachingPhilosophy(PhilosophyDocumentationCenter).2012,35(1):1–18[March19,2017].  ↑http://ctext.org/instructions/advanced-search ↑http://ctext.org/faq/normalization ↑Sturgeon,Donald.UnsupervisedidentificationoftextreuseinearlyChineseliterature.DigitalScholarshipintheHumanities(OxfordUniversityPress).2017[November21,2017].  ↑Xu,Jiajin.Corpus-basedChinesestudies:Ahistoricalreviewfromthe1920stothepresent.ChineseLanguage&Discourse(JohnBenjaminsPublishingCompany).2015,6(2):218–244[June3,2016].  ↑Adkins,MarthaA.WebReview:OnlineResourcesfortheStudyofChineseReligionandPhilosophy.TheologicalLibrarianship(AmericanTheologicalLibraryAssociation).2016,9(2):5–8[November7,2016].  ↑HolgerSchneiderandJeffTharsen,http://dissertationreviews.org/archives/9213 ↑http://ctext.org/introduction ↑http://ctext.org/library.pl?if=en ↑http://ctext.org/system-statistics ↑Template:Citeconference ↑16.016.1https://cpianalysis.org/2016/06/08/crowdsourcing-apis-and-a-digital-library-of-chinese/,ChinaPolicyInstitute,UniversityofNottingham ↑http://ctext.org/instructions/ocr ↑http://ctext.org/tools/api ↑Template:Citeconference 鏈接 中國哲學書電子化計劃-英文網站 中國哲學書電子化計劃 ChineseTextProject豆瓣上的介紹 zh:中國哲學書電子化計劃 取自"https://digitalsinology.org/zh/mediawiki/index.php?title=中國哲學書電子化計劃&oldid=398" 8個分類:ProjectsFulltextdatabasesDigitallibrariesDigitalhumanitiesChineseclassictextsProjectswithAPIs數字圖書館全文資料庫 導覽選單 個人工具 登入 命名空間 頁面 討論 繁體 檢視 閱讀 檢視原始碼 檢視歷史 更多 搜尋 導覽 首頁近期變更隨機頁面說明 工具 連結至此的頁面相關變更上傳檔案特殊頁面可列印版靜態連結頁面資訊 其他語言 日本語English 此頁面最後編輯於2018年6月15日(週五)08:52。

除非另有註明,否則所有內容皆以CreativeCommonsAttributionShareAlike3.0條款授權。

隱私政策 關於DigitalSinology 免責聲明



請為這篇文章評分?