2019年1月11日,教育“奮進之筆”行動、國家語委重大基礎(chǔ)資源建設(shè)項目“通用漢字全息數(shù)據(jù)庫建設(shè)”的標志性成果——“漢字全息資源應用系統(tǒng)”發(fā)布會在北京師范大學舉行。教育部語言文字信息管理司、北京師范大學等相關(guān)單位負責人,學界和媒體代表等參加發(fā)布會。
會議現(xiàn)場(主辦方供圖)
開展通用漢字全息數(shù)據(jù)庫建設(shè),是貫徹落實《國家語言文字事業(yè)“十三五”發(fā)展規(guī)劃》,推進語言文字信息化建設(shè)的重要舉措。該項目由北京師范大學中國文字整理與規(guī)范研究中心、漢字研究與現(xiàn)代應用實驗室負責實施,歷時3年建設(shè)形成重要成果“漢字全息資源應用系統(tǒng)”并供社會使用。
發(fā)布會上,項目主持人、北京師范大學王立軍教授介紹了漢字全息資源應用系統(tǒng)的研發(fā)背景、意義,研發(fā)團隊構(gòu)成等基本情況,概括了該系統(tǒng)在內(nèi)部設(shè)計、外在表現(xiàn)方面的特點,并展望了系統(tǒng)的應用前景。
王立軍教授發(fā)言(主辦方供圖)
“漢字全息資源應用系統(tǒng)”是什么
“漢字全息資源應用系統(tǒng)”是在新型漢字理論的指導下,充分運用當前的數(shù)據(jù)庫技術(shù)、信息挖掘技術(shù)等現(xiàn)代化手段,對海量的漢字信息資源進行有機整合,從形、音、義、用、碼五大維度,較為全面地呈現(xiàn)古今漢字的屬性體系,構(gòu)建出一個科學、系統(tǒng)、實用的漢字全息資源應用平臺。
系統(tǒng)界面(主辦方供圖)
“漢字全息資源應用系統(tǒng)”中有什么
此次上線的系統(tǒng)提供了豐富的漢字多維屬性資源,包括圖形信息資源和文本信息資源,分別來自古文字拓片、文字編、歷代辭書、規(guī)范字表、編碼字符集、經(jīng)典文獻、中小學語文教材等。可謂把古今常用漢字相關(guān)知識“一網(wǎng)打盡”。
來感受一下目前系統(tǒng)提供的資源:
★ 字符集:4種,共計81,722字;其中通用規(guī)范字8,105字,古籍印刷字16,490字,歷代漢字16,489字;
★ 辭書:20種,結(jié)構(gòu)化數(shù)據(jù)494,615條,掃描圖片數(shù)量91,442面;
★ 古籍文獻:60種,提取用例1,364,375條,共計34,793,090字;
★ 歷代字形圖:415,675個。
“漢字全息資源應用系統(tǒng)”有何特色
系統(tǒng)內(nèi)部設(shè)計特點(主辦方供圖)
系統(tǒng)外在表現(xiàn)特點(主辦方供圖)
此外,作為信息化時代的研究成果,該系統(tǒng)采取深層和表層兩級結(jié)構(gòu)模式,使紛繁復雜的漢字屬性信息有條不紊地展示出來。系統(tǒng)所開發(fā)的深層系聯(lián)工具,可以深入揭示漢字之間的復雜關(guān)系;漢字演變動畫模塊,直觀形象地展現(xiàn)出漢字從古到今的演化過程。
“漢字全息資源應用系統(tǒng)”能干啥
★ 基礎(chǔ)教育及漢語國際教育領(lǐng)域的教學平臺
★ 漢語言文字學領(lǐng)域?qū)<覍W者的科研平臺
★ 漢字類數(shù)字化產(chǎn)品的開發(fā)平臺
★ 國內(nèi)外文化愛好者的學習平臺
如此“高大上”的系統(tǒng)怎么用?王立軍教授對此作了詳細演示。
“在搜索欄輸入一個字,例如‘中國’的‘國’,點擊檢索后,系統(tǒng)不僅可以顯示其古今字形的演變、字義條目,還可以查到其在一些常用古籍文獻中被使用的情況。比如在《史記》中它出現(xiàn)了多少次?!薄霸俦热?,想看‘典’字的字形演變,在歷代字型檢索模塊輸入這個字,就可以看到一段一分鐘左右的動畫,形象展示了‘典’從甲骨文、金文直到現(xiàn)代宋體的書寫形式演變?!彼榻B道。
“典”字形演變動畫(系統(tǒng)截圖)
該項目的成功建設(shè),需要先進的理念支撐。北京師范大學資深教授王寧代表設(shè)計團隊和制作團隊,介紹了項目設(shè)計的三個主要理念。一是屬性的分解。團隊在傳統(tǒng)的漢字“形、音、義”三方面屬性外增加了“碼”和“用”,將籠統(tǒng)的漢字個體的資源庫,改造為漢字的屬性庫,解決關(guān)聯(lián)的多角度問題。二是層次的確立。將漢字分為常用—通用—適用—罕用—無用5個層次,把無限的關(guān)聯(lián)變?yōu)榭梢圆僮鞯挠邢揸P(guān)聯(lián),一方面可以在應用中擴大有用信息的使用度,另一方面使垃圾信息、無用信息、重復信息逐步退出關(guān)聯(lián),不再干擾有效信息的集合和調(diào)用。三是中介的尋求,系統(tǒng)以《說文解字》的9,353個小篆和10,516個字樣為中介,保證了不同形制、不同字體、不同時代漢字的最大限度關(guān)聯(lián)。
王寧教授致辭(主辦方供圖)
北京師范大學副校長郝芳華在致辭中,對項目研發(fā)團隊的辛勤工作表示敬意,對國家語委的支持表示感謝。她表示,北師大的漢語言文字研究工作近年來發(fā)展很快,取得了豐碩成果?!皾h字全息資源應用系統(tǒng)”是北師大交叉學科研究項目中研發(fā)速度最快、成果最顯著的,希望它能夠成為漢字漢語教學研究、傳統(tǒng)文化推廣傳播的優(yōu)質(zhì)平臺。
郝芳華副校長致辭(主辦方供圖)
教育部語言文字信息管理司副司長劉宏參加了此次發(fā)布會。他肯定了“漢字全息資源應用系統(tǒng)”的建設(shè)成果,為北師大對國家語委項目的關(guān)心與支持表示感謝,對項目研發(fā)團隊表示敬意。他表示,這一系統(tǒng)在推進語言文字工作、服務國家發(fā)展需求方面發(fā)揮了重要作用:一是服務文化強國建設(shè),傳播中華文化,更好地展示漢字的發(fā)展及其文化內(nèi)涵,促進漢字文化發(fā)揚光大;二是服務教育現(xiàn)代化,以全國教育大會精神為指引,提供滿足學校師生多元需求的漢字信息資源平臺;三是服務語言文字事業(yè)發(fā)展,促進語言文字的規(guī)范化、標準化和信息化,助力國家通用語言文字普及攻堅等重點工程實施。
劉宏副司長講話(主辦方供圖)
此次新聞發(fā)布會由北京師范大學教授、文學院黨委書記康震主持。
活動中,劉宏、王寧、王立軍、康震共同啟動“漢字全息資源應用系統(tǒng)”,宣布該系統(tǒng)正式上線。這是語言文字工作者書寫教育“奮進之筆”、回應人民關(guān)切的重要實踐,有助于使語言文字發(fā)展的最新成果惠及更多領(lǐng)域和更廣大的人民群眾。
劉宏、王寧、王立軍、康震共同啟動“漢字全息資源應用系統(tǒng)”(主辦方供圖)
聯(lián)系客服