新華社近日公布了最新的統(tǒng)計(jì)信息,目前漢字的總數(shù)已經(jīng)超過了8萬(wàn),而常用的只有3500字.雖然常用字的數(shù)量沒有多少變化,而字庫(kù)總量卻變大了,這是為什麼呢?
中國(guó)漢字總量是多少,大家沒有一個(gè)統(tǒng)一的說法.有「總匯漢字之大成」評(píng)價(jià)的《康熙字典》,在書后附有《補(bǔ)遺》,「盡收冷僻字,再附《備考》,又有音無義或音義全無之字」,收錄的漢字是4萬(wàn)多個(gè).1994年出版的《中華字?!肥杖肓?7019個(gè)漢字,而已經(jīng)通過專家鑒定的北京國(guó)安咨詢?cè)O(shè)備公司的漢字字庫(kù),收入有出處的漢字91251個(gè),據(jù)稱是目前全國(guó)最全的字庫(kù).與龐大的漢字庫(kù)形成鮮明對(duì)照的是,歷代日常書面語(yǔ)常用的不同的漢字?jǐn)?shù)量一般都控制在三四千個(gè).數(shù)量上并沒有超過最初的文字甲骨文.國(guó)家在1988年公布的《現(xiàn)代漢語(yǔ)常用字表》選收了2500個(gè)常用字、1000個(gè)次常用字,總共只有3500字.
國(guó)家語(yǔ)言文字工作委員會(huì)語(yǔ)言文字應(yīng)用研究所前副所長(zhǎng)紀(jì)恒銓認(rèn)為,一個(gè)國(guó)家的文字總量有增有減,但基本字的數(shù)量則比較固定.漢字有很多,可以分做很多層面.中國(guó)常用漢字有2500多個(gè),只要掌握了它們,就可以熟練閱讀現(xiàn)代漢語(yǔ)書面語(yǔ)了.《毛澤東選集》5卷本,使用的不同漢字也不超過2000多個(gè).小學(xué)語(yǔ)文大綱規(guī)定學(xué)生應(yīng)該認(rèn)識(shí)3000個(gè)漢字,如果掌握了1800多個(gè)漢字,也就可以脫盲了.
紀(jì)恒銓說,文字是歷史文化的載體,傳達(dá)著一定的信息,不同社會(huì)階段文字適用特點(diǎn)也不同.隨著社會(huì)發(fā)展,一些文字就被逐漸淘汰了.從現(xiàn)代漢語(yǔ)角度,人們傳情達(dá)意需要更簡(jiǎn)便的方式,「4萬(wàn)甚至9萬(wàn)多漢字,恐怕許多人一輩子也記不完.漢字中的生僻字很多,即使自己記住了,如果交流時(shí)對(duì)方不懂,還是沒用」.許多生僻字就是這樣逐漸被淘汰出常用字.
隨著社會(huì)的發(fā)展,為了表現(xiàn)新的事物,語(yǔ)言也在發(fā)展,9萬(wàn)漢字的背后是社會(huì)生活的不斷進(jìn)步,由於中國(guó)文字積淀的歷史長(zhǎng),這些字就構(gòu)成了漢字庫(kù)的主體,主要體現(xiàn)在包括國(guó)家編撰的《說文解字》、《康熙字典》、《漢語(yǔ)大字典》、《中華字?!返氖兆稚?在語(yǔ)言文字本身的發(fā)展過程中,不可避免地還出現(xiàn)了大批的異體字和不規(guī)范字,就像孔乙己曾經(jīng)堅(jiān)持「茴」字有四種寫法一樣,漢字中的異體字是漢字家族日益壯大的一個(gè)重要原因.在50年代,國(guó)家曾經(jīng)做過一個(gè)異體字整理表,然而工作還未結(jié)束,隨著漢語(yǔ)拼音化方案的提出,這項(xiàng)工作沒有進(jìn)行到底.中國(guó)社會(huì)科學(xué)院研究生院語(yǔ)言系教授晁繼周先生這樣解釋.
據(jù)中國(guó)社會(huì)科學(xué)院語(yǔ)言研究所研究員、參與了《新華字典》和《現(xiàn)代漢語(yǔ)詞典》編纂工作的劉慶隆先生介紹,做這樣一個(gè)大的字庫(kù)收集整理工作,不但備查備用,還可供國(guó)內(nèi)兩岸四地及國(guó)外進(jìn)行漢字文本印刷、古籍整理和研究適用,而且為人名名錄及證件制作、中國(guó)地圖地名標(biāo)注提供了水平很高的字庫(kù)工具.90年代初,國(guó)家制作過一個(gè)包含20902個(gè)字的國(guó)家標(biāo)準(zhǔn)字庫(kù)表,但在使用過程中發(fā)現(xiàn)這個(gè)字表還遠(yuǎn)遠(yuǎn)不夠使用,目前補(bǔ)充工作還在開展中.
整理漢字庫(kù)的原因,劉慶隆認(rèn)為一是適應(yīng)國(guó)際上要求建立國(guó)際字標(biāo)的需要,做成一個(gè)國(guó)際通用的字庫(kù)以方便國(guó)際文字的交流,目前國(guó)際ISO國(guó)標(biāo)委員會(huì)正在收集各國(guó)文字;二是適應(yīng)計(jì)算機(jī)輸入法的發(fā)展、擴(kuò)大計(jì)算機(jī)字庫(kù)的需要.目前信息產(chǎn)業(yè)部的計(jì)算機(jī)標(biāo)準(zhǔn)化研究所也正在進(jìn)行漢字字庫(kù)的統(tǒng)計(jì)整理工作,已經(jīng)整理出來近7萬(wàn)字;第三,漢字發(fā)展過程中的字體變形使得一些字看起來已經(jīng)不像漢字,需要整理以便統(tǒng)一.
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。