漢字的發(fā)展,是一個(gè)相形相生、孳乳分化的過(guò)程,是一個(gè)由少而多的過(guò)程。
我們已知:距今9000-5000年間是漢字的孕育期,出現(xiàn)了數(shù)百個(gè)原始字符。從5000-3500年(史傳倉(cāng)頡造字至殷墟甲文)是漢字的系統(tǒng)造作和成熟期,已發(fā)現(xiàn)的甲文單字?jǐn)?shù)量在四千左右(包括異體字)。從3500-2200年(西周至秦統(tǒng)一)是漢字應(yīng)用于大規(guī)模著述期,根據(jù)傳世先秦典籍統(tǒng)計(jì),不重復(fù)單字約八千余(包括異體字)。此時(shí)期的字書(shū)《史籀篇》、《倉(cāng)頡篇》、《博學(xué)篇》、《爰?xì)v篇》,各本收字?jǐn)?shù)量都是三千字左右。從公元前三世紀(jì)到公元后三世紀(jì)是漢字的孳乳分化期,許多原來(lái)屬于多義共享的文字,通過(guò)會(huì)意、形聲或會(huì)意兼形聲的方法,分化成數(shù)個(gè)有共同字源的專(zhuān)用字。這種情況雖然在漢代前后均有發(fā)生,但漢代更為集中。漢代以及稍后的字書(shū)收字情況:揚(yáng)雄《訓(xùn)纂編》(已佚)5340字;許慎《說(shuō)文解字》10,516字(字頭+重文);晉呂忱《字林》(公元514年,已佚)12,824字;南朝顧野王《玉篇》(公元534年,殘)16,917字。
經(jīng)過(guò)漢代前后的孳乳分化期,漢字基本處于穩(wěn)定狀態(tài),通用正字基本在六千左右。這里包括了孳乳字,但不包括異體字。前說(shuō)所謂孳乳字,雖從共同字源出發(fā),但其某些義項(xiàng)是有分別的。如夌字為重要字源,淩、凌、陵從其分化。三字大多數(shù)用義,同為逾越、凌駕、侵犯。如言凌辱,亦可用淩辱、陵辱;欺凌亦可用欺淩、欺陵。但淩作水名、地名,凌作冰凌字,陵作丘阜義,如言陵谷、陵寢等,則不可互替。所以這類(lèi)孳乳字應(yīng)按正字計(jì)入。還有些孳乳字,義項(xiàng)全部相通,則可以歸入異體字。如
四字音義同,皆為卓之孳乳字。卓本高人義,如言卓越。后累增足作踔、累增走作趠、累增辵作逴,會(huì)意仍為高也、越也,如言踔蹈、逴邁、趠越。凡能高者必由腳腿蹬踏,故從彳、從走、從辵、從足無(wú)別。所謂異體是指:與正字音義相同而字形稍異之字,古稱(chēng)別字、別寫(xiě)、重文。在先秦文字著述期產(chǎn)生了大量的異體字,主要原因有三:一是出版業(yè)尚未發(fā)達(dá),文本流傳常是輾轉(zhuǎn)抄錄、甚至口口相傳,衍生出種種異寫(xiě)、異體;二是敎學(xué)課本尚未普及,師生授受多為口授筆錄,衍生出種種異寫(xiě)、異體;三是地域不同,受地方用字習(xí)慣的影響。所以字書(shū)里通常儲(chǔ)存眾多的異體字。如《說(shuō)文》叫、噭、嘂、訆、譥、?六字,分在口、言、?、攴、欠五個(gè)部首下,實(shí)際同為一字。但其中四字并見(jiàn)于先秦經(jīng)傳,收于字書(shū)尚有實(shí)際意義。
后世字書(shū)收字越來(lái)越多,例如:
這些所謂字典,已經(jīng)不是傳統(tǒng)的字書(shū),而相當(dāng)于字形庫(kù)。傳統(tǒng)的字書(shū)是文字書(shū),而文字一是必須有獨(dú)立的音形義,以區(qū)別它字,否則為別字;二是必須合乎造字之理、合于六書(shū),否則為俗字;三是必須見(jiàn)諸于典籍,有普遍的跨時(shí)代的通用性,否則為生造字。如果不考慮文字的這些標(biāo)準(zhǔn),只要見(jiàn)過(guò)不同的字形便加以收錄,那就成了字形庫(kù)。設(shè)想如果收錄小學(xué)生語(yǔ)文作業(yè)本上的字形,可能超過(guò)千百萬(wàn),但這已脫離了文字的范疇。
漢以下至今,確實(shí)有一些新增字。按類(lèi)別說(shuō),一是名物字,如葡萄、苜蓿、箜篌、琉璃、咖啡、佛陀之陀、菩薩之薩等,這些是外來(lái)物品輸入中國(guó)時(shí)新增的名物字;二是元素字,如錳、鉻、鈉、氟、氮、氧、砷、砹、碲等,系清末以來(lái)從西方輸入的化學(xué)元素字。這兩類(lèi)新造文字?jǐn)?shù)量約數(shù)百,一般遵循了漢字的造字之理(多為形聲),對(duì)應(yīng)著新的客觀事物,承載了新的信息,基本可以視為正字。而新增的方言類(lèi)俗字,如粵語(yǔ)的冇、京話的甭、北音的孬等,這些不能視為正字。至于漢以下中國(guó)所經(jīng)歷的分裂期,如魏晉南北朝、五代十國(guó)、宋遼金夏等,社會(huì)的動(dòng)蕩和割據(jù)導(dǎo)致大量別字、俗字、異體字產(chǎn)生,這些不應(yīng)計(jì)入正字范圍。
所以,按上述標(biāo)準(zhǔn)計(jì)入新增字,漢字正字的總數(shù)量應(yīng)不超過(guò)八千。而歷代典籍用字的常規(guī)數(shù)量,則遠(yuǎn)遠(yuǎn)少于這個(gè)數(shù)目。先秦典籍總字?jǐn)?shù)約在一百五十萬(wàn),單字總量為八千余。其中僅有一次用例的約有兩千個(gè),兩次至四次的近兩千個(gè),這其中大部分是俗體、或體即異體字。以后歷代各類(lèi)著作所用不重復(fù)字?jǐn)?shù),也很少超過(guò)四千。思想深邃、道通天地的老子,其書(shū)所用單字只八百余;辯才無(wú)礙且擅美文的孟子,其書(shū)用字只一千八百余;才情恣肆、辭出滂沱的杜甫,其詩(shī)文集用字方才三千五百余;權(quán)高如秦相呂不韋,集當(dāng)朝群賢作大型文集《呂氏春秋》,用字才三千出頭;位高如淮南王劉安,傾一國(guó)美士所成文集《淮南子》,用字亦不過(guò)四千余。
由此可知,即便通讀古籍,識(shí)習(xí)正字?jǐn)?shù)量不至超過(guò)六千,其中常用字不到三千(占用字量99%)。寫(xiě)作需用正字,即便是專(zhuān)業(yè)作家,單品通常在一兩千字,畢生之作難逾三千。正確計(jì)算漢字的數(shù)量及個(gè)人用量,對(duì)于學(xué)生習(xí)字?jǐn)?shù)量的劃定,是有意義的?!墩f(shuō)文敎本》正課版敎?zhǔn)谡至?,課外版則為三千。實(shí)際學(xué)好三千正字,對(duì)99%的人已經(jīng)夠用,額外三千,是修養(yǎng)、見(jiàn)識(shí)。愚意一般文科可學(xué)三千,而理工科應(yīng)學(xué)六千。因?yàn)轭~外三千很多是名物字、是博物學(xué),通曉天地萬(wàn)物、器用造作,了解人類(lèi)原始概念創(chuàng)制,對(duì)將來(lái)科研事業(yè)有用。
以上六章簡(jiǎn)述了文字之源流,中國(guó)在幾千年的不同歷史階段上,對(duì)漢字有著不同的認(rèn)識(shí)、不同的描述、不同的定義,古人曾自豪過(guò)、近人曾沮喪過(guò)、今人則往往各執(zhí)一詞,或判然分立、或游移兩端。在歷史此刻的節(jié)點(diǎn)上,我們有條件檢視古今、比對(duì)各國(guó),對(duì)漢字進(jìn)行更深入的研究。其后我們將推出《文字屬性》專(zhuān)題系列文章,以饗讀者。
《文字屬性》專(zhuān)題之一:文字與語(yǔ)言
《文字屬性》專(zhuān)題之二:文字與語(yǔ)符
《文字屬性》專(zhuān)題之三:文字與世界
《文字屬性》專(zhuān)題之四:文字之洗練
《文字屬性》專(zhuān)題之五:文字之效用
聯(lián)系客服