漢字有橫、豎、撇、捺、點、提、鉤、折八種筆畫。如果我們將點歸為捺,將提歸為橫,將鉤歸為折,漢字也有橫、豎、撇、捺、折五種筆畫。所有的漢字都是由筆畫組成的,無論是語文教學(xué)、文獻(xiàn)檢索,還是漢字編碼,都是建立在漢字筆畫的基礎(chǔ)上。漢字筆畫被定義為構(gòu)成漢字字形的最小單位。這一說法沿襲至今,沒有人對此產(chǎn)生過懷疑。幾乎所有的漢字編碼方案都是建立在漢字筆畫基礎(chǔ)上的。 經(jīng)過科學(xué)探索,我們發(fā)現(xiàn)了漢字結(jié)構(gòu)的內(nèi)在規(guī)律性:橫、豎、撇、捺的形態(tài)單一,不可再分解了,它們才是漢字字形基因。而折筆卻不是,雖然折筆的形態(tài)各異、種類繁多,只要仔細(xì)分析一下就會發(fā)現(xiàn),這些折筆無非是由橫、豎、撇、捺構(gòu)成的。
橫 豎 撇 捺
以橫、豎、撇、捺這四種漢字字形基因作為漢字的構(gòu)造基礎(chǔ),這是漢字?jǐn)?shù)碼的獨特之處。從此,漢字?jǐn)?shù)碼研究走上了一條不同于其它任何漢字編碼的道路。這是一條通往漢字?jǐn)?shù)字化的成功之路。
別小看了漢字字形基因與漢字筆畫的細(xì)微差別,它帶給漢字文化的將是翻天覆地的變化??梢哉f,漢字字形基因的發(fā)現(xiàn),揭示了漢字字形結(jié)構(gòu)的內(nèi)在規(guī)律性,這是人類對漢字字形認(rèn)識又一次升華的結(jié)晶,在漢字語言學(xué)領(lǐng)域具有里程碑意義。
二.漢字字形基因組合
很顯然,兩個漢字字形基因構(gòu)成了最簡單的漢字字形基因組合。只要我們仔細(xì)分析一下就不難發(fā)現(xiàn),漢字字形是通過以下兩種方式來構(gòu)成漢字字形基因組合的。
1.緊密型組合方式
由不脫筆書寫的兩個漢字字形基因構(gòu)成了折筆。
雖然折筆被視為是由橫、豎、撇、捺組合而成的,但是,作為漢字筆畫的折筆,是不能隨意被分割開的。由于這種不可分割性,緊密型組合方式當(dāng)然也包括了由多個漢字字形基因所構(gòu)成的折筆。
2.松散型組合方式
由脫筆書寫的兩個漢字字形基因構(gòu)成了兩畫筆形。
橫橫 橫豎 橫撇 橫捺
橫橫 橫豎 橫撇 橫捺
豎橫 豎豎 豎撇 豎捺
撇橫 撇豎 撇撇 撇捺
捺橫 捺豎 捺撇 捺捺
↓ ↓ ↓ ↓
兩畫橫 兩畫豎 兩畫撇 兩畫捺
雖然折筆是由若干個漢字字形基因所構(gòu)成的,由于是不脫筆書寫而成的,所以,它與漢字字形基因一起,都屬于一畫筆形。
三.基因組合歸類
無論是折筆,還是兩畫筆形,我們都只看它們的最后形狀,而不管它們前面的形狀如何。通過這種方式,我們就將折筆和兩畫筆形統(tǒng)統(tǒng)歸為人人一看都會的橫、豎、撇、捺了。
1.鉤筆歸類
鉤的尾部只是用毛筆書寫漢字時留下的痕跡,我們在對鉤歸類時,對鉤的尾部可以完全忽略不計。國家語言文字規(guī)范將豎鉤歸為了豎,就是這個道理。但是,國家語言文字規(guī)范并沒有將這一原則貫徹到底,而是將橫鉤、撇鉤、捺鉤(斜鉤)歸為了折。
漢字?jǐn)?shù)碼認(rèn)為,既然國家語言文字規(guī)范將豎鉤歸為了豎,那么,按照同一原理,橫鉤就應(yīng)歸為橫,撇鉤就應(yīng)歸為撇,捺鉤就應(yīng)歸為捺。
橫加鉤,稱為橫鉤,歸為橫,形狀為 ;
豎加鉤,稱為豎鉤,歸為豎,形狀為 ;
撇加鉤,稱為撇鉤,歸為撇,形狀為 ;
捺加鉤,稱為捺鉤,歸為捺,形狀為 。
2.折筆歸類
折的首筆缺少了捺,而尾筆的形態(tài)就非常完整,使得橫、豎、撇、捺在末筆上的分布更加均勻。因此,漢字?jǐn)?shù)碼采用尾筆作為折的分類標(biāo)準(zhǔn)。這樣一來,折的尾筆是什么,就歸為什么。
以橫結(jié)尾的折,稱為折橫,歸為橫,如 ;
以豎結(jié)尾的折,稱為折豎,歸為豎,如 ;
以撇結(jié)尾的折,稱為折撇,歸為撇,如 ;
以捺結(jié)尾的折,稱為折捺,歸為捺,如 。
四.歸類標(biāo)準(zhǔn)
無論是五筆字型,還是兩筆字型,它們都是根據(jù)構(gòu)成漢字字根中的兩個筆畫來決定其編碼的。除了五種漢字筆畫外,還有二十五種由筆畫組合而成的字根。
漢字?jǐn)?shù)碼只根據(jù)兩畫筆形中的一個筆畫來決定其編碼,這樣就將五筆字型或者兩筆字型中的若干個編碼歸為了一個編碼。這樣做,既大大減少了碼元數(shù),使之適合于數(shù)字編碼的要求,同時又大大減輕了用戶的編碼負(fù)擔(dān)。
五.小結(jié)
將漢字筆畫從橫、豎、撇、捺、折五種簡化為橫、豎、撇、捺四種,將眾多的漢字字根簡化為較少的兩畫筆形,又將兩畫筆形進(jìn)一步簡化為橫、豎、撇、捺。這樣一來,我們就將最復(fù)雜的漢字字根簡化為最簡單的橫、豎、撇、捺。
一.編碼困局
1.以漢字筆畫為單位來給漢字編碼
五個漢字筆畫對應(yīng)五個數(shù)字,另外五個數(shù)字閑置不用,本來就十分稀缺的數(shù)字資源,竟有一半被白白浪費掉了。這樣的漢字編碼規(guī)則很難說是科學(xué)的、合理的。
有人將折筆分得很細(xì),使十個數(shù)字都對應(yīng)有漢字筆畫,這樣的方案設(shè)計更不可取。因為橫、豎、撇、捺承擔(dān)了90%的漢字編碼,而各種折筆承擔(dān)不足10%的漢字編碼。相反,由于折筆劃分得太細(xì),陡然增加了人們的記憶負(fù)擔(dān)。
2.以漢字字根為單位來給漢字編碼
據(jù)統(tǒng)計,漢字字根有一千多個,常見漢字字根也有好幾百個。以漢字部件作為漢字筆形,每個數(shù)字需要對應(yīng)十幾個乃至幾十個字根,難以建立起這些字根與數(shù)字之間的有規(guī)則、可記憶的對應(yīng)關(guān)系。所以,五筆字型、自然碼等一大批優(yōu)秀的漢字編碼無法移植到數(shù)字編碼上來。
3.以漢字筆形為單位來給漢字編碼
漢字筆畫的最簡組合方式是兩個筆畫,介于漢字筆畫和漢字字根之間,以其作為漢字?jǐn)?shù)字編碼的基礎(chǔ)依據(jù),具有客觀必然性。
以其中兩個筆畫作為分類依據(jù),構(gòu)成了25種兩畫筆形和5種單個筆畫。而以其中一個筆畫作為分類依據(jù),構(gòu)成了5種兩畫筆形和5種單個筆畫,然而,其中單個筆畫僅出現(xiàn)在筆畫數(shù)為奇數(shù)的漢字末尾,數(shù)量很少,基本上是形同虛設(shè)。
二.破解困局
折筆本來就是組合筆形,所以,它不再與其他筆畫進(jìn)行組合。當(dāng)它單獨作為漢字筆形時,不僅它本身是單個筆畫,還分割出了眾多的單個筆畫。折筆可以處于漢字任意位置,由其分割而成的單個筆畫同樣處于漢字任意位置。
漢字?jǐn)?shù)碼還將折歸為了橫、豎、撇、捺。這樣一來,不僅增加了單個橫、豎、撇、捺的數(shù)量,使其更加接近兩畫筆形的數(shù)量,而且也使單個橫、豎、撇、捺的數(shù)量大體相當(dāng)。均勻分布的漢字筆形轉(zhuǎn)換為漢字?jǐn)?shù)碼后,得以實現(xiàn)有規(guī)則、無重碼和高效率。
一.九個漢字筆形
漢字筆形劃分為一畫筆形與兩畫筆形兩類,以最后一個漢字字形基因作為客觀依據(jù)來歸類漢字筆形時,每類又劃分為橫、豎、撇、捺四種,通過這種巧妙方式,構(gòu)造出了八種漢字筆形,加入組字頻率最高的三個筆畫構(gòu)成的“口”,共有九個漢字筆形。
二.漢字?jǐn)?shù)碼矩陣
由此構(gòu)造出了漢字?jǐn)?shù)碼矩陣模型:
漢字筆形構(gòu)成極具規(guī)律性,沒有任何例外規(guī)定,只需理解定義,無需死記硬背。由于不存在方言的干撓,只要會寫漢字的人都能學(xué)會。漢字筆形既不是憑空想像出來的,也不是隨意拼湊出來的,而是通過了大量字形分解、邏輯分析和理論證明才發(fā)現(xiàn)的,因而是科學(xué)的、唯一的和有規(guī)律的。
漢字筆形的發(fā)明結(jié)束了漢字編碼萬“碼”奔騰的局面,使?jié)h字走出了編碼時代跨入了字母時代。漢語拼音字母是借助西方字母來給漢字注音,只是漢字的一種外在表現(xiàn)形式。漢字筆形才構(gòu)成了漢字本身,是中華民族自己的創(chuàng)造,表現(xiàn)出了漢字的豐富內(nèi)涵。同音不同形的漢字特征使得漢字筆形較之漢語拼音字更易學(xué)、更好用??梢灶A(yù)見,隨著數(shù)字時代的到來,人們將越來越青睞于學(xué)習(xí)和使用漢字筆形。
三.漢字?jǐn)?shù)碼規(guī)則
1.筆畫歸類
2.取碼規(guī)則
① 鉤筆和折筆歸為橫、豎、撇、捺單獨取,其中:鉤筆不看鉤、折筆看最后。
② 前后兩個單筆(橫、豎、撇、捺)取第二筆,只有一個單筆單獨取。
③ 口整體取。
將上述規(guī)則編為順口溜:“橫豎撇捺取兩筆,折筆和口取整體;鉤筆單取鉤不計,不看首筆看末筆?!?nbsp;
一.漢字筆形
數(shù) 碼 5 6 7 8 9
名 稱 兩畫橫 兩畫豎 兩畫撇 兩畫捺 三畫口
二.一畫筆形
一畫橫:以橫(提)結(jié)尾的單個筆畫,包括橫(提)、橫鉤和折橫
一畫豎:以豎結(jié)尾的單個筆畫,包括豎、豎鉤、折豎
一畫撇:以撇結(jié)尾的單個筆畫,包括撇、撇鉤、折撇
一畫捺:以捺(點)結(jié)尾的單個筆畫,包括捺(點)、捺鉤、折捺
說明:
① 捺分為斜捺 和彎捺 (“四”第四筆)。
② 點有捺點丶、撇點 (“心”第一筆)和橫點 (雨字頭的四點)。
③ 鉤有橫鉤 、豎鉤 、撇鉤 和捺鉤 四種。
④ 折有橫折、豎折、撇折和捺折四種
折橫:以橫(提)結(jié)尾的折筆,包括:
折豎:以豎(豎鉤)結(jié)尾的折筆,包括:
折撇:以撇(撇鉤)結(jié)尾的折筆,包括:
折捺:以捺(點、捺鉤)結(jié)尾的折筆,包括:
三.兩畫筆形
兩畫橫:第二畫是橫(提)的兩個筆畫,包括橫橫、豎橫、撇橫、捺橫
兩畫豎:第二畫是豎的兩個筆畫,包括橫豎、豎豎、撇豎、捺豎
兩畫撇:第二畫是撇的兩個筆畫,包括橫撇、豎撇、撇撇、捺撇
兩畫捺:第二畫是捺(點)的兩個筆畫,包括橫捺、豎捺、撇捺、捺捺
說明:
鉤筆和折筆不構(gòu)成兩畫筆形,單獨作為一畫筆形。
四.三畫筆形
三畫口:以豎、折、橫構(gòu)成的方框,包括口、囗
說明:
三畫口整體取作筆形,不許拆分。
漢語拼音使用拉丁字母來表示漢字讀音,是漢字拉丁化的杰出代表;漢字?jǐn)?shù)碼使用阿拉伯?dāng)?shù)字來表示漢字字形,是漢字?jǐn)?shù)字化的核心技術(shù)。
一.漢字?jǐn)?shù)碼和漢語拼音都是漢字字形的輔助表現(xiàn)形式
漢字?jǐn)?shù)碼、漢語拼音與漢字字形、漢字字義處在不同的層次上。所以,將漢語拼音與漢字字形相提并論的說法以及用漢語拼音取代漢字字形的做法,違反了唯物辯證法關(guān)于內(nèi)容決定形式、形式反映內(nèi)容的基本原理,在理論上是反科學(xué)的,在實踐中也是有害的。
漢字是多維的、多元的,漢字本身隱含著許多東西。無論是拼音字母,還是拼形字母,或是漢字筆形,它們都是從漢字之中抽象概括提煉出來的。而漢字創(chuàng)造的妙就妙在它的模糊性、不確定性和包容性,這是漢字發(fā)揮威力的基礎(chǔ)。沒有足夠的想象發(fā)展空間,而將人類語言只局限在枯燥的拼音符號層面,那么未來世界文化將很難實現(xiàn)真正的多元化,生活的色彩會是多么的單調(diào)。
二.漢字?jǐn)?shù)碼和漢語拼音都是處理中文信息的必備工具
漢語拼音是推廣普通話的重要工具,漢字?jǐn)?shù)碼則是推行規(guī)范漢字的重要工具。知道了漢字讀音可以使用漢語拼音,知道了漢字字形可以使用漢字?jǐn)?shù)碼,兩種工具相輔相成、缺一不可。只要掌握這兩種工具,人們處理漢字信息就沒有任何障礙了。因此,漢字?jǐn)?shù)碼具有與漢語拼音同等重要的地位,這就決定了漢字?jǐn)?shù)碼方案與漢語拼音方案一并成為國家語言文字規(guī)范。
在現(xiàn)實生活中,漢字書寫存在著很多問題。各種不良書寫習(xí)慣在社會上傳播蔓延,交叉感染,不僅嚴(yán)重影響了漢字的交際功能,而且極大地阻礙了中文信息技術(shù)的發(fā)展和普及。由于缺乏必要的手段,國家對這些現(xiàn)象只能聽之任之。漢字?jǐn)?shù)碼提供了推廣規(guī)范漢字的一個重要技術(shù)手段。因為漢字?jǐn)?shù)碼本身就是一種規(guī)范的編碼方法,它要求人們必須掌握規(guī)范的漢字字形、規(guī)范的漢字筆順和規(guī)范的漢字筆畫,幾乎包含了規(guī)范漢字的全部內(nèi)容。
三.漢字?jǐn)?shù)碼對國家語言文字規(guī)范的完善
1.漢字筆畫不宜被定義為構(gòu)成漢字字形的最小單位
從邏輯上講,最小單位就是不能再分解了。在漢字筆畫中,橫、豎、撇、捺、點、提不能再分解,它們是構(gòu)成漢字字形的最小單位。然而,折筆和鉤筆是可以分解的,它們是由橫、豎、撇、捺、點、提所構(gòu)成。因此,構(gòu)成漢字字形的最小單位不是橫、豎、撇、捺、折這五種漢字筆畫,而是橫、豎、撇、捺這四種漢字字形基因。
2.鉤筆應(yīng)歸類為橫鉤、豎鉤、撇鉤和捺鉤
現(xiàn)行國家語言文字規(guī)范將豎鉤定義為豎筆,而將其他鉤筆定義為折筆,這是不符合邏輯的。既然將豎鉤定義為豎筆,那么,就應(yīng)當(dāng)將橫鉤定義為橫筆,這樣才符合邏輯。按照邏輯推理,既然有橫鉤和豎鉤,就必然有撇鉤和捺鉤?,F(xiàn)行國家語言文字規(guī)范將撇鉤命名為彎鉤,將捺鉤命名為斜鉤,這是不科學(xué)的。
3.撇點應(yīng)歸類為撇筆,橫點應(yīng)歸類為橫筆
現(xiàn)行國家語言文字規(guī)范將撇點和橫點歸類為點筆,這種歸類具有合理性,卻存在著以下弊端:一是無法統(tǒng)一漢字筆畫定義。當(dāng)按照起筆位置和書寫方向來定義橫、豎、撇、捺時,我們發(fā)現(xiàn)只有撇點和橫點是個例外;二是人們習(xí)慣于將撇點當(dāng)作撇筆,將橫點當(dāng)作橫筆。
4.筆畫的書寫順序應(yīng)當(dāng)統(tǒng)一
我們發(fā)現(xiàn),“樊”字上部左右排列的三個漢字部件是按照從左到右的順序書寫的,而“兜”字上部左右排列的三個漢字部件卻是按照從中間向兩邊的順序書寫的,這不符合漢字筆順規(guī)則,容易造成混亂。類似的例子還可舉出很多。
四.在學(xué)校教育中普及推廣漢字?jǐn)?shù)碼
1.漢字?jǐn)?shù)碼完全符合國家語言文字規(guī)范
從筆畫、筆形到規(guī)則,沒有附加任何新名詞或者新規(guī)定,沒有隨意將漢字拆得七零八落,與學(xué)校的漢字教育內(nèi)容完全吻合。漢字?jǐn)?shù)碼發(fā)現(xiàn)了漢字字形基因只有橫、豎、撇、捺,一舉沖破了以漢字筆畫作為漢字教育基礎(chǔ)的傳統(tǒng)做法,語文教育應(yīng)該從漢字字形基因開始,這樣才能反映出漢字字形結(jié)構(gòu)的內(nèi)在規(guī)律性。
2.將漢字?jǐn)?shù)碼納入學(xué)校教育,有利于推廣規(guī)范漢字
漢字?jǐn)?shù)碼是嚴(yán)格按照漢字筆畫順序來提取筆形的,對漢字的每個筆形變化都會靈敏、準(zhǔn)確地反映出來。學(xué)生要掌握漢字?jǐn)?shù)碼方法,就必須掌握漢字正確的筆畫順序和書寫方法。在使用漢字?jǐn)?shù)碼的過程中,學(xué)生潛移默化地接受漢字?jǐn)?shù)碼引導(dǎo)和強制,在自覺和不自覺的過程中接受了規(guī)范漢字。
3.將漢字?jǐn)?shù)碼納入學(xué)校教育,有利于漢字應(yīng)知應(yīng)會。
漢字是字形、字音、字義、字序、字碼等的綜合體。目前的語文教學(xué)比較側(cè)重于漢字的字音和字義,在利用漢字字形來認(rèn)知和處理漢字信息等方面則缺乏相應(yīng)的手段。漢字?jǐn)?shù)碼恰好提供了這樣一種手段,使得學(xué)生能夠十分方便、快捷地利用漢字字形來處理漢字信息。
4.將漢字?jǐn)?shù)碼納入學(xué)校教育,有利于實現(xiàn)課業(yè)電子化
要實現(xiàn)教師教案、學(xué)生作業(yè)的電子化,首先必須解決漢字信息輸入問題。漢字?jǐn)?shù)碼為教師、學(xué)生提供了這樣一個理想的漢字輸入工具。漢字?jǐn)?shù)碼只用幾個數(shù)字鍵,這樣課業(yè)的電子文檔器可以做得很小,與課本差不多大小,還可以放在衣兜里。漢字?jǐn)?shù)碼輸入速度是一流的,一旦熟練掌握后,可以達(dá)到記錄速度,這樣就可以使教師備課、學(xué)生作業(yè)的進(jìn)度較手工操作產(chǎn)生質(zhì)的飛躍。
一.知識產(chǎn)權(quán)簡介
1.《漢字?jǐn)?shù)字化輸入法》發(fā)明專利
2005年12月21日,中華人民共和國知識產(chǎn)權(quán)局向鐘林先生頒發(fā)了《漢字?jǐn)?shù)字化輸入法》發(fā)明專利證書,專利號是ZL03155247.1。
2.《漢字?jǐn)?shù)碼輸入軟件》著作權(quán)登記
2003年11月12日,中華人民共和國國家版權(quán)局向成都漢智數(shù)碼技術(shù)有限公司頒發(fā)了《計算機(jī)軟件著作權(quán)登記證書》,軟件名稱是“漢字?jǐn)?shù)碼輸入軟件(簡稱漢字?jǐn)?shù)碼)”,登記號是2003SR11674。
二.知識產(chǎn)權(quán)說明
1.漢字?jǐn)?shù)碼是一種漢字編碼方法,只能申請國家發(fā)明專利。由于漢字編碼方法本身屬于一種信息表述方法,就信息表述方法本身或者漢字編碼方法本身而言,同聲音信號、語言信號、可視顯示信號或者交通指示信號等各種信息表述方式一樣,只取決于人的主觀意念或者人為的規(guī)定,因此,漢字編碼方法本身屬于一種智力活動的規(guī)則,不是技術(shù)方案。發(fā)明專利申請主題僅僅涉及漢字編碼方法的發(fā)明專利申請不屬于可給予專利保護(hù)的客體,其本身不能被授予專利權(quán)。
但是,如果把漢字編碼方法與該編碼方法所使用的特定鍵盤相結(jié)合而作為計算機(jī)系統(tǒng)處理漢字的一種計算機(jī)漢字輸入方法或者計算機(jī)漢字信息處理方法,使原來不能運行中文漢字的計算機(jī)系統(tǒng)能夠以漢字信息為指令,產(chǎn)生出若干新的功能,以至能實現(xiàn)生產(chǎn)過程的自動化控制或者辦公系統(tǒng)的自動化管理,那么,這種計算機(jī)漢字輸入方法或者計算機(jī)漢字信息處理方法就屬于可給予專利保護(hù)的客體。
2.漢字?jǐn)?shù)碼是作為輸入法來申請專利保護(hù)的。但是,它們并不等同于鍵盤輸入法。
第一,漢字輸入除了鍵盤輸入這個狹義概念外,還有人機(jī)對話這個廣義概念。
第二,正如國家知識產(chǎn)權(quán)局《漢字?jǐn)?shù)碼輸入法審查意見》所述的那樣,筆形與鍵位的具體對應(yīng)關(guān)系是人為規(guī)定的,屬于非技術(shù)性特征。雖然輸入規(guī)則屬于技術(shù)性特征,卻非本質(zhì)的技術(shù)性特征,只有漢字筆形的構(gòu)成方式及其分類方法才是本發(fā)明最本質(zhì)的技術(shù)特征。
第三,以漢字?jǐn)?shù)碼最本質(zhì)的技術(shù)特征為基礎(chǔ),產(chǎn)生出了一攬子中文信息處理方法,它解決了漢字輸入、中文加密、電腦編程、人機(jī)界面、語音控制、人工智能等一系列關(guān)鍵信息領(lǐng)域的難題。這些都將申請國家發(fā)明專利的保護(hù),從而形成漢字?jǐn)?shù)碼系列發(fā)明專利。