第一類:拼音文字?jǐn)?shù)字化
在拼音文字中,每個(gè)單詞的字母構(gòu)成都不相同??墒?,當(dāng)它們被數(shù)字化后,就會(huì)出現(xiàn)許多相同的數(shù)碼。這是因?yàn)椋瑤资畟€(gè)字母分布在十個(gè)數(shù)字上,每個(gè)數(shù)字要承載好幾個(gè)字母。這樣一來,單詞與數(shù)碼之間的對應(yīng)關(guān)系就不存在唯一性了。
為了減少重碼現(xiàn)象,拼音文字的字母在數(shù)字上的分布,除了保持其自然順序、便于記憶外,要盡可能地均勻。
我們采取了兩種方式,使拼音文字?jǐn)?shù)碼具有了唯一性:
一是采用簡碼,即只取單詞的前幾個(gè)數(shù)碼。絕大部分單詞都取簡碼時(shí),使拼音文字?jǐn)?shù)碼變短,還有利于提高拼音文字的處理效率。
二是采用補(bǔ)碼,即增加或者補(bǔ)充一些數(shù)碼。只是針對那些構(gòu)成字母少的單詞。通常是增加或者補(bǔ)充最后那個(gè)數(shù)碼。
第二類:漢字?jǐn)?shù)字化
1、設(shè)計(jì)漢字字母體系
為避免與漢語拼音字母相混淆,我們使用了漢字筆形來代替漢字字母。
第一,漢字筆形不能只包括漢字筆畫
五種漢字筆畫對應(yīng)五個(gè)數(shù)字,另外五個(gè)數(shù)字閑置不用,本來就十分稀缺的數(shù)字資源,竟有一半被白白浪費(fèi)掉了。這樣的方案設(shè)計(jì)很難說是科學(xué)的、合理的
聯(lián)系客服