“對稱碼輸入法”被稱為形碼的最高境界。 |
早期的中文鉛字打字機十分復雜。 |
長期使用拼音輸入法容易提筆忘字。 |
多少年來,打字一直是長篇文字最清晰、最整潔、最快速的錄入方式,而使用鍵盤上26個英文字母按鍵,敲擊出數(shù)萬個繁復美麗的漢字,幾代華人進行了不懈的努力。難怪有外媒驚呼:計算機的發(fā)明將中國龐大的漢字目錄轉化為一項優(yōu)勢,中國打字技術的先進程度遠超西方。
1.早期中文打字操作難
漢字是世界上最美麗的文字之一,漢字的數(shù)量多得驚人,從炎黃時期至今上下5000年,古代每個朝代都會造出新字,最著名的如武則天造的“曌”字。
究竟?jié)h字有多少個呢?清代《康熙字典》有47000多字;1915年歐陽博存等編撰的《中華大字典》有48000多字;1959年日本諸橋轍次編撰的《大漢和辭典》收字49964個;1971年張其昀主編的《中文大辭典》,有49888字;當代的《漢語大字典》(2010年版)收字60370個;1994年中華書局、中國友誼出版公司出版的《中華字?!肥兆?5568個;我國臺灣地區(qū)教育主管機關編撰的《異體字字典》第五版,內容含正字與異體字,共106230字,是收錄最多漢字的字典。
應該說,漢字的數(shù)量并沒有準確數(shù)字,大約將近十萬個,北京國安咨訊設備公司漢字字庫收入有出處漢字91251個。漢語難學、難寫在世界上是出了名的,不過如果真的需要我們掌握這么多漢字,那難度實在是太大了,好在我們日常所使用的漢字只有幾千個。有人做過這樣的統(tǒng)計,大約1000個常用字能覆蓋約92%的書面資料,2000字可覆蓋98%以上,3000字則已到99%。
即使是經(jīng)常使用的只有幾千字,中文打字也是一件不容易的事。1915年,山東留美學生祁暄發(fā)明的中文打字機獲專利。此前,他將自己發(fā)明的打字機說明報請留美學生經(jīng)理員轉詳教育部,請予轉咨農商部。農商部以祁暄所制打字機器運用靈便,構造完備,所印字跡尚鮮明,特準按照暫行工藝品獎章給予專利5年,以示鼓勵。
這個中文打字機是什么模樣呢?一個約A2紙大小的盤上,排滿了鉛字,鉛字的排列次序跟報館的習慣一樣,按部首畫數(shù)排列。打字員首先要在鉛字盤上用一個小鉗把鉛字鉗起,再按一鍵時,小鉗就會舉起鉛字,隔著色帶印在紙上,當打完一行按回車鍵之后,又會自動卷回頁首,并跳往下一行。這臺中文打字機的工作原理和英文打字機基本一樣,而且能夠配合當時中國人書寫習慣,允許文字打直排。由于中文打字機的操作并不容易,撿字也很困難,因此在上世紀60年代的香港,只有比較富裕的學校,才有能力負擔一名能操作中文打字機的打字員。
除了手動式的中文打字機,還有電子中文打字機。一般印刷公司都是用電子中文打字機,其撿字方式變成了用電子筆在一個超大鍵盤上按鍵,每個按鍵代表一個中文字。字型是記錄在一張微型的底片上,再利用光學技術投射在一張俗稱“咪紙”的感光紙上。早期的電子打字機是由日本發(fā)明生產(chǎn)的,所以其中的鉛字是按日語發(fā)音來排列,后期亦有按筆劃排的,但字型大多數(shù)亦是日體漢字。
2.現(xiàn)代輸入法音碼率先誕生
英文輸入法可以說是伴隨著個人計算機和文字處理軟件一同出現(xiàn)的,10個手指敲擊鍵盤,26個英文字母自然躍然屏上,打字原理基本和英文機械打字機一樣。但在小小的電腦鍵盤上,使用26個字母按鍵輸入浩如煙海的漢字,可就沒那么容易了。
從漢字的邏輯構造上看,漢字不能像英文那樣被分成少量的元素單位,從而不能進行以文字構造為基本單位的分類歸放、處理等。雖然漢字可以分成不同的部首、偏旁等文字基本構件,但是被分成的基本構件數(shù)量過多并且基本構件在組成漢字時的位置、方位、朝向,都將決定漢字的構成,這就大大限制了漢字直接以本身的構造來進行快速錄入。
由于漢字有數(shù)以萬計,電腦鍵盤不可能為每一個漢字而造一個按鍵。因此,人們需要替漢字編碼,通過敲擊多個按鍵來輸入一個漢字。最早的漢字輸入法,一般認為是從上世紀70年代末80年代初期開始的,最先出現(xiàn)的是拼音輸入法。
漢字為什么會有拼音呢?我國古代漢字讀音大多采用“兩字相切”的讀音方法,如“東”(都籠切)。這個方法顯然太繁瑣,不易讀準。公元1610年,法國有個叫金尼格萊的傳教士來到中國,在中國日子長了他就成了中國通。西方人該怎么比較容易地讀出漢字呢?1626年金尼格萊寫了一本書《西中儒耳目資》,在這本書中,他首次準確地用拉丁拼音字母記錄了漢字的讀音。金尼格萊在中國期間結識了學者韓云、王征等人,并在他們的幫助下,在利瑪竇等傳教士漢語注音的《西字奇跡》基礎上,編寫了中國第一部拉丁化拼音字匯。
漢語拼音在中國大陸使用范圍十分廣泛。海外華人地區(qū),特別是華語地區(qū)如菲律賓、馬來西亞和新加坡等,目前也在漢語教育中進行漢語拼音教學。1955年,語言文字學家周有光提出普及普通話的兩項標準:全國漢族學校以普通話為校園語言,全國公共活動以普通話為交際媒介,并提出漢語拼音方案三原則,即拉丁化、音素化、口語化。1958年,漢語拼音方案經(jīng)全國人民代表大會通過;后周有光出席國際標準化組織會議,促成投票通過漢語拼音方案為拼寫漢語的國際標準。之后,周有光繼續(xù)研究以詞語為單位的拼音正詞法,形成《漢語拼音正詞法基本規(guī)則》,并于1988年公布。而周從上世紀50年代開始主編的《漢語拼音詞匯》,成為電腦中文詞庫基礎。
3.五筆字型具劃時代意義
拼音類的輸入法包括大陸的拼音輸入法和臺灣的注音輸入法等。拼音輸入法相比其他輸入法有著天然的優(yōu)勢,因為現(xiàn)代每一個接受教育的中國人,在還沒學習漢字前就先用大量時間學習漢語拼音或注音符號,因此原本只是用來標記漢字讀音的拼音,也就可以輕松地作為漢字的輸入編碼。拼音輸入法另一個優(yōu)勢就是接近口語,所以拼音輸入法可以讓學習者在極短時間內適應。
但是,拼音輸入法有個致命的弱點,就是編碼時單字重碼率非常高,即使是詞組重碼率也是非常高。尤其是在誕生之初,軟件功能差,字序固定,不支持詞組和整句輸入,甚至文字不能和編碼一起顯示。在輸入漢字過程中,常常要翻很多頁才能找到需要的漢字,輸入效率非常低下。雖然當時很多人只會用拼音輸入法,但大部分人都不滿意拼音輸入法的輸入效率。
1983年,王永民推出了劃時代的五筆字型輸入法。五筆輸入法采用普通的電腦鍵盤,只使用英文字母鍵其中的25個參與編碼,不但可以讓我們輸入漢字,而且極大地解決了輸入速度慢這一頑癥。
五筆字型完全依據(jù)筆畫和字形特征對漢字進行編碼,是典型的“形碼”。形碼是相對于音碼而言的,形碼輸入法是依據(jù)漢字字形,如筆畫或漢字部件進行編碼的方法。最簡單的形碼輸入法是12345五筆畫輸入法,廣泛應用在手機等手持設備上,電腦上形碼廣泛使用的有五筆字型輸入法、鄭碼輸入法,在港澳臺等地流行的形碼有倉頡輸入法、行列輸入法、大易輸入法等。作為國內第一個推廣的形碼輸入法,五筆字型一經(jīng)推出即受到很多用戶的熱捧,在上世紀80-90年代,很多人學習電腦的第一要務,就是學習五筆字型輸入法,五筆教學培訓班也遍地開花。
五筆字型輸入法和拼音輸入法不同,需要認真學習,剛開始不容易上手,但一旦背熟了“字根表”,使用五筆字型可以實現(xiàn)“盲打”。這個巨大的優(yōu)勢讓“能否掌握五筆字型”成為打字是否專業(yè)的標志。
盡管王永民掀起了全國學習使用五筆字型的高潮,但是五筆字型學習難度高,而且編碼存在一些不合理的地方,比如字根不符合漢字基本部件與違反筆順的問題,所以一直無法成為國家教委的推薦輸入法。在上世紀80-90年代,由于國家教委尚未有推薦輸入法方案,所以在中小學里教的漢字輸入法相當多,各個學校教漢字輸入法也不盡相同,有的教五筆字型,有的教自然碼,有的教肖碼等。不過由于五筆字型輸入法可以快速錄入漢字,因此在全國范圍內得到較為廣泛的商業(yè)推廣。
4.中文輸入已快過英文輸入?
計算機和手機漢字輸入法的探索發(fā)明之路已走過了近30年。這30年可以用“萬‘碼’奔騰”來形容,市面上除了五筆字型輸入法、全拼輸入法外,自然碼、鄭碼、黑馬輸入法等各種各樣的輸入法紛紛涌現(xiàn)出來。
盡管五筆字型輸入法有諸多好處,但“難學”這個致命的弱點讓其難以高度普及。反倒是拼音輸入法,因為是操作最簡單的輸入法,始終沒有被拋棄。21世紀初期,拼音輸入法有了長足的改進,以微軟視窗操作系統(tǒng)內置的智能ABC、微軟拼音輸入法以及市面上非常流行的拼音加加、紫光拼音輸入法為代表,這個時代的拼音輸入法,隨著智能聯(lián)想、自我學習、模糊、細分專業(yè)詞庫等功能的不斷完善,用戶使用拼音輸入法錄入文字的速度得到大幅提升。由于拼音輸入法不需要用戶花費額外的學習成本,因此很快贏得青睞,這個時期的拼音輸入法奠定了其成為中文輸入法主流的市場地位。
到了2005年以后,搜狗等新一代拼音輸入法崛起。新一代拼音輸入法充分借鑒了互聯(lián)網(wǎng)的優(yōu)勢,通過自動升級詞庫等方式,保持詞庫處于最新狀態(tài),嵌入了網(wǎng)絡搜索的功能,智能化程度更高,自我學習能力更加強大,增加了英文單詞提示、中英文詞典等功能,還可以通過網(wǎng)絡保存用戶個人使用習慣和個人字典。隨著各種個性化皮膚的涌現(xiàn),其屏幕展現(xiàn)形式也更加豐富多彩。
為占有用戶桌面端,越來越多的IT和互聯(lián)網(wǎng)廠商開始涌入拼音輸入法這塊陣地,如搜狗、QQ、谷歌等,甚至阿里巴巴和百度等也開始涉足拼音輸入法領域。廠商爭奪這塊市場已經(jīng)遠遠超出了占有拼音輸入法市場本身的意義,已成為廠商占領用戶桌面端、移動終端的重要手段。
今年10月29日,2016搜狗大會在北京舉行,搜狗CEO王小川做了題為“搜狗的人工智能之路”的演講,提出搜狗輸入法將推出智能回復和分享功能。王小川稱,未來輸入法不只是一個表達工具,它可以理解你的想法,別人向你提問,輸入法會自動代替你回復。搜索的未來在于問答,未來搜索引擎將做到輸入一個關鍵詞獲得一個精確的答案。搜狗搜索的下一個目標,是把從今天的關鍵詞系統(tǒng)變成問答系統(tǒng),而搜狗已經(jīng)逐步上線這樣的能力,大概有5%-10%的問題可以直接給答案。
據(jù)美國《大西洋月刊》網(wǎng)站11月1日報道,研究現(xiàn)代中國的歷史學家湯姆·馬拉尼正在舉辦中文打字機和鍵盤展覽。這個展覽令馬拉尼得出結論說,中國正在打字技術方面大踏步前進,而西方遠遠落在后面,仍然緊抱著QWERTY鍵盤不放。
馬拉尼提出,在QWERTY電腦鍵盤上打英文,“是使用鍵盤的最基本方式”。在鍵盤上按下“a”鍵,“a”就會出現(xiàn)在屏幕上?!斑@不需要使用計算機的處理能力和內存?!绷硪环矫妫谶B接到一臺中文電腦的QWERTY鍵盤上鍵入“a”,計算機將會“推測”你可能會打出的漢字。用中文輸入,需要用戶從軟件層面來考慮問題。換句話說,鍵入一個漢字,本質上是鍵入一組指令——如果你愿意的話,也可以是一個代碼——來檢索一個特定的漢字。
他認為,正是中國在電報和打字機領域曾經(jīng)遭遇的尷尬歷史,促使講中文的人在軟件出現(xiàn)之后對其進行了充分的利用——以至于現(xiàn)在用中文輸入比用英文要快得多。本文供圖
聯(lián)系客服