眾所周知,自“人工智能”(Artificial Intelligence)這門學(xué)科1956年誕生于美國達(dá)特茅斯會議之后,英語世界就一直控制著人工智能科學(xué)的發(fā)展節(jié)奏。這就導(dǎo)致了一種看似很難避免的現(xiàn)象:與自然科學(xué)的其他學(xué)科一樣,英語也成為人工智能研究的首選工作語言。而依據(jù)筆者淺見,目前英語世界在各項人工智能產(chǎn)品研究方面的領(lǐng)先地位,很可能會以某種隱蔽的方式為英語思維的進(jìn)一步擴(kuò)張?zhí)峁┲?,并對其他文化的獨立性?gòu)成威脅。
一些讀者或許會覺得筆者的上述擔(dān)憂言過其實,他們或許會說:邏輯與統(tǒng)計學(xué)才是編程工作所依賴的“基礎(chǔ)知識”,英語只是其皮毛。面對這種指責(zé),筆者的回應(yīng)是:
其一,正如人工智能專家麥克德莫特(Drew McDermott)所指出的,在日常生活中人類需要用到純粹的演繹推理的場合是少之又少,因此,從某種意義上說,不作出某種變通,純而又純的演繹邏輯工具對人工智能研究來說是沒用的。而人工智能專家對于演繹邏輯規(guī)則的“變通性使用”又往往會倒逼他們?yōu)橄到y(tǒng)設(shè)置一個非常大的公理集,以便預(yù)先為盡可能多的人類常識知識進(jìn)行編碼(并在設(shè)置該公理集的前提下,將特定語用環(huán)境下系統(tǒng)的對策處理為語境知識與公理知識的“邏輯蘊含物”)。很顯然,這種“常識編碼”工作若由英語世界的研究人員來完成的話,“英語世界的偏見”就很難不摻雜入其中了。
其二,與演繹邏輯規(guī)則類似,統(tǒng)計學(xué)法則的運用并非是在真空之中,而是要以一定量的樣本量為前提,而樣本空間本身的創(chuàng)制則免不了文化偏見的滲入。譬如,當(dāng)鮑曼帶領(lǐng)他的研究團(tuán)隊創(chuàng)制一個能夠自動判斷語句之間的文本衍推(textual entailment)關(guān)系的人工神經(jīng)元網(wǎng)絡(luò)系統(tǒng)之時,他們便是用如下方法為訓(xùn)練此類網(wǎng)絡(luò)提供“樣本庫”的:給大量說英語的被試者展示特定的畫面,并要求后者用英語對畫面進(jìn)行概括,再要求其直接寫出與該概括相互矛盾或為其所蘊含的句子,等等。就這樣,研究者搜集到了由570 000個英文句子的句對所構(gòu)成的訓(xùn)練樣本庫,而每個句對都帶有“蘊含”“矛盾”這樣的句法關(guān)系標(biāo)注。不過,從某種意義上說,這樣的一個樣本庫也是一個“英語言說者的文化偏見庫”,因為我們很難保證其他文化的語言言說者也會在面對同樣一個畫面時聯(lián)想到同樣的“矛盾句”或“蘊含句”。
其三,計算機的語言一般分為“機器語言”“編程語言”與“界面語言”三類?!皺C器語言”是機器運作的內(nèi)部代碼,非專業(yè)工程師無法理解?!敖缑嬲Z言”即用戶所接觸到的語言,一般也就是英語、漢語之類的自然語言。至于編程語言,則是編程人員編制計算機程序時所依賴的工具。雖然從原則上說,編程語言是可以與界面語言相互脫節(jié)的(就像機器語言幾乎是與任何一種界面語言脫節(jié)的那樣),但為了方便英語國家內(nèi)部的工作人員,英語世界研發(fā)的編程工具往往就是英語的某種簡化形式。比如,1972年由美國貝爾實驗室研發(fā)的“C語言”的標(biāo)準(zhǔn)詞匯就包含了大量英文單詞,譬如“auto”“double”“int”“struct”“break”等。這顯然為英語國家的編程人員學(xué)習(xí)此類編程語言提供很多便利。需要注意的是,即使是在與符號主義進(jìn)路不同的神經(jīng)元網(wǎng)絡(luò)技術(shù)(及其后繼者深度學(xué)習(xí)技術(shù))的研發(fā)過程中,其所依賴的編程工具(如Python)依然帶有濃郁的“英語詞匯的人工簡寫模式”的色彩,因此形成對英語國家人士更友好的學(xué)習(xí)界面。
目前華語世界的很多計算機軟件產(chǎn)品,其實都是英語世界首發(fā)產(chǎn)品的“漢化版”,而與此同時,具有母語意識的產(chǎn)品研發(fā)案例,卻寥若晨星。至于漢語結(jié)構(gòu)自身的獨特性所造成的其與英語表述之間的巨大差異,雖在一定程度上為語言學(xué)界所重視,卻依然沒有得到人工智能學(xué)界中的自然語言處理專家們的廣泛共鳴,這著實不是一種能令人感到安心的現(xiàn)狀。有鑒于如上宏觀評估,筆者認(rèn)為我們有必要從語言哲學(xué)與認(rèn)知語言學(xué)的角度,重新考量學(xué)界對于一些特定的漢語表達(dá)式的技術(shù)刻畫方式,并通過這種重估進(jìn)一步揭露“西式思維”對于漢語本真結(jié)構(gòu)的扭曲效應(yīng)。同時,筆者還希望能夠以此為契機,為人工智能研究中母語意識的勃發(fā),提供可行的技術(shù)實現(xiàn)路徑。
不過,考慮到關(guān)于“特定的漢語表達(dá)式”的具體案例是如此之多,在一篇篇幅有限的論文中,筆者只能掛一漏萬地聚焦于一個能“以小見大”的語言現(xiàn)象,即漢語中的量詞現(xiàn)象。
受到現(xiàn)代謂詞邏輯思維影響的讀者,或許誤認(rèn)為本文會討論諸如“存在量詞”“全稱量詞”這樣的“量詞”。實際上,這種意義上的“量詞”英文叫“quantifier”,而本文所說的量詞在英文語法書里叫“classifier”,在日語語法書里則叫“助數(shù)詞”,與邏輯教科書里說的“量詞”不是一回事。說得更直接一點,本文所涉及的是漢語中的量詞實例,即諸如“一輛車”中的“輛”字,“一件衣服”中的“件”字,等等。從英語思維的角度看,在被涉及的名詞本身是可數(shù)名詞的情況下,對于此類量詞的使用是不可理解的,因此,一種基于英語思維的自然語言處理系統(tǒng)很可能就會轉(zhuǎn)而淡化量詞的使用規(guī)則的重要性,或?qū)⑵浠s為某種別的可以為英語思維所消化的語言現(xiàn)象。由此所導(dǎo)致的實踐后果便是:這樣的計算機系統(tǒng)將無法判斷“一條狗”是比“一只狗”更為地道的漢語表達(dá),甚至無法判斷,比起“一條狗”或“一只狗”來說,“一狗”是一個有待完成的漢語名詞表達(dá)式。
迷信統(tǒng)計學(xué)與大數(shù)據(jù)的樂天派或許會說:基于海量的網(wǎng)絡(luò)數(shù)據(jù),計算機就可以計算出:在出現(xiàn)“狗”的前提下,在其前面出現(xiàn)“條”的后驗概率會遠(yuǎn)遠(yuǎn)高于出現(xiàn)“只”的后驗概率——由此,系統(tǒng)就可由此判斷“一條狗”是比“一只狗”更地道的漢語表達(dá)。然而,從哲學(xué)角度看,這樣的技術(shù)進(jìn)路已經(jīng)預(yù)設(shè)了“更地道的漢語表達(dá)式就是被更多人所使用的表達(dá)式”——但這個預(yù)設(shè)本身卻是經(jīng)不起推敲的(因為我們完全可以設(shè)想這樣一種情境:大多數(shù)網(wǎng)民在網(wǎng)絡(luò)上所輸入的漢語都是粗糙的,未經(jīng)打磨的,因此是不值得成為語言范本的)。實際上,當(dāng)我們將英語“a dog”輸入“谷歌翻譯”的自動翻譯軟件,并試圖讓該軟件將其翻譯為漢語的話,我們的確只是得到了不那么精妙的“一只狗”,而不是更為生動的“一條狗”。可見,基于統(tǒng)計的自然語言處理機制,已經(jīng)在量詞問題上出了丑。
迷信統(tǒng)計學(xué)的技術(shù)樂天派或許還會說:我們可以鼓勵網(wǎng)民在網(wǎng)絡(luò)上使用盡量標(biāo)準(zhǔn)的漢語,或者專門為訓(xùn)練機器而輸入那些“雅馴”的漢語訓(xùn)練樣本。但在筆者看來,即使這些苛刻的前提真的得到了滿足,基于統(tǒng)計的自然語言處理機制依然會出丑。其道理非常簡單:我們無法肯定在任何一個關(guān)于“狗”的地道的漢語表達(dá)中,在“狗”字之前的臨近位置,一定會出現(xiàn)“條”字。請試想下面這句話:“阿花是一條無憂無慮的,而且老愛跟著河上的船只飛跑的小花狗”——在這句話中,在“條”與“狗”之間隔著21個字,而在“只”與“狗”之間卻僅僅隔著6個字。因此,基于統(tǒng)計學(xué)原理與“毗鄰性原則”的自然語言處理系統(tǒng),將會有更大的機會將其誤判為“一只狗”的變體(而不是“一條狗”的變體),并在這種誤判的前提下認(rèn)定這個句子需要改變量詞。這也就是說,只要我們在原有的含有量詞的名詞表達(dá)式中插入更多的語法成分,基于統(tǒng)計學(xué)的自然語言處理系統(tǒng)就會立即輸出荒謬的處理結(jié)果——除非這樣的系統(tǒng)具備對于量詞真實語法與語義角色的識別能力。
那么,我們又該如何對漢語量詞的真實語法以及語義角色作出刻畫呢?說到這個問題,我們就無法不提及美國哲學(xué)家兼邏輯學(xué)家蒯因(W. V. Quine)對于日語中的量詞現(xiàn)象的刻畫方案(因其特殊的學(xué)術(shù)地位,蒯因在這個問題上的見解已經(jīng)成為討論量詞刻畫的所有文獻(xiàn)都必須引用的對象)。
有過一點日語學(xué)習(xí)經(jīng)歷的讀者可能都知道:與漢語類似,日語中也有比較豐富的量詞現(xiàn)象,而這一點不由得讓作為美國人的蒯因大感興趣。但蒯因給出的對于日語(漢語)中的量詞現(xiàn)象的分析如此不讓人滿意呢?關(guān)鍵問題便在于,他是用英語的思維去設(shè)想東方語言的情況的。依據(jù)英語思維,可數(shù)名詞與不可數(shù)名詞之間的差異可是一件大事情,這種差異會導(dǎo)致動詞詞尾、形容詞前綴方面的一系列變化。而當(dāng)一個美國人突然發(fā)現(xiàn):(1)日語(漢語)中沒有明顯的可數(shù)名詞與不可數(shù)名詞方面的差異;(2)日語(漢語)中卻有英語中不那么明顯的量詞現(xiàn)象的時候,他所能夠想到的一個很自然的解釋就是:要么這些東方人認(rèn)為世上萬物都是可數(shù)對象(并在這種情況下將量詞用作數(shù)詞的一部分),要么這些東方人認(rèn)為世上萬物都是不可數(shù)對象(并在這種情況下將量詞視為某種“個體化對象的產(chǎn)生機制”)。但為蒯因所始終忽略的一種可能性就是:“可數(shù)—不可數(shù)”的區(qū)分本身或許壓根兒就沒有進(jìn)入中、日語言說者的意識,亦未進(jìn)入其本體論背景——因此,量詞的出現(xiàn)或許與“可數(shù)—不可數(shù)”的區(qū)分毫無關(guān)系,而是基于某種其他語言學(xué)或心理學(xué)機制。
但令人遺憾的是,蒯因關(guān)于量詞問題的思維范式是如此強大,以至于馬歇爾·威爾曼(Marshall Willman)先生在最近重拾“漢語中的量詞”這個話題的時候,依然采用了一種親和于英語思維的分析方式。具體而言,他以一種同情蒯因的“甲案”的方式,作出了如下評論:因為漢語中缺乏英文中的詞綴“s”來提示名詞的復(fù)數(shù)形式,嬰幼兒時期的漢語言說者只有求助于別的語法機制來完成對于名詞單數(shù)與復(fù)數(shù)的區(qū)分——換言之,由此完成對于混沌世界的分割。而量詞的引入,也正是為了滿足這種語言訴求。然而,這樣的一種預(yù)設(shè)了“單—復(fù)數(shù)區(qū)分”之基礎(chǔ)性的解釋方案,卻無法解釋如下這些經(jīng)驗現(xiàn)象:
其一,正如很多發(fā)育心理學(xué)家所指出的,在學(xué)會母語之前,各個民族的正常嬰兒都能夠識別物理對象的那些基本空間屬性(比如知道兩個固態(tài)物體不可能占據(jù)同一時—空坐標(biāo),或知道一個空間對象的各個空間部分會隨著整體的移動而一起移動,等等)。這也就是說,即使在語言沒有對單、復(fù)數(shù)區(qū)分進(jìn)行強調(diào)的情況下,人類的基本心理能力已經(jīng)能夠滿足“對混沌世界的區(qū)分”這一需求了。因此,漢語中“量詞”的出現(xiàn)未必就一定會去強化這一區(qū)分,而可能是為了滿足其他語法功能。
其二,正如威爾曼本人所注意到的,不少量詞——比如“一門課”與“一節(jié)課”中的“門”與“節(jié)”——是扮演了一定的語義角色的,因此,用謂詞邏輯的術(shù)語來說,它們更應(yīng)當(dāng)被視為某種意義上的“命題函項”,而不是數(shù)詞的某種補充機制。但同樣很明顯的是,這些現(xiàn)象是無法被威爾曼關(guān)于量詞的整體解釋框架所消化的,而這一點便使得他的理論的統(tǒng)一性受到了很大的削弱。
其三,正如家徐丹先生所指出的,盡管漢語并不強行要求在名詞表達(dá)式中給出單復(fù)數(shù)區(qū)分,但至少在中古漢語中,我們也可以找到大量與復(fù)數(shù)表達(dá)相關(guān)的語言表述手段,比如“都”“皆”“全”“并”“具”“悉”“咸”“總”“舉”等。這些詞的存在,顯然會使得威爾曼賦予量詞“區(qū)別單、復(fù)”功用的重要性被大打折扣,并進(jìn)一步提示我們:量詞在漢語中或許在執(zhí)行著某種與上述功用不同的其他重要功能。
無獨有偶,日本的語言哲學(xué)家飯?zhí)锫τ谌炸M漢語中的量詞現(xiàn)象的解釋,亦同樣缺乏應(yīng)有的統(tǒng)一性,而且也同樣受制于“單、復(fù)區(qū)分”的思維陷阱。然而,經(jīng)由這樣的疊床架屋的構(gòu)建,我們依然無法找到一種關(guān)于“為何漢語或日語需要量詞”這個問題的統(tǒng)一性解釋——我們得到的,只是幾種不同解釋的外在拼接。用計算機科學(xué)的術(shù)語來說,按照飯?zhí)锫τ谪嵋蚶碚摰陌l(fā)展模型,一個關(guān)于量詞的語言處理系統(tǒng)需要安置兩到三個不同的算法模型來對應(yīng)他所說的三種構(gòu)建——而這樣的處理卻顯然會讓系統(tǒng)難以在與三種構(gòu)建相關(guān)的不同表達(dá)式之間建立起暢通的推理路徑。
而從一個更深的角度來看,正如筆者前文已經(jīng)提及的,蒯因—威爾曼—飯?zhí)锫÷肪€的量詞解釋方案之所以缺乏內(nèi)在統(tǒng)一性,根本上或許就是因為:在漢語或日語的量詞現(xiàn)象與英語思維對于單—復(fù)區(qū)分的敏感性之間,本來就是存在著某種張力的。因此,學(xué)者們在后一種敏感性的指引下去為前者分類,就很難不導(dǎo)致種種削足適履的結(jié)果了。換言之,倘若不“懸置”英語思維對于研究的影響,我們就無法直面漢語或日語中量詞現(xiàn)象的“實情”。
依筆者淺見,要理解漢語中量詞所發(fā)揮的實質(zhì)功能,漢語演化史或許能夠為我們提供相應(yīng)的啟發(fā)。根據(jù)張赪先生的研究,量詞現(xiàn)象的確在漢語演變的歷史中經(jīng)歷了一個“從不顯著到日益顯著化”的嬗變過程。具體而言,先秦時期上古漢語中量詞現(xiàn)象并不多見(或再借用麻愛民先生的話來說,先秦時期是中國量詞發(fā)展史上的“比較稚嫩的萌芽期”,而量詞使用頻度的顯著提升,乃是在兩漢時期。到魏晉南北朝時期,古漢語中的量詞種類則進(jìn)一步豐富化了。說得更具體一點,如果我們將“枚”這樣的量詞稱為“通用量詞”(即可以與各種名詞搭配的量詞),并將“?!薄翱凇薄俺恕狈Q為“專用量詞”(即只可與特定名詞搭配的量詞)的話,那么,根據(jù)張赪的統(tǒng)計,在兩漢,可以與通用量詞搭配的名詞有55種,可與專用量詞搭配的名詞則只有11種;到了魏晉,可以與通用量詞搭配的名詞種類數(shù)目上漲到了75種,而可與專用量詞搭配的名詞種類的數(shù)目則上漲到了43種。
在筆者看來,這樣的統(tǒng)計結(jié)果顯然說明:(1)量詞的真實功用或許壓根兒就與“個體化機制”或“單復(fù)區(qū)分”沒什么關(guān)系,否則我們就必須非常牽強地說:在兩漢時期,有一種特別的需要迫使人們在語言中固化了某種“個體化機制”,而在此之前,這樣的需要乃是不存在的(但毫無疑問的是,兩漢時期中國人與先秦時期的中國人所面對的物理環(huán)境是大同小異的,兩個時期中國人的認(rèn)知架構(gòu)也應(yīng)當(dāng)是大同小異的);(2)既然通用量詞的發(fā)育是先行于專用量詞的,那么,通用量詞的功能肯定會與專用量詞有所差異——而且,專用量詞功能的施展又很可能是以通用量詞功能的存在為前提的,否則,二者的發(fā)育次序就會被顛倒過來。
由此看來,要解決“漢語量詞功能”之謎的關(guān)鍵,便是首先要解釋清楚為何在兩漢時期文獻(xiàn)中大量出現(xiàn)了通用量詞。對此,馮勝利先生給出了一個顛覆蒯因思維模式的新穎解釋:驅(qū)使通用量詞在兩漢大量出現(xiàn)的主要因素,與所謂“個體化語言設(shè)施”毫無關(guān)聯(lián),而是具有明顯的韻律學(xué)(prosody)面相的。
需要注意的是,馮勝利并沒有解釋為何來自韻律美的這種要求在兩漢時期變得急迫起來。很顯然,面對這種不對稱性,輕描淡寫地說“先秦的漢語言說者相對不重視漢語韻律美”,恐怕是不太負(fù)責(zé)的,因為一個不重視韻律的民族是不可能有《詩經(jīng)》與《楚辭》的。而對于這種看似怪異的現(xiàn)象,筆者的一個推斷是:根據(jù)江荻先生對于戰(zhàn)國末年出現(xiàn)的《爾雅》的研究,上古漢語基本可以被判定為一種多音節(jié)詞語言,盡管它也一直在朝向單音節(jié)詞語言進(jìn)行著演化。這也就是說,盡管我們不能夠斷定這種演化在兩漢時期是否已經(jīng)完成,但兩漢時期的古漢語肯定要比先秦古漢語更具備濃厚的“單音節(jié)詞語言”的色彩。而正如我們在前面所分析的,“通過補充量詞來增加含單音數(shù)詞的名詞表達(dá)式的音節(jié)數(shù),使之接近含多音數(shù)詞的名詞表達(dá)式的韻律形式”這一說法,也只有在相關(guān)語言基本上是一種單音節(jié)詞語言的前提下才有意義。換言之,是古漢語從多音節(jié)詞語言到單音節(jié)詞語言的演化,才使得其韻律形式發(fā)生了改變,并使得通用量詞的出現(xiàn)實現(xiàn)了韻律學(xué)功能。
不過,在筆者看來,僅僅從韻律學(xué)的角度猜測漢語量詞生產(chǎn)的機制,我們還沒有將量詞扮演的功能屬性真正說透,因為這種假設(shè)對漢語量詞的“語義屬性”關(guān)照依然不夠。但語義問題本身卻是無法被回避的,因為即使就能夠與各種名詞搭配的通用量詞——如兩漢時期最流行的“枚”——來說,也很難說它是不具備某種基本語義的(根據(jù)許慎的《說文解字》對于“枚”的解釋,“榦曰枚”中,“枚”就是“小樹枝”的意思)。那么,我們又該怎樣解釋:為何偏偏是“枚”,而不是別的什么字,成為兩漢時期通用量詞的首選字呢?
而為了解決這個問題,我們不妨向認(rèn)知語言學(xué)(cognitive linguistics)所擅長的“隱喻”研究借腦。按照認(rèn)知語言學(xué)家權(quán)威萊考夫(George Lakoff)與約翰遜(Mark Johnson)在《我們賴以生存的隱喻》中所提出的見解,隱喻不僅僅是一種修辭手段,而且還是人類思想的基本概念組織方式,因為任何一種語義抽象方式其實都是一種隱喻投射方式(比如,本體A與喻體B的接續(xù),就可以被視為“將與B有關(guān)的概念圖式投射到A之上”的過程)。按照萊考夫等人的這種理解模型,我們不妨就將兩漢文獻(xiàn)中“枚”與一個名詞N的接續(xù),視為“將與‘枚’相關(guān)的概念圖式投射到N之上”的過程,或者說,“將N的概念圖式按照‘枚’的方式加以順化”的過程。說得再具體一點,按照上述解釋模型,在“具樁六枚”“弓二枚”“樹一枚”“犬一枚”這樣的表達(dá)式中,不同的名詞品類的原始意像都按照“小樹枝”(即“枚”的本義)的意像模式進(jìn)行了某種結(jié)構(gòu)調(diào)整,并由此成為某種像“小樹枝”那樣可供人類的雙手輕易操控的對象。由此,萬物之間的差異性得到了一定程度上的淡化,而人類通過語言操控萬物的意識也由此得到了一定的加強。
讀者或許會追問:為何這種通過語言來削減事物門類之間差異的傾向,會在兩漢突然勃興?對此,筆者不成熟的推斷是:漢代作為中國歷史上第一個長期穩(wěn)定存在的統(tǒng)一性王朝,為國家統(tǒng)一貨幣——五銖錢——在較大時空范圍內(nèi)的穩(wěn)定流通創(chuàng)造了歷史條件,而能夠與“錢”這個名詞接續(xù)的典型量詞顯然就是“枚”。換言之,“枚”的高頻度出現(xiàn)或許就是對于“錢”的一種“借喻”(metonymy),而金錢對于萬物差別的“祛差異化效應(yīng)”或許也借此使得“枚”本身也具備了類似的效應(yīng),最終使得其成為兩漢最具流通性的量詞(當(dāng)然,我們可能還需要更多的經(jīng)驗證據(jù)來驗證這一推斷)。
讀者或許還會問:那么,為何在魏晉時代,“個”作為新的通用名詞的地位,慢慢開始趕超“枚”?另外,為何與各類名詞的特殊語義相匹配的“特殊量詞”也在魏晉得到了發(fā)展?
對于這些問題,筆者的淺見如下:從漢末到魏晉再到隋唐,量詞出現(xiàn)在漢語名詞表達(dá)式的方式經(jīng)歷了一個從“名詞+數(shù)詞+量詞”到“數(shù)詞+量詞+名詞”的結(jié)構(gòu)轉(zhuǎn)換過程,換言之,量詞的位置從末尾調(diào)整到了中間,而到了宋代,這種轉(zhuǎn)換已經(jīng)基本定型。雖然這一結(jié)構(gòu)轉(zhuǎn)換的真實動因依然不明,但可以肯定的是,正是這一轉(zhuǎn)換,改變了包含量詞的名詞表達(dá)式的韻律結(jié)構(gòu),并使得“枚”在表達(dá)式結(jié)尾統(tǒng)一韻母的功能不復(fù)存在,并由此使得與“枚”不同的其他量詞的發(fā)展獲得了機會。換言之,先前由于“枚”的普遍化而造成的“量詞生態(tài)位”一旦被穩(wěn)定下來,那么,更多的語義屬性對于這些生態(tài)位的占據(jù),就會成為語言演化進(jìn)程中難以避免的現(xiàn)象——而語義屬性的多樣性顯然就會帶來量詞品類的多樣化,即特殊量詞的大量涌現(xiàn)。至于為何在這個過程中“枚”作為通用量詞的地位反而遭遇到了來自于“個”與“只”的競爭,一種可能是:“枚”在魏晉時代有被漸漸用作特殊量詞的趨勢,由此使得新的普遍量詞的出現(xiàn)挪移出了生態(tài)位。譬如,在兩漢人們可以說“樹木一枚”“矢一枚”“雞一枚”“狗一枚”,到了魏晉卻必須說“一根∕個∕株樹木”“一發(fā)∕只矢”“一頭∕只雞”“一個∕頭狗”,等等;在兩漢,可與“筆”接續(xù)的量詞只有“枚”,而到了魏晉,“枝”與“管”也可與之接續(xù)了。至于“枚”的這種降格化,是否與漢末動亂以來五銖錢地位的暫時下降有關(guān)(甚至與政治分裂時局下人們對于事物多樣性敏感度的提升相關(guān)),則需要更多的經(jīng)驗證據(jù)加以驗證。
不過,至少可以肯定的是,魏晉以來特殊量詞在漢語地位中的快速上升,已經(jīng)使得量詞的語義描述性質(zhì)開始覆蓋其早期的韻律學(xué)屬性,最終成為漢語中量詞的首要屬性。這種屬性無疑使得漢語言說者在使用形容詞之外,具備了一種額外的對名詞性質(zhì)進(jìn)行范疇歸類的手段,或者說,可以方便言說者將某種更抽象的隱喻結(jié)構(gòu)投射到與之相關(guān)的名詞品類之上。譬如,正如宗守云先生所指出的,量詞“條”所具有的關(guān)于“長形物”的隱喻圖式,便可以通過與特定名詞的接續(xù)而體現(xiàn)在“一條煙”“一條鞭子”“一條項鏈”這樣的表達(dá)式之中,由此使得“煙”“鞭子”“項鏈”這些名詞的空間外觀特征的凸顯性得到提升。
那么,為何漢語需要通過這種額外的手段對事物的名詞進(jìn)行范疇化,而相關(guān)語言現(xiàn)象在英語中卻并不明顯呢?關(guān)于這個問題,日語專家金子孝吉先生的研究或許可作參考(順便說一句,金子的研究對象雖是日語,但是也提到了其他的亞洲語言,因此其研究成果有一定的跨語言覆蓋力)。雖然金子孝吉提及的上述量詞運用方式未必全部在漢語中有直接的對應(yīng),但這些語例顯然向我們展示出了各種亞洲語言中“量詞活用”的巨大邏輯空間,充分證明了量詞的重大使用價值,甚至對漢語未來可能的“進(jìn)化”方向具有一定的提示意義。
現(xiàn)在我們就把文章第三個問題中的討論結(jié)果做一番小結(jié)。從漢語演化史的角度看,韻律學(xué)方面的因素,加上某些在“大一統(tǒng)”的政治—經(jīng)濟(jì)環(huán)境下所造成的特殊社會心理,或許是造成兩漢時期像“枚”這樣的通用量詞使用頻度大大提高的復(fù)合性原因。而一旦這種使用達(dá)到了一定的社會流傳度,即使是在兩漢的“名詞+數(shù)詞+量詞”的構(gòu)詞結(jié)構(gòu)慢慢嬗變?yōu)椤皵?shù)詞+量詞+名詞”的新結(jié)構(gòu)的情況下,原先通過“枚”所獲取的“量詞生態(tài)位”依然能夠得到保留,并為魏晉以后出現(xiàn)的大量特殊量詞提供了“插入槽口”。而隨著這種“信息插入槽口”的日益增多,語言共同體關(guān)于世界感知方式、社會等級、宗教與意識形態(tài)的很多隱秘信息,都可以通過量詞的活用而得到間接的體現(xiàn),由此大大豐富了語言的語義推理潛能與審美趣味。
筆者認(rèn)為,雖然基于漢語演化史與認(rèn)知語言學(xué)的量詞功能說明方式的確牽涉到了比較豐富的理論因素與歷史細(xì)節(jié),但其內(nèi)在的理論統(tǒng)一性卻是很高的。換言之,根據(jù)筆者的解釋,與蒯因等人的預(yù)想徹底相反,量詞在東亞語言中的大量出現(xiàn),與語言言說者對于外部世界的“個體化”與“對象化”需求基本無關(guān),而與語言表征系統(tǒng)內(nèi)部的某些內(nèi)在特征更為相關(guān)。換言之,量詞現(xiàn)象更相關(guān)于比較不抽象的“名詞認(rèn)知圖式”與比較抽象的“量詞認(rèn)知圖式”之間的推理路徑的特征。至于這樣的“量詞認(rèn)知圖式”究竟是應(yīng)當(dāng)與特定的韻律學(xué)屬性發(fā)生更密切的關(guān)系,還是應(yīng)當(dāng)與那些編碼了宗教與意識形態(tài)信息的語義節(jié)點發(fā)生更密切的關(guān)系,則是一個經(jīng)驗性質(zhì)的問題,且并不影響“量詞在實質(zhì)上是對于名詞品類的一種高階歸類”這一判斷在更高層面上的普遍有效性。
如果筆者對于漢語中量詞功能的上述理解方式基本上是正確的,倘若我們要在某種計算機的平臺上盡量模擬人類對于量詞的使用與把握方式的話,那么,這樣的計算平臺就應(yīng)當(dāng)至少具有如下的性質(zhì):其一,它應(yīng)當(dāng)已然能夠輕松地實現(xiàn)對于隱喻結(jié)構(gòu)的表征(因為“量詞+名詞”的結(jié)構(gòu)本身是一種隱喻投射結(jié)構(gòu));其二,它應(yīng)當(dāng)具有“非公理性特征” ,即可以靈活地允許與名詞相關(guān)的“量詞插位槽”作出新的擴(kuò)容,以便隨時插入新的量詞,而不是預(yù)先以“公理集”的方式將名詞與量詞之間的搭配方式全部鎖死;其三,它應(yīng)當(dāng)具有與系統(tǒng)感知模塊的輸出進(jìn)行接駁的潛力,以便在可能的情況下為量詞表達(dá)式的韻律學(xué)屬性進(jìn)行編碼;其四,它應(yīng)當(dāng)具有通過小的訓(xùn)練樣本掌握量詞用法的能力,而不是像深度學(xué)習(xí)技術(shù)所要求的那樣,需要海量的學(xué)習(xí)樣本(如前所示,這是因為,線上提供的關(guān)于漢語量詞正確用法的樣本數(shù)量,總是被種種不正確的用法案例所壓倒)。但問題是:我們有這樣的計算平臺嗎?
據(jù)筆者所知,目前在全球范圍內(nèi),最可能將筆者所構(gòu)想的量詞功能解釋予以算法化的計算平臺,乃是由美國天普大學(xué)(Temple University)的計算機科學(xué)家王培先生發(fā)明的“納思系統(tǒng)”所提供的。納思系統(tǒng)的英文全稱為“Non-Axiomatic Reasoning System”(非公理推理系統(tǒng)),“NARS”為其縮寫,“納思”為該縮寫的漢語音譯。大體而言,納思系統(tǒng)乃是一個具有通用用途的計算機推理系統(tǒng),而且能夠在下述意義上與上面提出的四點要求相互契合:其一,它是一個非公理系統(tǒng),即能夠允許自身的知識庫內(nèi)容隨著學(xué)習(xí)經(jīng)驗的增加而隨時改變;其二,它的基本知識表征形式雖然具有“主—謂邏輯”的外觀,卻允許在某種復(fù)雜的遞歸結(jié)構(gòu)中表征類比推理與隱喻投射;其三,它的基本詞項可以是前符號的感知范型,并在這種意義上與感知模塊的輸出相互接駁;第四,其系統(tǒng)的運作并不依賴于大數(shù)據(jù)環(huán)境的存在,并能夠通過比較小的學(xué)習(xí)樣本進(jìn)行歸納。不過,關(guān)于如何具體地將納思系統(tǒng)的這些特征與“量詞刻畫”這項具體的任務(wù)結(jié)合在一起,我們顯然還需要另外一個研究項目加以推進(jìn)。
正如筆者在文章開頭所指出,以英語為思維底色的主流人工智能技術(shù)的傳播具有“扁平化地球”的某種文化毀滅功能,對維護(hù)人類文化的多樣性不利。然而,若我們只是空洞地去抗議這種披著技術(shù)外殼的文化霸權(quán)的擴(kuò)散的話,恐怕效果會事與愿違,因為“批判的武器”畢竟無法取代“武器的批判”。依筆者淺見,正確的做法便是用保護(hù)特定文化特異性的人工智能,去抵抗試圖消除這種特異性的人工智能,即以機器的工作效率成倍地提高弱勢文化之“彌母”(meme)的傳播效率。套用到關(guān)于量詞的具體案例上說,這樣的人工智能將幫助漢語文本的編輯用戶充分意識到漢語中量詞現(xiàn)象的豐富性與靈活性,并能夠在文本編輯過程中為用戶提供更多相關(guān)方面的構(gòu)詞咨詢,由此避免量詞表達(dá)式在社會傳播中的退化。而且,由于量詞現(xiàn)象背后的隱喻投射方式天然存在著某種任意性,人工智能系統(tǒng)便能夠依據(jù)更強大的計算能力自行發(fā)明新的隱喻投射方式,由此造成新的量詞使用方法供用戶選擇。依據(jù)筆者之見,所有這些舉措若得到落實,最終很可能反而會促進(jìn)量詞現(xiàn)象在數(shù)碼時代的又一次勃發(fā),并使得以后的漢語演化歷程,成為機器與人共同書寫的新篇章。
同時需要讀者注意,除了漢語之外,日語、韓語與泰語中也有豐富的量詞現(xiàn)象——而且,在藏語、緬甸語、彝語、羌語等大約二十來種亞洲大陸語言與不少印第安族語言甚至澳洲土語中,量詞現(xiàn)象也都是普遍存在的。這就說明了三點:第一,英語思維對于地球文化的“扁平化效應(yīng)”不僅僅是針對漢語的,而且還針多其他多種文化;第二,有鑒于量詞現(xiàn)象客觀上的普遍性以及英語文化優(yōu)勢地位之形成所具有的某種歷史偶然性,我們有理由認(rèn)為:恰恰是英語思維方式本身才是具有真正的“地方性”的——或者說,是某種偽裝成普遍性的地方性;第三,由于存在著對于各種民族語言中量詞現(xiàn)象的統(tǒng)一說明模式(即基于認(rèn)知語言學(xué)的“隱喻”理論的說明模式),因此,從原則上說,一種試用于漢語量詞理解的計算程序只要經(jīng)歷過新的學(xué)習(xí)過程,也是能夠把握其他語言中的量詞現(xiàn)象的(就像任何一個合格的漢語言說者,都有可能通過特定的學(xué)習(xí)步驟學(xué)會日語中的量詞使用一樣)。
文中圖片來自百度圖片
作者 | 徐英瑾,復(fù)旦大學(xué)哲學(xué)學(xué)院教授
責(zé)編 | 阿爾法馬
網(wǎng)編 | 劉揚
聯(lián)系客服