摘要:數(shù)字化是人類經(jīng)歷的第三輪技術(shù)革命,正在席卷社會每個角落,也是文科正在進行的第三輪范式革命的推動因素。文科范式指從觀念到實踐、從教學(xué)到科研、從學(xué)術(shù)到知識的邏輯一致性體系;既具有庫恩范式的基底,更指文科的資源/素材、方法/技術(shù)、理論/視角的關(guān)聯(lián)一致性體系。文科的第一輪范式革命是學(xué)術(shù)革命,第二輪是計量革命,第三輪則是正在進行的智能革命。學(xué)術(shù)界和企業(yè)界正在實踐的數(shù)智文科則是從素材像素化到理論智能化的探索式知識創(chuàng)造與積累。國家倡導(dǎo)和推動的新文科建設(shè)是文科范式革命在中國的組織化實踐。如果我們把正在展開的文科范式革命劃分為四個階段(素材像素化、像素數(shù)據(jù)化、數(shù)據(jù)理論化、理論智能化),那么,當(dāng)下的努力其實還處在第一、二階段,而第二、三、四階段則可能是交互并進的。
關(guān)鍵詞:數(shù)字化;文科范式;知識生產(chǎn)
數(shù)字技術(shù)革命是迄今為止人類發(fā)生的第三輪技術(shù)革命,正在改變社會的生產(chǎn)與生活,乃至一切。農(nóng)業(yè)技術(shù)革命以動物養(yǎng)殖和植物栽培為標(biāo)志。在中國,栽培水稻的歷史可上溯至14 000—18 000年前,《史記·夏本紀(jì)》有“禹令益予眾庶稻可種卑濕”,在湖南省玉蟾巖遺址發(fā)現(xiàn)的水稻種子約在14 000年前。農(nóng)業(yè)技術(shù)革命為人類帶來食物,讓人類延綿至今。工業(yè)技術(shù)革命則以機械動力進入生產(chǎn)實用為標(biāo)志。在歐洲,以紐克曼(Thomas Newcomen)1712年發(fā)明蒸汽機為標(biāo)志,拉開了動力技術(shù)革命的序幕,歷經(jīng)化石燃料和電力動力的變革,徹底改變了社會的生產(chǎn)和生活方式。工業(yè)技術(shù)革命為人類帶來充裕的物質(zhì),讓人類可以衣食無憂。數(shù)字技術(shù)革命以可編程電子計算機的誕生為標(biāo)志,以互聯(lián)網(wǎng)的大眾化應(yīng)用為轉(zhuǎn)折點,是人類正在經(jīng)歷的、從一開始便影響廣泛且深遠(yuǎn)的未有之變。
數(shù)字化帶來的影響如此之深刻,以至于數(shù)字化已經(jīng)成為探討諸多問題時的必要前提。非數(shù)字化是一種場景,人們會以自然狀態(tài)和機械狀態(tài)為底色進行探討;數(shù)字化則是另一種完全不同的場景,人們會以數(shù)字連接泛在為底色進行探討。
科學(xué)研究是人類生產(chǎn)的重要組成部分,同樣受到了數(shù)字化的影響。卷積神經(jīng)網(wǎng)絡(luò)技術(shù)在蛋白質(zhì)結(jié)構(gòu)研究領(lǐng)域的應(yīng)用(AlphaFold系列)徹底改變了這個領(lǐng)域的知識創(chuàng)造。非數(shù)字化的與數(shù)字化的科學(xué)研究的差異可以用一項思想實驗作為示例,即姚檀棟的第二次青藏高原科學(xué)考察進展報告。姚檀棟認(rèn)為,第二次青藏高原科學(xué)考察“提出了青藏高原生態(tài)保護立法科學(xué)建議,服務(wù)高原生態(tài)文明高地建設(shè);闡明了氣變影響下亞洲水塔失衡特征和影響,服務(wù)國家水資源與水安全戰(zhàn)略;揭示了氣變影響下高原碳匯功能和變化特征,服務(wù)應(yīng)對氣變和實現(xiàn)雙碳目標(biāo)”等,共獲得了十大重要進展。姚檀棟對科學(xué)進展的報告呈現(xiàn)了非數(shù)字化場景的科學(xué)研究樣態(tài),即以學(xué)科化的成果代表科學(xué)研究的重大進展,每一項進展都限定在某個學(xué)科如生態(tài)學(xué)、水科學(xué)、氣候?qū)W等邊界范圍內(nèi)。如果把第二次青藏高原科學(xué)考察的成果匯集放在數(shù)字化場景里,十大重要進展或許會共同指向一個具有智能化理論產(chǎn)出的綜合進展,如青藏高原與人類發(fā)展有怎樣的關(guān)系。眾多已經(jīng)發(fā)生的和正在發(fā)生的事實表明,數(shù)字化對科學(xué)研究的影響是革命性的,以至于不得不重構(gòu)人類的知識創(chuàng)造和積累范式,而這個范式重構(gòu)不是指轉(zhuǎn)向人們已經(jīng)廣泛知曉的第四范式。
一、文科的知識生產(chǎn)范式
說到“范式”,我們不能回避庫恩(Thomas S. Kuhn)。庫恩在他影響深遠(yuǎn)的著作中,對范式進行了定義。
范式,通常是指那些公認(rèn)的科學(xué)成就,它們在一段時間里為實踐共同體提供典型的問題和解答。
這些著作之所以能起到這樣的作用,就在于它們共同具有兩個基本的特征:它們的成就空前地吸引一批堅定的擁護者,使他們脫離科學(xué)活動的其他競爭模式。同時,這些成就又足以無限制地為重新組成的一批實踐者留下有待解決的種種問題。
凡共有這兩個特征的成就,我此后便稱之為“范式”。
在總共13章的篇幅中,庫恩還呈現(xiàn)了科學(xué)范式的迭代機制(見圖1)。綜合圖1和庫恩對范式的定義,我們可以提出一個非常直接的疑問:知識創(chuàng)造與積累到底是對真理的追尋,還是對市場的占有。如果知識創(chuàng)造與積累不是追尋真理,那么,范式迭代便不過是產(chǎn)品更新的代名詞而已,科學(xué)研究對人類的意義和價值便與商業(yè)產(chǎn)品的生產(chǎn)與更新無異,毫無神圣性可言。當(dāng)然,這不是本文的主題,可以按下不表。一個更加直接的引申追問是,科學(xué)知識到底是理論的,還是經(jīng)驗的。在庫恩那里,知識顯然是理論的,他的底層假設(shè)承接了柏拉圖(Plato)對先驗(world of being)的斷言。與庫恩持相同立場的還有費耶阿本德(Paul Feyerabend)。他們從知識的先驗性出發(fā),認(rèn)為人類的知識創(chuàng)新與積累不過是對先驗知識的發(fā)現(xiàn)而已,在某種意義上,后者的觀點甚至更為相對主義。而在庫恩之前的波普爾(Karl Popper)那里,知識則是經(jīng)驗的,其底層假設(shè)承接了柏拉圖對后驗(world of becoming)的言說。與波普爾持相同立場的還有他的學(xué)生和批判者拉卡托斯(Imre Lakatos)。他們從知識的經(jīng)驗性出發(fā),認(rèn)為人類的知識創(chuàng)新與積累是線性的,是從低階向高階、從簡單到復(fù)雜的演進。
既有對人類知識創(chuàng)造與積累的探討,依然留下了一系列的問題。一方面是一些宏大的議題,如人類知識是一個整體,還是一個組合,人類知識到底是進化的,還是革命的,人類知識是科學(xué)家的篩選,還是社會的選擇,等等。另一方面則是一些具體的討論,如庫恩的范式到底是人類知識創(chuàng)造與積累的范式,還是只是一個學(xué)科知識發(fā)展的范式,如果是一個學(xué)科知識創(chuàng)造與積累的范式,那么科學(xué)是人類知識創(chuàng)造與積累的唯一選擇嗎?
我們并不試圖回答那些宏大問題,也不準(zhǔn)備糾結(jié)人類知識的來源,而是假定科學(xué)是人類創(chuàng)造與積累知識的有效路徑,并且把庫恩的范式放到庫恩寫作的時代背景下,認(rèn)為庫恩的范式在嚴(yán)謹(jǐn)?shù)囊饬x上其實只是一個學(xué)科的知識創(chuàng)造與積累范式。然而,從庫恩的范式中,我們可以歸納出范式變革的要素,將其用于理解人類知識創(chuàng)造與積累的范式。不過,本文只打算探討文科的范式革命。
人類的知識創(chuàng)造與積累離不開三個基本要素:素材、方法、視角。庫恩對范式的探討可以被梳理為一個這樣的框架:在給定的學(xué)科,給定研究素材,給定或改變研究方法或技術(shù)所帶來的知識變革。前面的圖1可以被理解為這個框架的邏輯呈現(xiàn)。我們的問題是,如果對知識的創(chuàng)造和積累不是局限于某個學(xué)科,而是整個文科呢。
人們通常理解的文科包含著人文學(xué)科和社會科學(xué)兩個大的類屬。當(dāng)然,對人文是否應(yīng)該或可以被稱為科學(xué),有著不同的爭議性觀點,且爭議一直存在。我們無意介入爭論,只是從知識創(chuàng)造與積累的范式入手探討范式革命。我們理解的文科是,人文學(xué)科聚焦對人類精神的挖掘與呈現(xiàn),社會科學(xué)則著力于社會規(guī)律的發(fā)現(xiàn)與呈現(xiàn)。這里討論的文科范式,既有庫恩范式的基底,更涵蓋科學(xué)活動與社會的關(guān)系。如果我們還接受庫恩所述范式變革隱含的市場競爭邏輯,則文科范式除了庫恩的學(xué)科范式之外,還有一個面向社會的知識生產(chǎn)與關(guān)乎合法性的關(guān)系范式。換句話說,知識創(chuàng)造與積累是學(xué)術(shù)界的事,而知識應(yīng)用則是社會的事。如果只有知識創(chuàng)造與積累,沒有知識應(yīng)用,知識生產(chǎn)便失去了社會意義,也失去了社會合法性。無論是農(nóng)業(yè)革命、工業(yè)革命,還是數(shù)字革命,帶來革命的不只有知識的創(chuàng)造與積累,更加重要的還有對知識的社會應(yīng)用。無論是人文學(xué)科還是社會科學(xué),我們認(rèn)為的文科范式還指從觀念到實踐、從教學(xué)到科研、從學(xué)術(shù)到知識的知識生產(chǎn)與應(yīng)用的邏輯一致性體系。不過,這也不是本文關(guān)注的議題。我們關(guān)注的是因知識創(chuàng)造與積累的三要素(見圖2)變革帶來的文科范式革命。我們認(rèn)為,在文科領(lǐng)域,知識生產(chǎn)是三個要素的關(guān)聯(lián)一致性體系。任意要素的變動都會影響其他要素,也會影響關(guān)聯(lián)一致性體系的結(jié)構(gòu)穩(wěn)定性,進而引發(fā)其他要素的變動。當(dāng)三個要素的變動產(chǎn)生相變時,便會發(fā)生范式革命。當(dāng)我們用這個框架分析文科范式的發(fā)展時,可以發(fā)現(xiàn),人文學(xué)科與社會科學(xué)知識的創(chuàng)造與積累經(jīng)歷了三輪范式革命,當(dāng)下我們正處在第三輪范式革命之中。
二、文科范式的三輪革命
文科的第一輪范式革命可以被稱為學(xué)術(shù)革命。赫拉利(Yuval Noah Harari)將人類理性的出現(xiàn)稱為認(rèn)知革命,其實,認(rèn)知革命遠(yuǎn)比赫拉利討論的要復(fù)雜。我們說的學(xué)術(shù)革命是人類運用理性認(rèn)識自然和社會,創(chuàng)造和積累知識的范式革命。
在文科的第一個范式階段,給定自然和社會是人類渴望認(rèn)識的對象,被用于認(rèn)識的素材除了實物,還有文本和圖像;認(rèn)識素材的方法是運用人類理性進行思辨和邏輯推演,其中,思想實驗是最直接的也是最有效的技術(shù)手段,最終形成了對自然與社會的可積累的知識,即學(xué)術(shù)(academy)。
之所以稱其為革命,是因為學(xué)術(shù)的出現(xiàn)將人類對自然與社會的認(rèn)識劃分為兩個截然不同的類型。在學(xué)術(shù)革命之前,人類對自然與社會的認(rèn)識沒有文本圖像的記錄,只有語言或語音。這意味著人類對自然與社會的認(rèn)識只能依靠人與人之間口耳相傳。在人類的認(rèn)識中,即使有知識,傳播的范圍也非常有限;即使有知識創(chuàng)造,也沒有可靠的知識積累。文本圖像的出現(xiàn)為知識創(chuàng)造和積累提供了可以留存與傳遞的載體,思辨或邏輯則讓一部分人對自然與社會的認(rèn)識從純粹的超然信仰中擺脫出來,變成了有事實依據(jù)的認(rèn)識過程,形成了可以被驗證的知識,進而也讓人類對自然與社會的認(rèn)識從神諭中走出來,變成了學(xué)術(shù)活動的成果。
縱觀人類歷史,每一個地區(qū)或民族都有自己的學(xué)術(shù)革命。在中國,我們有諸子百家;在西方,有古希臘三圣。如果只是追溯以對象分科的現(xiàn)代學(xué)術(shù)源頭,我們可以亞里士多德為例。亞里士多德是古希臘三圣中的最后一位,也是集大成者,人們通常稱他為哲學(xué)家。殊不知他更是百科全書式的科學(xué)家。他是最早研究形式邏輯的人,系統(tǒng)研究物質(zhì)運動的人,系統(tǒng)研究生物學(xué)的人,最早進行光學(xué)實驗的人,最早進行太陽與地球關(guān)系探討的人,最早進行地質(zhì)探討的人……現(xiàn)代科學(xué)的幾乎每一個學(xué)科都可以從他那里找到源頭。
在文科的第一個范式階段,面向社會的人類知識創(chuàng)造與積累是每一位學(xué)者獨立的、個性化的知識生產(chǎn)過程。在蕓蕓眾生中,一部分個體運用思辨和邏輯探索自然的規(guī)律和人類的精神,推動了從自然與社會的神圣性和神秘性向人類理性的演化。其中,無論因何種機緣而被認(rèn)為承接了神圣的人,都獲得了崇高的甚至超過君王的社會地位,成為那個時代的圣人。因此,那個時代的知識創(chuàng)造與積累,本質(zhì)上是學(xué)者個性化地對自然與社會的屬性進行的非計量、斷語式、教導(dǎo)式、說理式的刻畫與解釋活動。人類獲得的是精英化的知識。
在那個階段,不僅人文學(xué)科與社會科學(xué)沒有分離,甚至文科與自然科學(xué)也沒有分離。具體地說,精英化的知識是對自然與社會的整體性認(rèn)識。直到科學(xué)革命,才有自然科學(xué)從整體性學(xué)術(shù)的分離,形成了以自然的數(shù)據(jù)為素材的學(xué)術(shù)和以社會的現(xiàn)象為素材的學(xué)術(shù)。這一歷史性分野的標(biāo)志是1543年兩部著作的面世。那一年,哥白尼(Miko?aj Kopernik)出版《天體運行論》(De revolutionibus orbium coelestium),維薩里(Andreas Vesalius)出版《人體構(gòu)造》(De humani corporis fabrica)。兩部著作只是對歷史性分野的宣示,真正引發(fā)分野的是支撐兩部著作的技術(shù)或方法與素材互動的變革。我們知道,無論是文科還是其他學(xué)科,人類進行知識創(chuàng)造與積累的對象都是自然與社會。面對同樣的對象,之所以形成了分野,是因為哥白尼運用了計量觀察技術(shù)獲得了有關(guān)天體運行的新的數(shù)值型素材,且運用了計算技術(shù)處理素材;同樣,維薩里運用了不曾有過的結(jié)構(gòu)解剖技術(shù)獲得人體構(gòu)成素材,運用了計量技術(shù)分析素材。素材獲取技術(shù)的變革,帶來了素材之于理解和認(rèn)識的意義和價值的變革,引發(fā)了分析技術(shù)的變革;分析技術(shù)的變革又進一步推動了素材獲取技術(shù)的變革;兩者之間的互動推動了對自然與社會的新的認(rèn)識,推動了理論和視角的變革;最終推動的是人類知識創(chuàng)造與積累的變革。
在第一個文科范式后來的發(fā)展中,一個里程碑式的潛在變革是統(tǒng)計技術(shù)的引入和應(yīng)用。在面向社會的整體性知識創(chuàng)造與積累中,統(tǒng)計思維和統(tǒng)計學(xué)把社會科學(xué)從整體性學(xué)術(shù)中分離出來。1663年,格朗特(John Graunt)發(fā)表《對死亡率清單的自然和政治觀察》,標(biāo)志著對社會現(xiàn)象的觀察獲得了數(shù)值型素材,而“死亡率”這一統(tǒng)計量的出現(xiàn)意味著將統(tǒng)計思維引入處理數(shù)值型素材的過程中。之后,伯努利(Jacob Bernoulli)于17世紀(jì)末期孕育概率論,高斯(Carl F. Gauss)于1795年運用最小二乘法,最終讓統(tǒng)計學(xué)成為知識創(chuàng)造與積累的新工具。高爾頓(Francis Galton)和皮爾遜(Karl Pearson)創(chuàng)立的生物統(tǒng)計學(xué)進一步標(biāo)志著現(xiàn)代統(tǒng)計學(xué)在知識創(chuàng)造與積累中進入實用階段,也標(biāo)志著素材技術(shù)和分析技術(shù)對第一個文科范式產(chǎn)生了實質(zhì)性的侵蝕。
社會學(xué)正是在第一個文科范式的被侵蝕中分離出來的社會科學(xué)。提到社會學(xué),人們馬上想到的一定是孔德(Auguste F. X. Comte)。不過,如果從史料論來看,孔德只是提出了社會學(xué)概念而已。公允地說,他的社會學(xué)還是哲學(xué)里的一個倡導(dǎo)。讓社會學(xué)從整體性學(xué)術(shù)中分離出來的是涂爾干(émile Durkheim),涂爾干在《自殺論》(Le suicide étude de sociologie)中對自殺現(xiàn)象的數(shù)值型觀察和對觀察記錄的統(tǒng)計學(xué)分析讓他的自殺研究徹底區(qū)別于對自殺現(xiàn)象的神學(xué)或日常解釋,帶來了對自殺率的科學(xué)分析。讓社會學(xué)從整體性學(xué)術(shù)中分離出來的還有馬克思(Karl H. Marx)。馬克思在《資本論》(Das Kapital: Kritik der politischen Oekonomie)里不僅運用了統(tǒng)計學(xué),還運用了數(shù)學(xué)建模。素材技術(shù)和分析技術(shù)的變革共同推動了理論的變革,涂爾干的功能論和馬克思的沖突論正是運用新方法分析新素材后提出來的,也因此奠定了讓社會學(xué)從整體性學(xué)術(shù)分離的學(xué)科范式。文科范式變革的新三角(見表1)標(biāo)志著文科第二輪范式(計量)革命的開始。
計量革命是以計量技術(shù)為內(nèi)核的第二個文科范式。計量革命引發(fā)了從對象細(xì)分到資源/素材、技術(shù)/方法、視角/理論的系統(tǒng)性變革,推動了整體性學(xué)術(shù)向分科性知識創(chuàng)造與積累的發(fā)展,其中包括現(xiàn)代社會科學(xué)。這里,我們嘗試用一個比喻來刻畫從整體性學(xué)術(shù)到現(xiàn)代文科的變革。我們可以想象圖3的左邊是整體性學(xué)術(shù),右邊則是現(xiàn)代文科(見圖3)。
計量革命帶來的是,把整體性對象切分為分科性對象,讓整體性學(xué)術(shù)轉(zhuǎn)變?yōu)閷W(xué)科分異的對象拼圖。就像解剖學(xué)把有機生物肢解為肢體和器官一樣,每個肢體或器官在新的學(xué)科中變成了完整的對象,卻不一定是有機整體的部分,也因此有了面向社會的不斷分化的學(xué)科。
在文科從整體性學(xué)術(shù)向分科性學(xué)科發(fā)展的進程中,社會學(xué)其實不是第一個分離出來的學(xué)科。第一個是經(jīng)濟學(xué)。斯密(Adam Smith)的《國富論》(An Inquiry into the Nature and Causes of the Wealth of Nations)標(biāo)志著古典經(jīng)濟學(xué)的開端。社會學(xué)也不是最后一個分離出來的學(xué)科。在社會學(xué)之后,還有政治學(xué)。盡管有些人認(rèn)為馬基雅維利(Niccolò Machiavelli)的《君主論》(Il Principe)標(biāo)志著現(xiàn)代政治學(xué)的開端,但在我們看來,那還是整體性學(xué)術(shù)的遺存,標(biāo)志著現(xiàn)代政治學(xué)肇始的還是米歇爾斯(Robert Michels)對政黨的分析。
計量革命并不限于社會科學(xué)。在后來的發(fā)展中,運用計量方法獲得新素材、分析新素材的范式也對人文學(xué)科進行了侵蝕。經(jīng)典的人文學(xué)科如歷史學(xué)也在運用計量方法,如考察地球上的人類聯(lián)系,探索現(xiàn)代社會的起源和發(fā)展,還有專門的期刊,如《計量史學(xué):計量歷史與文化演化雜志》(Cliometrics: The Journal of Quantitative History and Cultural Evolution);科技考古也不斷將計量方法引入對遺址和文物的分析,形成了諸如考古化學(xué)、考古地質(zhì)學(xué)、考古材料與技術(shù)等新學(xué)科的發(fā)展。即使是哲學(xué),也有運用計量方法的新學(xué)科,如分析哲學(xué)。自弗雷格(Friedrich L. G. Frege)提出概念演算(Conceptual Notation)以來,分析哲學(xué)便形成了以數(shù)理邏輯為基礎(chǔ)的發(fā)展路徑,維特根斯坦(Wittgenstein)的《邏輯哲學(xué)論》(Tractatus Logico-Philosophicus)進一步確認(rèn)了這一路徑。
計量革命是一個逐步將計量技術(shù)與方法向知識的創(chuàng)造與積累滲透并形成范式優(yōu)勢的過程,盡管整體性學(xué)術(shù)依然存在,但其優(yōu)勢地位在逐漸消失,進一步形成了整體性學(xué)術(shù)與分科性學(xué)科之間的分野。與此同時,通過前文提到的知識生產(chǎn)與知識應(yīng)用的關(guān)系,科學(xué)家的知識創(chuàng)造與積累經(jīng)由制度化的教育體系和產(chǎn)業(yè)生產(chǎn)體系,變成工作崗位、生產(chǎn)和生活用品,進入大眾生活,形成科學(xué)普及,讓第一個范式的精英化知識變成了與社會密切相關(guān)的世俗化知識。
文科分科化對社會認(rèn)識的效果與自然科學(xué)分科化對自然認(rèn)識的效果不同。如果說自然現(xiàn)象具有結(jié)構(gòu)一致性,正如物理學(xué)對物質(zhì)屬性的探索可以從天體逐漸細(xì)?;搅孔樱鐣F(xiàn)象卻具有有機性,社會始終是一個互動的整體,是一個人類生態(tài),而學(xué)科化的人文學(xué)科與社會科學(xué)將一個有機整體和生態(tài)切分為一幅幅拼圖,無法形成對社會整體的有效認(rèn)識。這便是科學(xué)革命以來文科發(fā)展的內(nèi)生困境。在過去的時間里,文科學(xué)者們進行了各種努力,引發(fā)各種爭議討論,卻始終沒有找到解決內(nèi)生性困境的有效路徑。
數(shù)字化帶來的變革對文科而言既是挑戰(zhàn)也是跳出分科化困境的機會。學(xué)科史的事實告訴我們,計量革命帶來的素材變革是部分的,是人力所及的計量化,非計量化素材依然支撐著文科的知識創(chuàng)造與積累。數(shù)字化則意味著一切素材的計量化,進而意味著把人文和社會的一切屬性轉(zhuǎn)化為數(shù)值數(shù)據(jù),為將分科化的知識整合為對人文與社會整體屬性的知識提供了機會,也意味著文科范式第三輪革命的到來(見表2)。
比較表1和表2,如果說表1的人文學(xué)科繼承了第一個范式整體性學(xué)術(shù)的傳統(tǒng),而社會科學(xué)是對整體性學(xué)術(shù)的反叛,形成人文學(xué)科與社會科學(xué)的分野;那么,表2則意味著一個新的整體性學(xué)術(shù)時代的到來。表2還告訴我們,社會科學(xué)在第二個范式階段形成的與人文學(xué)科的分野,借助于生成數(shù)據(jù)和一切皆可數(shù)據(jù)化,又重新回到了一致。素材的一致影響的自然是方法和理論的一致,盡管這些一致的出現(xiàn)還有一個過程,甚至是一個復(fù)雜的社會過程,機會卻已經(jīng)呈現(xiàn),那就是人類又有了在更高維度對人文與社會重新進行整體性認(rèn)識的機會,文科又有了重新整合的機會,這將是一個新的綜合。
由數(shù)字化帶來的文科范式革命,即智能革命。智能革命是分科化學(xué)科綜合的開端,由于在數(shù)字化進程中大量使用機器,且機器承擔(dān)的工作是人力難以承擔(dān)的,具有不可替代性,因此,智能革命也是運用人機智能進行知識創(chuàng)造與積累的開始。這是人類歷史上從未有過的格局,也是人類正在探索的知識創(chuàng)造與積累范式。
我們可以借用圖1所示的范式迭代路徑,對第三個文科范式的發(fā)展進行判斷,這一進程大致處在前范式階段。在這個階段,各種努力繽紛呈現(xiàn),如阿爾法系列的努力、計算社會科學(xué)的嘗試、科學(xué)研究人工智能化(AI for …),以及當(dāng)下討論熱烈的GPT等。這些研究并非只是技術(shù)和方法的變革,而是由技術(shù)撬動的革命,實現(xiàn)了資源/素材、技術(shù)/方法與視角/理論之間的重新組合。這一輪范式革命在形式上是“一切皆可數(shù)據(jù)化”,本質(zhì)上卻是人機互生。人機互生意味著,人類的知識創(chuàng)造與積累不再是精英的特權(quán),甚至也不再是學(xué)者的專屬,而開始進入去個性化的、人機相互參與的技術(shù)與社會交互并進的過程,進而進入去個性化的世俗化過程。
在我們看來,這個過程至少需要經(jīng)歷四個階段(見圖4)。
三、第三輪文科范式革命的四個階段
智能革命的前提是一切皆可數(shù)據(jù)化。數(shù)字技術(shù)進入大眾化應(yīng)用階段以來,數(shù)據(jù)量的增長是一個顯著現(xiàn)象。根據(jù)國際數(shù)據(jù)公司(IDC)的報告,基于連接泛在的數(shù)據(jù)量一直呈指數(shù)增長趨勢,2016年約為20ZB,預(yù)估到2025年將達(dá)到175ZB。不過,這些數(shù)據(jù)主要是傳感器和人類行為自動記錄的數(shù)據(jù),不包括非數(shù)字時代的知識積累數(shù)據(jù)。據(jù)估計,從直立行走到2013年,人類積累的可利用數(shù)據(jù),大約只有5EB,只有2016年數(shù)據(jù)量的0.02%。盡管如此,它依然是我們認(rèn)識人類過去唯一可用的數(shù)據(jù),也是尚未完全數(shù)字化的數(shù)據(jù)。因此,將尚未數(shù)據(jù)化的素材數(shù)據(jù)化是智能革命優(yōu)先需要完成的工作。
在實踐中,這項工作又可以被劃分為兩個階段,即素材像素化階段和像素數(shù)據(jù)化階段。第一階段是將各種材質(zhì)的素材轉(zhuǎn)化為數(shù)字化版本,如圖書、繪畫、遺址、遺存、實物等的數(shù)字版本建設(shè),如中國之外的古登堡計劃、谷歌的數(shù)字化計劃等,以及中國的古籍?dāng)?shù)字化、繪畫數(shù)字化、遺址數(shù)字化、遺存數(shù)字化等。不過,在這個階段,我們只是將各種材質(zhì)的素材轉(zhuǎn)化為可以用計算機存儲的像素數(shù)據(jù),將曾經(jīng)局限于特定物理空間的、有各類限制的素材轉(zhuǎn)變?yōu)榭梢酝ㄟ^計算機網(wǎng)絡(luò)進行存儲和傳輸?shù)乃夭模瑓s依然屬于第一個范式和第二個范式的素材。
只有將像素化的素材數(shù)據(jù)化,才能用第三個范式的方法進行分析,這就是第二階段,將數(shù)字化的像素素材數(shù)據(jù)化。純粹的像素只是顏色的數(shù)值,也具有機器可識別和計算的意義。不過,機器只識別像素,卻不識別像素承載的知識。如果希望機器也能識別像素承載的人類知識,如文本的社會含義、圖畫的人文精神等,就需要人將像素承載的人類知識告訴機器,讓機器有機會學(xué)習(xí)其中的含義、習(xí)得其中的含義、推演其中的含義。人指出像素承載的知識意涵的過程,被稱為標(biāo)注(labelling)。只有被標(biāo)注了知識意涵的像素才是可以用于機器識別和計算進而進行知識創(chuàng)新與積累的數(shù)據(jù),也只有數(shù)據(jù)化的像素素材才真正融入了數(shù)字化素材之中,為新的文科綜合做準(zhǔn)備。
標(biāo)注是一個技術(shù)術(shù)語,指對像素化內(nèi)容承載的人文與社會含義進行標(biāo)記。例如,對一幅畫承載的人物、事件、物品、山水、行動等進行標(biāo)注,以至于僅僅透過標(biāo)注就能反映畫面試圖表達(dá)的內(nèi)容。一個簡化的標(biāo)注可以用人臉的特征點及其之間的關(guān)系來表示(見圖5)。每個人的臉,其特征點位的參數(shù)、特征點位之間關(guān)系的參數(shù)都是不同的,對一張人臉的標(biāo)注既有對特征點位的篩選,還有對特征點位之間關(guān)系刻畫的建模。優(yōu)化的標(biāo)注應(yīng)該滿足如下標(biāo)準(zhǔn):用盡可能少的特征點位和特征點位之間的關(guān)系最大限度地擬合出每一張臉之間的差異性。對包括文本在內(nèi)的像素化素材進行標(biāo)注,顯然不是一個學(xué)科可以獨立完成的,需要多個學(xué)科的協(xié)作,更需要機器尤其是人工智能的支撐,還需要社會化分工的共同努力。不僅各種材質(zhì)的素材在像素化之后需要標(biāo)注,生成的數(shù)據(jù)也需要標(biāo)注。當(dāng)前,數(shù)據(jù)標(biāo)注已經(jīng)成為一個龐大的產(chǎn)業(yè),從知識創(chuàng)造與更新領(lǐng)域擴散到了社會生產(chǎn)領(lǐng)域。
賦予數(shù)據(jù)以意義,便讓數(shù)據(jù)承載了信息,也讓數(shù)據(jù)變成了可以從中發(fā)現(xiàn)或檢驗事物之間關(guān)系模式的信息化素材。文科第三輪范式革命的第三個階段我們稱為數(shù)據(jù)理論化階段,即從數(shù)據(jù)中獲得分科化的理論。圖3的分科化,不僅有對象的細(xì)分,還有觀察視角的細(xì)分。細(xì)分的優(yōu)勢在于可以從特定的視角觀察和理解事物的屬性以及事物之間的關(guān)系模式。一切屬性都以數(shù)據(jù)形態(tài)呈現(xiàn)且攜帶標(biāo)注,便為人類運用計算方法挖掘事物之間的關(guān)系模式提供了機會。以學(xué)科為分野的知識創(chuàng)造與積累便進入了一個新的階段,既可以進行結(jié)構(gòu)和格局的刻畫,還可以進行動態(tài)與演化的刻畫,因為數(shù)據(jù)不是靜態(tài)的,而是流動的。在面對人類無力處理的數(shù)據(jù)量時,在面對動態(tài)與演化刻畫的需求時,算法一躍成為支持人類知識創(chuàng)造與積累的第一技術(shù)與方法。因此,智能范式的基底是算法。
不過,一個學(xué)科的數(shù)據(jù)理論化還不是第三個范式的目標(biāo)。第三個范式應(yīng)該是以算法為底層,同時將第二個范式的人文學(xué)科與社會科學(xué),甚至自然科學(xué)和工程,綜合為基于人工智能支撐的、基于數(shù)據(jù)的理論檢驗和理論發(fā)現(xiàn),輸出的不再是人類試錯式的知識,而是支持人類理解、判斷、決策的,基于理論綜合的科學(xué)依據(jù),這就是我們認(rèn)為的第四個階段,即理論智能化。
鑒于第三輪范式革命的觸發(fā)點是數(shù)字化,而數(shù)字化進程與人機互生密不可分,且人機互生的模式還在不斷的、快速的迭代演進,因此,我們不能以為第三個范式的四個階段是線性推進的。我們認(rèn)為,一個概率更大的模式是四個階段之間呈現(xiàn)為網(wǎng)絡(luò)交互的演進,尤其是基于數(shù)據(jù)的標(biāo)注、理論、智能之間的交互演進。一旦人工智能跨過奇點(singularity),接下來的格局會是什么,就很難預(yù)判了。自然語言大模型、生成式人工智能等向通用人工智能的快速發(fā)展,讓我們很難人為預(yù)估第三個文科范式的具體演進路徑。不過,目標(biāo)應(yīng)該是明確的,那就是基于人機互生的理論智能化。
因此,第三個文科范式的出現(xiàn)不意味著以分科范式為基準(zhǔn)的庫恩范式的失靈,而是需要我們以新的范式來理解文科的知識創(chuàng)造與積累。快速發(fā)展的語言學(xué)一反傳統(tǒng)語言學(xué)對語意的闡釋,從分析語料開始到對自然語言的擬合建模,形成千億級參數(shù)的大模型,成為人工智能發(fā)展最前沿的領(lǐng)域之一,這便是新范式建設(shè)的一個案例。中國政府推動的新文科建設(shè)可以被理解為是新范式建設(shè)的組織化努力,各類數(shù)據(jù)庫的建設(shè)可以被理解為第三個文科范式建設(shè)中第一階段的工作。
四、結(jié)論
數(shù)字化的發(fā)展推動了人類對人文與社會認(rèn)識的發(fā)展,觸發(fā)了人類面向人文與社會的知識創(chuàng)造與積累的第三輪范式革命:智能革命。
第一輪范式革命發(fā)生在認(rèn)知革命之后,伴隨著書寫語言和圖畫的出現(xiàn),對理性的運用推動了人類思辨與邏輯的發(fā)展,以及對自然和社會的解釋,讓人類擺脫了對神諭的依賴、對超人類和超自然力量的信仰,促進人類對自然與社會的認(rèn)識邁進了知識創(chuàng)造與積累的整體性學(xué)術(shù)階段,形成了以知識精英為主體的學(xué)術(shù)范式。
第二輪范式革命發(fā)生在將數(shù)值型計量引入對人文和社會現(xiàn)象的測量和分析之后,即計量革命。統(tǒng)計思維和統(tǒng)計學(xué)的發(fā)展不僅為重新認(rèn)識人文和社會素材提供了工具,還為分析數(shù)值型素材提供了方法和技術(shù),構(gòu)成對第一個文科范式的侵蝕,讓對社會現(xiàn)象的刻畫與分析形成了分離于整體性學(xué)術(shù)的分科知識,也推動了基于細(xì)分對象的分科性的知識創(chuàng)造與積累。第一個文科范式建立的整體性學(xué)術(shù)在分科學(xué)術(shù)的侵蝕下,被分解為人文學(xué)科和社會科學(xué)。第一個從整體性知識系統(tǒng)中分離出來的社會科學(xué)是經(jīng)濟學(xué),隨后是社會學(xué)、政治學(xué)等。計量革命還讓從事知識創(chuàng)造與積累的人形成了一個個共同體,且通過知識生產(chǎn)與知識運用的邏輯一致性體系,推動了個性化且世俗化的知識創(chuàng)造與積累的發(fā)展,形成了以知識應(yīng)用為導(dǎo)向的學(xué)科范式。
第三輪范式革命發(fā)生在數(shù)字化進程中,即智能革命。觸發(fā)第三輪范式革命的轉(zhuǎn)折點在于數(shù)據(jù)的大量積累和一切皆可數(shù)據(jù)化,對數(shù)據(jù)內(nèi)涵的人文與社會屬性的挖掘以及基于數(shù)據(jù)的對事物之間關(guān)系模式的發(fā)現(xiàn)是智能范式的內(nèi)核。從范式的成熟度判斷,第三輪范式革命可能要經(jīng)歷四個階段,當(dāng)下正處在第二階段早期。值得注意的是,與前兩個范式不同,因為機器尤其是人工智能的介入,這輪范式革命的四個階段呈現(xiàn)階段之間交互迭代的格局,在奇點到來之前,人類還在主導(dǎo)著面向人文與社會的知識創(chuàng)造與積累。智能革命引入了機器作為知識創(chuàng)造與積累的力量,形成了人機互生體,而機器的普遍使用既使得在第一、二個文科范式中一直存在的個性化知識創(chuàng)造與積累嬗變?yōu)槿€性化的世俗化的過程,也使得之前的以分科為特點的知識創(chuàng)造與積累重新回到整體性的知識創(chuàng)造與積累狀態(tài)。與第一個文科范式的整體性知識生產(chǎn)不同的是,這個階段的整體性知識生產(chǎn)是以分科性知識創(chuàng)造與積累為前提的新綜合。
給定人的生存具有了制度保障,智能范式再次讓人類對人文與社會的認(rèn)識回歸于滿足人類的精神訴求,在世俗化的知識的社會應(yīng)用中,知識成為人類面向整體性生產(chǎn)和生活的真正的不可或缺的支撐。
聯(lián)系客服