2017年6月16日下午,北京大學人文社會科學研究院“文研論壇”第44期活動在靜園二院二樓會議室舉行。本次論壇主題為“‘e考據(jù)’與文史學門的新機遇”。文研院特邀訪問教授、臺灣清華大學歷史研究所教授黃一農(nóng)擔任引言人,浙江大學文化遺產(chǎn)研究院教授薛龍春主持,文研院訪問教授、荷蘭萊頓大學教授魏希德、中國人民大學歷史學院副教授張瑞龍、北京大學圖書館副研究館員朱本軍參與本次論壇。
首先,主持人對黃一農(nóng)教授作了介紹。黃一農(nóng)教授現(xiàn)任臺灣“中央研究院”院士,1977年畢業(yè)于臺灣新竹清華大學物理系,1985年獲美國哥倫比亞大學物理學博士學位,旋即至麻州大學天文系從事研究,1987年任職于新竹清華大學歷史所,研究涉及天文學史、天主教史、明末清初史、海洋探險史、術數(shù)史、紅學史等領域。黃一農(nóng)教授曾在2012年、2014年分別于華東師范大學、浙江大學舉辦研習營,闡釋了“e考據(jù)”的概念,為年輕學者指出了一條全新的學術研究途徑。主持人介紹結束之后,文研院院長鄧小南為黃一農(nóng)教授頒發(fā)了文研院特邀訪問教授聘書。
鄧小南院長(左)與黃一農(nóng)教授(右)
黃一農(nóng)教授說,他在十多年前研究中西交流史的過程中,資料庫就已出現(xiàn),于是開始研究數(shù)位環(huán)境與工具對傳統(tǒng)文科研究方式的新效益。當時黃一農(nóng)教授的《兩頭蛇:明末清初的新一代天主教徒》出版,何炳棣先生就對他引用的文集數(shù)目之巨大感到極為震驚。黃一農(nóng)教授說,以往文史研究者不可能有機會閱讀100億字以上的古典文獻,而現(xiàn)在的“e考據(jù)”使之成為可能?!癳考據(jù)”有無負作用,能夠運用到什么程度?包括黃一農(nóng)教授在內(nèi),現(xiàn)在學界對其仍在嘗試、摸索的過程中。
黃一農(nóng)教授
黃一農(nóng)教授首先舉了《紅樓夢》中的一處例子。他說,百余年來紅學研究者頗多,但近來,我們能夠在很短的時間內(nèi)深入到以往并未深入到的范疇?!都t樓夢》第二十八回中,黛玉生病,寶玉宣稱配一劑藥,即能藥到病除,這種藥名為“暖香丸”。據(jù)1972年北京人民文學出版社重排的《紅樓夢》(以程乙本為底本)原文:“……頭胎紫河車,人形帶葉參,三百六十兩不足,龜,大何首烏,千年松根茯苓膽”。而此種語詞、語境似乎不甚相合——黃一農(nóng)教授認為此處標點有問題。對于這段話的標點問題,歷來也存在各式各樣的分法,無法達成共識,也沒有人能夠拿出全面而確鑿的證據(jù)證明某種觀點的正確性,這也是許多領域目前都面臨的困局。
黃一農(nóng)教授說,利用對大數(shù)據(jù)的耙梳,我們可以在短時間內(nèi)從一部古醫(yī)書中找到這一配方?,F(xiàn)在能夠大概知道紫河車、帶葉參、何首烏是什么,但各種資料庫均不能查得“茯苓膽”除《紅樓夢》之外的其他用例,這說明“茯苓膽”可能存在形誤。黃一農(nóng)教授梳理大數(shù)據(jù)后,發(fā)現(xiàn)存在一種形似“茯苓膽”的藥材“茯苓脂”,而“茯苓脂”出現(xiàn)于許多詩詞中,并且常與“松根”相關聯(lián)——這說明,“茯苓膽”很可能就是“茯苓脂”之形誤。事實上,《紅樓夢》舒序本中的“茯苓膽”就作“茯苓脂”(也是唯一寫作“茯苓脂”的版本),這使此結論的說服力大大增強。原文“千年松根茯苓脂”,指的就是千年松樹根周圍長出的茯苓脂。另外,“龜大何首烏”也不應斷開。通過檢索不難發(fā)現(xiàn),古書記載,最好的何首烏為人形或動物形;因此,“龜大何首烏”指的正是大如龜、且像龜?shù)暮问诪酢?/p>
黃一農(nóng)教授指出,掌握知識庫是必要的,但必須“問對問題”、“問好問題”。對大數(shù)據(jù)進行耙梳還可以使我們發(fā)現(xiàn),“暖香丸”的配方與一部古醫(yī)書中“秘傳大補元圓”的配方基本相同,而其所記載的對癥也跟黛玉的癥狀相符,這進一步支持了此前的結論。此時又產(chǎn)生了一個疑問:曹雪芹寫《紅樓夢》時并沒有大數(shù)據(jù)資料庫的支持,那么這些關于藥材的知識由何而來?黃一農(nóng)教授此時強調(diào)了建構知識體系的重要性。我們能夠利用到流傳至今的曹雪芹祖父曹寅的藏書目,而其中包含幾十部醫(yī)書,此本恰好在列。這提供了一項間接證據(jù)。
還有一種假說認為,“三百六十兩不足”原為側批內(nèi)容,在傳抄過程中誤抄入正文部分。這句話前后的“頭胎紫河車”、“人形帶葉參”、“龜大何首烏”、“千年松根茯苓膽(脂)”具有統(tǒng)一性,都是將藥材品質(zhì)提升到極致的結果,體現(xiàn)出真實藥方與文學性描述的結合。而要增強這一假說的說服力,最可行的方法是在小說的其他部分找到類似用例。事實上,黃一農(nóng)教授找到了許多類似的案例,例如程甲本中有一處“男蕓跪書一笑”,此處“一笑”很明顯為批語。
以上的問題都是文本閱讀程度深入的反映,以往沒有達成共識的問題,現(xiàn)在都可以用類似的方式進行處理。另一個問題是,對于“e考據(jù)”帶來的超大規(guī)模數(shù)據(jù),我們必須對信息的真?zhèn)斡幸欢ǖ目剂?。黃一農(nóng)教授以研究曹家流傳下來的誥命為例說明這一問題,這些誥命現(xiàn)藏北京大學圖書館。誥命基本使用套語,表面上看,如果僅憑文字內(nèi)容本身,真?zhèn)坞y辨。
黃一農(nóng)教授介紹說,當我們利用“e考據(jù)”檢索某一關鍵詞時,要善于發(fā)現(xiàn)檢索到的信息中是否還存有其他價值,并得到能夠進行進一步檢索的關鍵詞。如此循環(huán)往復,直至學不到新的知識才結束。黃一農(nóng)教授在研究方志庫中的誥命時發(fā)現(xiàn),誥命的時間點必須是頒布恩賜的時間,并且誥命中名詞、形容詞的使用也有很多規(guī)矩——這些都是檢索過程中被重新還原而得到重建的知識。
隨后,黃一農(nóng)教授又談到避諱用字的現(xiàn)象。龍光甸《字學舉隅》中介紹了遇到不同皇帝名字的相關字時如何處理的例子。如道光帝“旻寧”的“寧(寜)”字,在旻寧即位后、咸豐四年后都有不同形式的寫法改易。黃一農(nóng)教授認為,在現(xiàn)在大數(shù)據(jù)的環(huán)境下,對于這些現(xiàn)象,我們雖不能全然相信,卻有機會超越以往的認知。從一個側面觀察,中國不同時代對政府諱例的接受程度是不同的,如何保證一個時代所有文字材料中的某個字都遵循政府的規(guī)定?
以在方志庫中檢索到的“寧”字為例,從筆形位置上看,康熙二十四年出現(xiàn)缺末筆的用例,可能被解釋為后來“挖”的,但嘉慶十八年的“寜”字最后一筆深入到“我”字中,無法“挖”。那么,這個缺末筆的字是不是俗體字?黃一農(nóng)教授強調(diào),“e考據(jù)”時代下傳統(tǒng)知識依然能夠發(fā)揮作用。如果傳統(tǒng)知識過關,我們就知道可以從書法作品中找,如乾隆時期收錄了歷代精彩的法帖作品的《三希堂法帖》。從《三希堂法帖》中的字形可以發(fā)現(xiàn),“寧”字即使在不存在避諱問題的時期也有著各式各樣的寫法。并且,通過《說文解字》我們能夠發(fā)現(xiàn),缺末筆的字形才是正體字,而我們現(xiàn)在寫的“寜”才是俗體字。
最后,黃一農(nóng)教授對“e考據(jù)”的概念進行了概括總結。首先,“e考據(jù)”是在大數(shù)據(jù)時代融通數(shù)位與傳統(tǒng)的一種新研究方法;其次,“e考據(jù)”的核心不僅在于以尋找資料為目的瀏覽檢索(當然包含搜尋技巧),更在于研究思維與學習態(tài)度。黃一農(nóng)教授說,文史研究在大數(shù)據(jù)時代缺乏的往往不是資料,而是對資料的敏感度、解析力與整合力。在“e考據(jù)”中,最難的是經(jīng)營模式(business model)的提出——也就是構思可行性較高的解決問題的邏輯論辯過程,接著才是搜尋工具與方法的選擇問題。
黃一農(nóng)教授發(fā)言之后,薛龍春教授以“e考據(jù)與尺牘研究”為主題展開演講。薛龍春教授指出,在今天的學術環(huán)境下,“e時代”提供了一種解決過去難以解決或不可能解決的問題的機會。隨后,薛龍春教授通過殷廷樞《與念老年親翁》、王寵《與長兄札》等五種個例討論這一問題,并詳細介紹了通過檢索資料庫逐步考證這些材料中某處人物代稱具體所指代人物信息的過程。薛龍春教授強調(diào),在此過程中,對關鍵詞的把握十分重要——善于把控姓氏、職務等關鍵詞信息能夠大幅減小搜索范圍;另一方面,研究一個人物時必須細讀與他相關的所有文獻,因為某些重要的關鍵詞信息可能并不存在于當前文獻,但存在于與主要人物相關的其他文獻。
最后,薛龍春教授指出,“e考據(jù)”提供了海量的信息,但所有的信息都在一個層位上,如果沒有對相關知識的掌握,很可能犯錯。在錯誤率上,方志庫稍低(20%左右),基本古籍庫更高,但如此高的錯誤率對于學術研究是絕不能容忍的。薛龍春教授還指出,日記、信札等稿本材料,許多都藏于圖書館中而未被整理。對這些材料進行數(shù)據(jù)化處理,不僅是必要的,也是漫長的。另外,從圖像分析的角度來看,“e考據(jù)”將帶來藝術史研究的轉機。
薛龍春教授
張瑞龍副教授指出,現(xiàn)在的數(shù)據(jù)庫大部分是商業(yè)運作的結果,這導致了很高的錯誤率。如何利用傳統(tǒng)素養(yǎng)、專業(yè)知識明辨正誤,尤顯重要。張瑞龍副教授從“閏八月不詳”的問題談起,以從思想史到術數(shù)史的多個具體實例說明如何在運用數(shù)據(jù)庫收集材料時做到與傳統(tǒng)素養(yǎng)和知識相結合的要求,避免因誤用偽造的材料而降低研究結論的說服力這一情況。
張瑞龍副教授
魏希德教授指出,數(shù)位人文不只提供新的檢索方法,還可以創(chuàng)造出新的思維方式。“e考據(jù)”目前正處于起步階段,對于人文科學研究者,這些可能性是以前所不能達到的,既是機會,也是挑戰(zhàn)。在圖像處理的領域,“e考據(jù)”還能從筆跡分析等角度提供考證的依據(jù)。因此,“e考據(jù)”與以往考據(jù)模式的一個不同點就是,它能夠從宏觀角度去尋找一些微觀問題的答案。
對于黃一農(nóng)教授提出的新的“經(jīng)營模式”,魏希德教授提出一個問題:這種“經(jīng)營模式”應該由誰負責?是創(chuàng)始人、運營人還是包括學生在內(nèi)的使用者們?隨后,與會嘉賓共同討論了目前數(shù)據(jù)庫商業(yè)運作導致高錯誤率的可能解決方法。黃一農(nóng)教授說,他自己就是許多數(shù)據(jù)庫的高級用戶(power user)。理論上,數(shù)據(jù)庫的經(jīng)營者應向高級用戶收集使用情況反饋以改善用戶體驗,但事實上并沒有——這可能是其商業(yè)本質(zhì)所導致的。黃一農(nóng)教授說,相關的文科研究者可以組成一個共同體,共同從買方角度制約賣方提供的數(shù)據(jù)庫質(zhì)量。
魏希德教授
朱本軍館員指出,“e考據(jù)”在未來可能拓寬到更大的市場范圍——不僅提供資料的檢索功能,還能在所有古籍數(shù)字化的基礎上做語義關聯(lián)。例如,找北宋的“蘇洵”,系統(tǒng)就能夠建立與南宋宰相王柏的關聯(lián),所揭示的材料范圍會遠大于簡單檢索得到的材料范圍。朱本軍館員說,目前屬于應全部實現(xiàn)數(shù)字化但尚未做到的時期。我們可以通過簡單的檢索得到想要的信息,但一旦所有典籍數(shù)字化,反而可能得到大量無用的信息,而過濾無用信息的代價將被提高。另一方面,關于黃一農(nóng)教授提到的北大圖書館藏曹氏父子誥敕的真?zhèn)螁栴},朱本軍館員認為,不能僅憑文本信息判斷真?zhèn)巍谋拘畔⒅幸恍┎缓铣@淼牟糠挚赡苁且恍└鼜碗s的原因所導致的。因此,與文學領域相比,史學領域的文本分析要更加謹慎。
朱本軍館員
對此,黃一農(nóng)教授回應說,“e考據(jù)”目前尚不能解決所有的問題。以明清為例,還有相當多的詩文、家譜等材料未被數(shù)位化;但與上一代研究者相比,“e考據(jù)”提供的研究條件已經(jīng)遠勝以往。許多上一代無法解決的問題目前已經(jīng)被解決,但仍不能解決的問題也依然存在。黃一農(nóng)教授說,“e考據(jù)”模式尚處于起步階段,材料數(shù)量的增長速度非??欤寒斍暗牟牧狭繛?00億字,一年后就可能是150億字了,甚至更多。
對于北大圖書館藏曹氏父子誥敕的真?zhèn)螁栴},黃一農(nóng)教授承認,不能僅憑文本辨別,但他的判斷是以誥命文本整體的嚴謹性和數(shù)千份其他同類文本中無他“追封”用例為依據(jù)的。又如,《紅樓夢》中賈敬去世時用“賓天”二字非常奇怪。《漢語大字典》中的“賓天”有“帝王去世”和“尊貴人物去世”兩個義項,而后者的例證剛好使用的是《紅樓夢》中的這個例子。此外,黃一農(nóng)教授用“雕龍”資料庫檢索時發(fā)現(xiàn),《續(xù)修四庫全書》中有四百多處“賓天”的例子,除了三處分別表示皇后、皇子、皇女去世外,沒有一處是表示一般尊貴人物去世的。黃一農(nóng)教授指出,善于利用“e考據(jù)”能夠使知識的深度和完整度更加豐富,而文學領域的研究最有可能在此方面得到進一步發(fā)展的可能性。
鄧小南教授認為,“e考據(jù)”所帶來的挑戰(zhàn)性更強于其機遇性。在龐大的材料礦藏面前,材料發(fā)掘者的勤奮度、思維路向、提問方式、問題指向等因素都將直接影響材料發(fā)掘的結果。因此,在知識儲備有限的情況下,我們要明確搜索的方法和所要警惕的問題。鄧小南教授重申了黃一農(nóng)教授、張瑞龍副教授所強調(diào)的傳統(tǒng)知識與素養(yǎng)的重要性,并指出,對于檢索得到的文字材料,我們必須厘清其文本脈絡。
黃一農(nóng)教授最后總結說,在實現(xiàn)傳統(tǒng)與數(shù)位相融合的過程中,方向、態(tài)度的正確性尤為重要。他發(fā)現(xiàn),有些人通過資料檢索的方式,在很短時間內(nèi)進入新的領域;但由于缺失基礎積累,未經(jīng)受文科專業(yè)的訓練且不懂得基礎的考據(jù),若僅憑自己發(fā)揮,往往犯錯而不自知。因此,“e考據(jù)”雖能夠縮短進入研究領域門檻的時間,但不能被過度依賴。目前,文科資料庫資源有限,有大量未被數(shù)位化的重要文本存在,我們應投入到原始資料的數(shù)位化中。黃一農(nóng)教授還指出,通過簡單的檢索而得到答案并不意味著問題的解決。在此基礎之上,我們更應使用傳統(tǒng)方式去研究文本中的其他內(nèi)容,從而提高知識的深度與完整度。因此,黃一農(nóng)教授對后輩研究者寄予希望,希望他們能夠將搜索方法與傳統(tǒng)知識相結合。
責任編輯:陳啟凡
聯(lián)系客服