“李、杜在中國詩歌史上一直雙雄并峙,但從名篇的數(shù)量來看,李白稍遜于杜甫。”4月29日,我國著名詩詞專家,王兆鵬做客上海古籍書店,以“唐詩大數(shù)據(jù)”為題,跟大家講了講大數(shù)據(jù)時代下的詩詞研究。
中國有句俗語,說“文無第一,武無第二”,練武可以出來一較高下,可作文章卻不一樣,很難分出高低來。這一方面是因為判斷標(biāo)準(zhǔn)的不同,一方面也是因為比較的因素很難被量化。但王兆鵬卻說,這是大數(shù)據(jù)的時代,以往只能作定性的文學(xué)研究,如今也可以作定量分析,并且作出的結(jié)論也須要數(shù)據(jù)的支撐。所以在王兆鵬的排行榜上,我們可以看到誰的作品影響力更大,李白和杜甫誰更厲害。
《黃鶴樓》奪得唐詩第一,杜甫、李白分列詩人前二
先來看一看排行榜。根據(jù)采集到的大量數(shù)據(jù),王兆鵬制作了自己的數(shù)據(jù)庫和排行榜,如唐詩的百首名篇排行榜、十大詩人排行榜。唐詩的第一名篇是崔顥的《黃鶴樓》。十大名篇,依次是:崔顥《黃鶴樓》、王之渙《涼州詞》(黃河遠(yuǎn)上白云間)、杜甫《登高》、王之渙《登鸛雀樓》、張繼《楓橋夜泊》、李白《蜀道難》、杜甫《登岳陽樓》、柳宗元《登柳州城樓》、王勃《送杜少府之任蜀州》、白居易《琵琶行》、杜甫《聞官軍收河南河北》、王灣《次北固山下》。由于末三首得分完全相同,難分高下,故十大名篇實際為12篇。在這十大名篇中,杜甫獨占3首,王之渙占2首,其他7人各為1首。
百首名篇,由36人分占,人均2.8篇,超過平均數(shù)3篇以上的正好是10人(另占2篇的4人、1篇的22人)。三百首名篇(含百首名篇),由74人分?jǐn)偅司?篇,達(dá)到4篇以上的為21人,另占3篇的4人、2篇的13人、1篇的36人。有趣的是,在這三百首名篇之中,名列前十位的也正好是百首名篇中位居前列的十家,除第九名的白居易和第十名的岑參名次略有變化之外,其他八人的名次完全相同。所以,王兆鵬據(jù)此制作了十大詩人排行榜:第一名:杜甫、第二名:李白、第三名:王維,以下依次是:李商隱、杜牧、王昌齡、孟浩然、劉禹錫、白居易、岑參。
“李、杜在中國詩歌史上一直雙雄并峙,但從名篇的數(shù)量來看,李白稍遜于杜甫?!蓖跽座i說道,“杜、李、王三人高居榜首,可稱唐詩的三大‘天王’。尤其是杜、李,作為唐代詩壇的雙子星座,分別以詩圣、詩仙之名震耀千秋,他倆創(chuàng)作的名篇數(shù)量之多亦分別居前一、二名。在百首名篇中,杜甫有16首,占百首名篇的16%,其次是李白,為13首,占13%。再從三百首名篇來看,也是杜甫和李白最多,二人分別為52首和38首,分別占17%和13%。二人在百首名篇和三百首名篇中所占比例基本相同。由此可見,詩圣杜甫和詩仙李白二人在中國詩史上的崇高地位,的確是不可移易的?!?/p>
對崔顥的《黃鶴樓》奪得榜首,王兆鵬也表示很意外,但也做了分析。首先,它得益于“第一發(fā)現(xiàn)人”——大詩人李白的高度認(rèn)可和贊譽。李白讀此詩后曾感嘆“眼前有景道不得,崔顥題詩在上頭”,自以為難以企及和超越。這無疑極大地提高了此詩的知名度。其次,歷代詩評家也曾給予極高的評價,如宋代嚴(yán)羽的《滄浪詩話·詩評》說:“唐人七言律詩,當(dāng)以崔顥《黃鶴樓》為第一?!?再從選本的情況來看,唐宋以來的選本,都高度關(guān)注此詩。
蘇軾最愛往外跑,留名篇的大多是外地人
大數(shù)據(jù)不僅可以作排行榜,還可以得出很多有意思的結(jié)論。王兆鵬一直以來都致力于詩詞的量化研究,前不久,由王兆鵬主持制作的《唐宋文學(xué)編年地圖》歷時五年成功上線。作家的年譜是以時間為軸線的,而他們的行走軌跡則需要自己去查閱歷史地圖才能確定空間位置。這兩者的文獻(xiàn)資料大多是分散的,查閱時很不方便?!叭绻馨亚叭说哪曜V和行走軌跡全部結(jié)合起來,打通時空的維度,這將會為大家提供很大的便利?!蓖跽座i曾在采訪中說道。
現(xiàn)在,有了這樣一張電子地圖,我們就可以清晰地知道一個作家一生的行跡以及在何地寫了哪些作品。點開地圖上的城市名稱,就能看到有多少詩人來過、在這里寫下了多少詩;選擇一位詩人,則能看到他一生活動的軌跡。
誰是最愛往外跑的詩人呢?王兆鵬認(rèn)為大概是蘇軾:“他一生的軌跡信息高達(dá)近萬條,遍布全國各地,我們統(tǒng)計和錄入時都累壞了!”
根據(jù)這些信息,還可以知道唐宋詩人地域的分布格局。據(jù)介紹,唐代有時代。籍貫可考的詩人有1686人,北方詩人有949人,占56.3%;南方為737人,占43.7%,北方略占優(yōu)勢。到了宋代,北方詩人為786人,南方為4908人,占86.2%,南方占絕對優(yōu)勢。而浙江一省就有1437人,占到25.2%,一省詩人占了全國的四分之一。在唐代,河南籍的詩人最多,有236人,占了15.6%。
詩人不僅在地域上南北分布是不均衡的,在落后發(fā)達(dá)地區(qū)分布也是不均衡的,但結(jié)果出乎意料。據(jù)王兆鵬介紹,詩人雖然都是向文化政治中心集中,但是創(chuàng)作的優(yōu)秀作品大多在落后的地區(qū)完成,在失意受貶謫的地區(qū)才更可能誕生名篇。而且優(yōu)秀作品的作者大多不是本地人。“比如黃州、惠州打名片就愛說蘇軾,可蘇軾是四川人,寫黃鶴樓那么多名篇,可沒有一個人是湖北人寫的。”王兆鵬說道。
大數(shù)據(jù)視野下的詩詞研究
王兆鵬是從自己的方法論——數(shù)據(jù)采集講起的。唐詩需要哪些數(shù)據(jù)呢?王兆鵬認(rèn)為,數(shù)據(jù)的采集主要有三個方面:一:作家數(shù)據(jù),其中包括時間、地域、身份諸項,即作家的生卒年月、創(chuàng)作起始時間、出生地、去世地、活動地點和在社會上扮演的身份等。二:作品數(shù)據(jù),即作品的分體、分類、版本、編年、系地等諸項因素。三:讀者數(shù)據(jù),其中又有普通型讀者、專家型讀者和作家型讀者三項分別。
數(shù)據(jù)又從哪里來呢?以唐詩為例,如作家、作品數(shù)據(jù)就可以根據(jù)現(xiàn)有的文獻(xiàn)資料進行采集,如《全唐詩》、《全唐文》、《中國文學(xué)家大辭典》和諸多的年譜及生平考證等。如果說作家作品的數(shù)據(jù)是靜態(tài)的,那么讀者數(shù)據(jù)就是動態(tài)的。要判斷一個詩人、一部作品的影響就得大量采集讀者數(shù)據(jù)。針對普通型讀者,王兆鵬認(rèn)為就可以根據(jù)歷史上的各種詩歌選本,采用唐宋金元明清以及現(xiàn)當(dāng)代有代表性的70種詩歌選本進行統(tǒng)計,看每首作品入選的次數(shù)是多少。入選率越高,表明其受歡迎的程度越高。還可以根據(jù)網(wǎng)絡(luò)上的數(shù)據(jù),統(tǒng)計一首詩出現(xiàn)的頻率有多少。還有根據(jù)被引用的頻率判斷哪一首詩進入日常生活。針對專家型讀者,就得采集評點資料和研究論文的相關(guān)數(shù)據(jù)。每種資料對作品的評點,無論是褒是貶,是藝術(shù)分析還是記述本事,都按一次來統(tǒng)計。評點的次數(shù)越多,說明作品受關(guān)注的程度越高。反之亦然。
針對作家型讀者這一項,王兆鵬指出,數(shù)據(jù)的采集相對有難度,比如要判斷一個詩人是否對另一個詩人有“追和”和效仿,如何去定量分析的工作就很少有人做。但計算機的技術(shù)是成熟的,需要我們更進一步地對文學(xué)的量化,比如用計算機研究宋詞的“追和”就比較容易些,因為它有特定的句式和用韻?!暗且阉兴卧~中的‘追和’都找到,那可能一年都搞不定,但是用計算機兩個小時就搞定了。只有你想不到的問題,沒有計算機解決不了的問題?!蓖跽座i說道,“我們現(xiàn)在的研究盡可能用計算機來處理,這可以提高工作效率和文獻(xiàn)使用率?!?/p>
王兆鵬認(rèn)為,雖然排行榜只有相對的意義,可反映其影響力的大小,而不是絕對的價值衡定。但是數(shù)據(jù)得出的結(jié)論并不是個人主觀的結(jié)論,“數(shù)據(jù)不能解決所有的問題,但是能解決以前解決不了的問題?!蓖跽座i說道,“定量分析不能替代定性分析,未來的文學(xué)研究應(yīng)該是定性與定量研究并行,主觀判斷往往是靠不住的,大數(shù)據(jù)時代的結(jié)論需要數(shù)據(jù)支持?!?/p>
*文匯獨家稿件,轉(zhuǎn)載請注明出處。
聯(lián)系客服