本論文由復(fù)旦大學(xué)金力院士團隊完成,綜合運用語言學(xué)和遺傳學(xué)等多學(xué)科交叉的分析方法,揭示了世界第二大語系漢藏語系起源及分化的時間和地點。該研究為探尋中華文明的起源和發(fā)展歷程,了解中國及周邊鄰國的各漢藏語系語言之間的演化關(guān)系提供了重要依據(jù),為認(rèn)識東亞人群遷徙歷史提供了重要啟示。
漢語、藏語、羌語、緬語等400多種東亞語言被認(rèn)為擁有共同的祖先語言,合稱為漢藏語系。該語系是世界第二大的語系,母語使用人數(shù)僅次于印歐語系。一直以來,語言學(xué)家對漢藏語系內(nèi)部各語支親緣關(guān)系、分化時間以及起源地點長期存在爭議?!氨狈狡鹪醇僬f”認(rèn)為它起源于大約4,000–6,000年前中國北方的黃河流域,而“西南起源假說”則認(rèn)為它起源于至少9000年前的東亞西南部某地。
復(fù)旦大學(xué)金力院士團隊通過對109種漢藏語系語言的近千個詞匯詞根-語義組合(root-meaning)進行譜系建模分析,歷時兩年多,重構(gòu)了漢藏語系諸語言間的親緣關(guān)系,并以此推算了漢藏語系的分化時間和起源地。該研究支持了東亞地區(qū)漢藏語系諸多語言的同源關(guān)系;證實了漢語從原始漢藏語分離成獨立語族(支)的觀點,并且漢藏語系中的其余語言構(gòu)成一個單系語言群,即為藏緬語族;估計了原始漢藏語分化成現(xiàn)代語言的最早年代在距今約5900年前,地點可能在中國北方,因此該語系的起源和分化可能與仰韶文化及馬家窯文化的發(fā)展有著密切的關(guān)系。以上發(fā)現(xiàn)與“北方起源假說”相符,也符合語言隨農(nóng)業(yè)擴散的觀點,而且擴散的時間點與考古證據(jù)相符——此前的考古證據(jù)揭示出獨特建筑形式和陶器類型向南擴散的特征。
國內(nèi)語言學(xué)家評論
這個研究結(jié)果從某些方面證明Starosta(2000)對原始漢-藏-高加索語的假設(shè),也部分支持了他對中國遠古小米和大米兩個不同農(nóng)業(yè)區(qū)域的劃分。有點兒偏離“主流”,確實出人意料,但很刺激。希望今后也能在Nature上看到論證漢藏和南島語發(fā)生學(xué)的文章。
金力他們的研究與“漢藏同源——因此造成漢語VO-OV語序混合以及漢語中存在大量施通格句法配置”理論一致。(藏語是施通格語言,藏語也是OV語言)。
關(guān)于歷史比較語言學(xué)與分子遺傳學(xué)的合作研究
1. 進化生物學(xué)的貝葉斯系統(tǒng)發(fā)育方法,對概率的理解是人們對某些事件的一種信任程度,是對事物不確定性的一種主觀判斷,與個人因素等有關(guān),故稱之為主觀概率。
2. 歷史比較語言學(xué)與分子遺傳學(xué)的合作應(yīng)該建立在各自獨立成果基礎(chǔ)之上,不宜拿語源單位當(dāng)作基因直接套用數(shù)學(xué)模型(貝葉斯系統(tǒng)發(fā)育方法)做數(shù)學(xué)分析?;蛑械?和1是從有機物質(zhì)中分析出的,而語源單位是否相同的這0和1是人為判定的。
3. 人類分子生物學(xué)和史前語言人群分布可以交叉研究,但這種探源性研究與依據(jù)語言資料比較有別,因為史前語言人群沒有留存當(dāng)時的語言資料。這種研究應(yīng)當(dāng)明確為語言資料歷史比較和人類分子生物學(xué)之間的映射研究。
4. 也就是說,務(wù)必區(qū)分有文獻比較和無文獻探討之間的區(qū)別。語言歷史比較是本證,其他都是參證(分子生物學(xué)、人類體質(zhì)學(xué)、考古文化學(xué)、歷史文獻學(xué)、民族文化學(xué)等)。當(dāng)然,參證也有不同程度的價值。
5. 有些方法看起來很精密,其實精密方法的背后卻存在若干模糊。比如說,關(guān)于語言比較的幾十個義根單位,它們各自最早出現(xiàn)于什么年代,它們之間那些是各自本有的,也就是從遠古繼承下來的,那些是外來的,即通過接觸借來的。如果這份資料沒有嚴(yán)格鑒定,那么接下來的所有模式比較都可能增強主觀性。
6. 生物學(xué)的譜系樹不宜機械搬用到語言歷史比較研究中來,因為語言的發(fā)展是多向交叉。一般而言,它不是一個以主干為分叉的簡單譜系樹模式(印歐語系是個特例,而且并非純粹的特例。更為純粹的特例是閃米特語系),而是一個復(fù)雜的多向交叉方式,通過人群遷徙、文化接觸和異群通婚等一系列社會活動而導(dǎo)致語言變化。如果一定要建譜系樹,那么應(yīng)當(dāng)是多維交叉型譜系樹。
7. 關(guān)于漢藏語言在中國北方出現(xiàn),并在大約5900年前開始分裂。這種主觀概率或或然性假說,并沒有超過美國帥德樂(Stanley Starosta, 1939-2002)2001年提出的“原始東亞語群說”的范圍。
8. 漢語的形成,這里主要是指夏商周三代華夏語的形成,并不是簡單的漢藏語分家?;蛘哒f,“原始漢藏語”也只是華夏漢語來源的一部分。否則語言學(xué)家也就不會提出漢-歐同源說、漢-高(高加索-葉尼塞)同源說、漢-阿(阿爾泰)同源說、漢-烏(烏拉爾)同源說,也就不會提出漢語與南島語或南亞語具有親緣關(guān)系。因此漢語的形成是復(fù)雜的,如果僅僅將目光放在西部,放在黃河上游(漢藏同源說),而不關(guān)注黃河中下游以及長江流域,那么華夏漢語的起源是講不清楚的。
附:@四毋齋(洪波)近年來的語言接觸研究表明:兩個操不同語言的族群如果在較長時間內(nèi)保持相對單向的通婚關(guān)系,則逐步形成一種混合型語言,該語言基本保持著父系族群語言的詞匯,而主要繼承母系族群語言的形態(tài)句法?;诖?,語言親緣關(guān)系就不能單方面只考慮詞匯,反之亦然。金先生及其團隊的工作最多只能證明在詞匯上漢語跟藏緬語關(guān)系更密切。七世紀(jì)藏文所反映的藏語形態(tài)跟春秋戰(zhàn)國時期文獻所反映的形態(tài)有些有著高度的平行關(guān)系或一致關(guān)系,我們認(rèn)為這種平行關(guān)系或一致關(guān)系較難推嬗到原始共同語時期,更有可能是周人竄于戎狄時期所獲得的,然后帶到上古漢語當(dāng)中的。
語言既然是歷史與社會的產(chǎn)物,自然也可以從語言和語言的變遷中找到歷史與社會的變遷。(不過)在此之前的人又是從哪里來?說什么話?
遺傳學(xué)數(shù)據(jù)是否有利于弄清楚語言發(fā)生學(xué)的來龍去脈,很讓人疑惑。不知道結(jié)合遺傳學(xué)的數(shù)據(jù),能不能測出來一個長江流域的漢族人有朝一日會說一口流利的洋涇浜英語。語言可以被和平地或者暴力地徹底替換,遺傳信息似乎不容易被大規(guī)模徹底替換。
研究通過對109種漢藏語系語言近千個詞匯詞根-語義組合的譜系建模分析,重構(gòu)了漢藏語系諸語言間的親緣關(guān)系,真的覺得非常偉大。只是我不太理解,譜系關(guān)系對漢藏語系分化時間和起源地的推測能提供神馬依據(jù)?最早的甲骨文好像是三、四千年前的事情。再早就沒有文字記錄了。這只是漢字,不知其他108語言的文字記錄有多早,難道都有三千多年前的文字形態(tài)?憑晚一千多年的文字殘片所形成的譜系關(guān)系就能推導(dǎo)出距今約5900年前的文字分布和關(guān)系?而且確定地點?這依據(jù)真是高深。后悔恢復(fù)高考時沒學(xué)理科了,跟不上節(jié)奏。不懂啊,到了這把年紀(jì),學(xué)習(xí)也不可能了。感覺現(xiàn)在深陷批評理論的蜘蛛網(wǎng),成天神經(jīng)兮兮滴疑心。
應(yīng)該這么說,他們其實是按照他們行業(yè)里可以接受的規(guī)則做的研究,至于到底是不是這樣,天曉得呀。就像那些天文學(xué)家,根據(jù)一個小點pixel來說這是個全部被水覆蓋的行星,在幾百萬光年之外。當(dāng)然到底是不是這樣?天曉得呢。所謂的科學(xué)研究,也就是根據(jù)行業(yè)接受的規(guī)則進行的大膽想象而已。
一切的探索都是可貴的,學(xué)科交叉研究是一個重要方問。但發(fā)表了文章,并不等于就是定論。純粹從語言學(xué)的角度考慮,該研究項目所采用的材料是否具有同質(zhì)性(比如如何保證“同源詞”都是真實有效的,而沒有混入借詞),所采用的各語種材料是否具有共時性(很多語言根本無法提供古代材料,好像藏語的古籍資料也早不過唐代)……這些都是從事這類研究在語言學(xué)上的難題,如果他們的研究未能在這些方面有重要突破,結(jié)論的可信度有多大,現(xiàn)在還很難說。
是的,涉及的變量太多,牽一發(fā)而動全身,一個數(shù)據(jù)有問題就可能產(chǎn)生蝴蝶效應(yīng),導(dǎo)致結(jié)果偏差。我覺得他們主要是用不同民族的遺傳學(xué)基因測定來做的,語言學(xué)證據(jù)只是輔助,所以才發(fā)在《自然》上。
聯(lián)系客服