2001年,人類基因組圖譜及初步分析結果首次公布。最新版的人類基因組圖譜名為GRCh38,包含3.1兆億堿基對的信息。
然而,這個被譽為生命科學“登月計劃”的研究項目漏掉了一些重要信息。近日發(fā)表于《自然遺傳學》雜志的一篇文章指出,參考基因組缺失了多達10%的遺傳信息。這些缺失的信息被發(fā)現(xiàn)存在于許多非洲人后裔,以及其他人類群體身上。
存放于倫敦韋爾科姆收藏館Medicine Now展廳的第一套人類基因組圖譜叢書
“人類基因組”實際上只包含了少數(shù)人的基因組。GRCh38的大部分信息只來自于同一個人。與其說這是人類DNA的快照,不如說是一種模板和路線圖,可以讓人們有一個大致的概念,并在個人基因組與“參考基因組”之間進行比較。
我們知道,參考基因組有其局限性,科學家也一直在對其加以補充完善,以便更好地體現(xiàn)當今人類身上發(fā)生的大量變異。然而,上述文章的作者們指出,由于來源有限,參考基因組的用處其實也是有限的?!敖┠?,越來越多的研究人員開始強調獲取和體現(xiàn)不同人群測序數(shù)據(jù)的重要性?!?/p>
上述文章的作者們認為,在目前的情況下,要分析那些血統(tǒng)大大不同于參考基因組血統(tǒng)的人,是一個十分棘手的難題。雖然有些方法可以讓研究人員獲得數(shù)量有限的遺傳多樣性數(shù)據(jù),但更加全面、日益流行的一個方案,是建立面向特定人群的參考基因組。這一項目已經(jīng)在進行當中,對象包括中國人和德系猶太人。
上述文章的第一作者蕾切爾·舍曼(Rachel Sherman)表示,目前沒有“泛基因組”,也就是說,沒有“體現(xiàn)(某)種群所有DNA的基因組圖譜”。細菌有,但人類還沒有。所以,他們打算利用910名非洲后裔的DNA,建立非洲人的泛基因組。這些非洲后裔包括加勒比海人和美國人,他們身上保留了一部分的非洲遺傳多樣性,也擁有各自不同的遺傳歷史。
研究人員將這些人的DNA與參考基因組進行比較,尋找不匹配的長序列。DNA的基本單位是堿基對,也就是雙螺旋梯子上的一級階梯。舍曼和同事試圖尋找長度超過1000個堿基對、與參考基因組不匹配的序列,結果發(fā)現(xiàn)了近3億個堿基對,大約相當于整個參考基因組的10%。
這并不是說,那些信息為非洲人所獨有(其中大約40%的數(shù)據(jù)與韓國人或中國人的基因組相符),而是說,它們也是重要的遺傳信息,雖然在人類身上廣泛出現(xiàn),但沒有涵蓋在人類參考基因組里,因為后者只根據(jù)少數(shù)人的DNA編纂而成。因此,在人類參考基因組里,人類的很多遺傳信息其實并沒有得到反映。
任何研究,如果依靠參考基因組來分析人類基因變異的話,無疑都會錯過這些重要數(shù)據(jù)。
舍曼及其同事表示:“現(xiàn)在,幾乎所有研究都是根據(jù)參考基因組來分析基因變異。就基于人群的人類遺傳學研究而言,單一的參考基因組是不夠的?!彼麄冞€指出,解決辦法之一是,為不同人群建立參考基因組。隨著時間的推移,“包含人類所有DNA”的泛基因組最終將會產(chǎn)生。
這對醫(yī)學具有重大意義。舍曼稱,“如果你是科學家,你尋找的基因變異與某一人群更容易患的某種疾病有關,那么,你會想要將他們的基因組與更能代表那個人群的參考基因組進行對比?!?/p>
不過,即便掌握了非洲人的這些遺傳信息,我們目前也并不清楚,研究特定疾病的科學家可以用這些信息來做些什么。而對于參考基因組未包含的DNA的作用,以及它們在健康或其他基因變異方面扮演的角色,舍曼團隊并沒有進行研究。
面向特定人群的參考基因組也許有助于研究人類的基因變異,但在實驗室之外的現(xiàn)實世界,則可能遇到另外一些困難。非洲人的遺傳信息中,有很多也出現(xiàn)在韓國人身上,這說明不同人群之間并沒有清晰的界線,尤其是在DNA層面上。事實上,界線是非常模糊的;個體能同時擁有多個人群的遺傳特征,一個人的外表并不是其DNA的可靠體現(xiàn)。
讓情況更復雜的是,非洲內(nèi)部有多個人群,這些人群擁有不同的遺傳歷史,而我們對此只是略知皮毛而已。擁有泛非洲基因組,未必能讓我們對非洲人個體之間的差異有更加深入的了解。
雖然遺傳學研究人員都清楚這一點,但如果大眾對此缺乏良好的溝通和了解,那么,面向特定人群的參考基因組在醫(yī)學等領域的應用,也可能面臨一系列新的問題。
翻譯:于波
審校:李莉
編輯:漫倩
聯(lián)系客服