2023年6月14日,復(fù)旦大學(xué)、西安交大、中國醫(yī)學(xué)科學(xué)院等26家單位聯(lián)合在Nature上發(fā)表了文章A Pangenome Reference of 36 Chinese populations(基于36個(gè)族群的中國人泛基因組參考圖譜),發(fā)布了中國人群泛基因組聯(lián)盟(CPC)一期研究進(jìn)展。據(jù)悉,這是我國學(xué)者領(lǐng)導(dǎo)的人群基因組研究首次發(fā)表在Nature雜志。
這項(xiàng)研究初步構(gòu)建了我國人群的泛基因組參考圖譜,發(fā)現(xiàn)了在人類通用參考基因組上缺失的約1.9億個(gè)堿基對的參考序列;新鑒定了約580萬個(gè)點(diǎn)突變或小變異以及3.4萬個(gè)結(jié)構(gòu)變異,涉及大量潛在功能原件包括至少1367個(gè)蛋白質(zhì)編碼基因;并發(fā)現(xiàn)通用參考基因組上缺失的參考序列富集了適應(yīng)性演化和起源于遠(yuǎn)古人類的遺傳變異,并且與角質(zhì)化、紫外線輻射應(yīng)激、DNA 修復(fù)、免疫反應(yīng)以及壽命等表型或功能相關(guān)。這項(xiàng)研究也顯示了,建立我國自己的人群泛基因組圖譜十分必要。在重構(gòu)人類演化歷程、挽回復(fù)雜疾病研究時(shí)“丟失的遺傳率”等研究和應(yīng)用中,該圖譜具有巨大的潛在價(jià)值。
人類參考基因組是廣泛用于人類遺傳學(xué)和醫(yī)學(xué)研究的遺傳密碼“導(dǎo)航圖”,也是解析人類起源與演化、解析人類表型和疾病的遺傳基礎(chǔ)的根基。上世紀(jì)末“人類基因組計(jì)劃”啟動(dòng)后的20年里,人類參考基因組作為生命、醫(yī)學(xué)等研究領(lǐng)域的基石見證著人類在探索生命奧秘的漫漫征途上留下的或深或淺的足跡。從2001年首次發(fā)表人類基因組草圖,人類參考基因組經(jīng)歷了數(shù)十次的更新迭代,發(fā)展到目前廣泛使用的第38版本(GRCh38)。直到2022年從“端粒到端?!甭?lián)盟(T2T)構(gòu)建的“無缺口”的T2T-CHM13參考基因組完成圖,所有涉及人類遺傳學(xué)的研究仍然依賴于線性參考基因組。今年正值國際人類基因組計(jì)劃(HGP)完成20周年,人類參考基因組從“線性一維序列”過渡到“泛基因組多維圖譜”。實(shí)際上,基因組的組裝一開始就借助了數(shù)學(xué)中的“圖論”思想和理論,加之計(jì)算機(jī)算法,實(shí)現(xiàn)了特定物種基因組元件的順序排列。泛基因組(Pangenome)(3篇Nature+1篇NBT | 人類泛基因組計(jì)劃)進(jìn)一步借助圖論的思想和計(jì)算技術(shù),將人類多個(gè)族群的代表性樣本的具有多樣性的基因序列以多維圖譜形式組裝起來,形成一個(gè)能充分反映種群基因組結(jié)構(gòu)變異多樣性的導(dǎo)航圖,從而指導(dǎo)進(jìn)一步的遺傳學(xué)和醫(yī)學(xué)研究。
隨著DNA測序和基因組組裝技術(shù)以及計(jì)算分析方法的大幅改進(jìn),富含個(gè)體遺傳多樣性信息的圖泛基因組替代線性基因組作為人類參考基因組的趨勢將很快成為現(xiàn)實(shí)。在人類基因組計(jì)劃成立之初,盡管中國作為唯一的發(fā)展中國家參與并為人類基因組參考圖構(gòu)建作出貢獻(xiàn),促成人類科技史的重要里程碑上刻有“中國”二字,但目前通用的人類參考基因組皆基于歐洲白人為主體樣本構(gòu)建,難以代表非歐裔族群、尤其我國族群的基因組多樣性。即便是最新發(fā)表的人類泛基因組國際聯(lián)盟(HPRC)收集了全球范圍的46例樣本,也僅包含3例中國漢族樣本。
作為人口大國,我國巨大的人口基數(shù)和豐富的人群多樣性是發(fā)展人類基因組學(xué)和精準(zhǔn)醫(yī)學(xué)的重要優(yōu)勢:西南部高原地區(qū)分布著眾多藏緬、南亞語系族群,東西方人群在西北部絲綢之路沿線交融,苗瑤語族人群在云貴地區(qū)世代繁衍,蒙古、突厥人群曾游牧于北部風(fēng)沙地,通古斯語族抵抗嚴(yán)寒一路向北,臺(tái)-卡岱(侗臺(tái))族群的先輩亦曾穿梭于南方叢林河谷(圖1 CPC族群畫像集)。悠久的人群歷史、豐富的地理氣候環(huán)境,塑造了中華民族獨(dú)特的遺傳多樣性,構(gòu)成了人類泛基因組研究不可或缺的東方畫卷。構(gòu)建能夠代表中華民族遺傳多樣性的中國人群泛基因組圖譜勢在必行且迫在眉睫,這將極大提高捕獲罕見或低頻遺傳變異的靈敏度和準(zhǔn)確性,支撐服務(wù)中國人遺傳多樣性研究、復(fù)雜疾病分子機(jī)制研究和精準(zhǔn)醫(yī)學(xué)研究與應(yīng)用。
圖1 “中國人群泛基因組聯(lián)盟”一期36個(gè)族群畫像集
為了構(gòu)建高質(zhì)量高精度的中國人群泛基因組參考圖譜,復(fù)旦大學(xué)徐書華教授、西安交通大學(xué)葉凱教授聯(lián)合國內(nèi)26家單位發(fā)起了中國人群泛基因組聯(lián)盟(Chinese Pangenome Consortium, CPC),旨在建立我國專屬參考基因組和泛基因組資源和分析體系,形成我國自主可控的人類基因組資源與核心技術(shù),支撐精準(zhǔn)醫(yī)學(xué)發(fā)展,服務(wù)“健康中國”戰(zhàn)略。
在其第一期研究計(jì)劃中,CPC對代表中國36個(gè)族群的58個(gè)樣本采用最新的第三代高保真基因組測序技術(shù)進(jìn)行了深度測序,結(jié)合最新的單倍型基因組組裝方法,獲取了116個(gè)高質(zhì)量單倍型基因組,并以圖基因組的方式構(gòu)建了高質(zhì)量中國人群參考泛基因組。該泛基因組圖譜總共包含約3.01 Gb個(gè)堿基對的序列信息,在現(xiàn)有人類參考基因組的基礎(chǔ)上新增了約1.9億個(gè)堿基對的新序列,包含約590萬個(gè)小變異(單核苷酸多態(tài)性變異和小規(guī)模插入/缺失變異)和約3.4萬個(gè)結(jié)構(gòu)變異(Structural variation, SV),涉及至少1367個(gè)蛋白編碼基因復(fù)制事件等。其中,約500萬個(gè)堿基對新序列存在于95%以上的單倍型中,被視為中國人群基因組核心序列,可能與中國人群特有的較為穩(wěn)定的生物學(xué)功能或表型特征相關(guān)(圖2)。
圖2 CPC一期核心樣本地理分布及語系、族群、遺傳聚類關(guān)系
CPC泛基因組圖譜作為首個(gè)中國人群專屬的泛基因組參考圖譜,與HPRC泛基因組圖譜相比,在中國人群特有的復(fù)雜變異解析方面具有顯著優(yōu)勢。CPC泛基因組圖譜中新發(fā)現(xiàn)了1079個(gè)基因拷貝數(shù)變異,以及包含藥物代謝基因CYP2D6等在內(nèi)的在中國人群中富集而在其他世界人群中出現(xiàn)頻率較低的若干基因拷貝數(shù)變異;新鑒定出富集在中心粒、端粒等染色體復(fù)雜區(qū)域的3.4萬個(gè)結(jié)構(gòu)變異,其中半數(shù)以上僅在單個(gè)或兩個(gè)樣本中出現(xiàn)——若不針對中國豐富的族群多樣性開展專門研究,將沒有機(jī)會(huì)發(fā)現(xiàn)這些遺傳變異(圖3)。研究人員進(jìn)一步揭示,這些CPC新發(fā)現(xiàn)的遺傳變異可能與亞洲人群特有的疾病易感性及表型多樣性有關(guān)。一個(gè)典型的例子是α-珠蛋白基因簇,研究人員在該基因區(qū)域鑒定出兩個(gè)中國人群特異性的大規(guī)模結(jié)構(gòu)變異,包括一段20 kb的缺失序列和一段10 kb的重復(fù)序列,這將為進(jìn)一步研究中國人群貧血癥的遺傳機(jī)理和致病機(jī)制提供新的線索(圖4)。
圖3 圖形化泛基因組示例及CPC特有復(fù)雜變異分布
圖4 CPC對我國族群特異的復(fù)雜基因組結(jié)構(gòu)變異解析示例
同時(shí),CPC新發(fā)現(xiàn)的遺傳變異影響了具有潛在功能和經(jīng)受過適應(yīng)性進(jìn)化的基因,這些基因可能與亞洲人群特有的疾病易感性及表型多樣性有關(guān),這也證實(shí)了將人群專屬高質(zhì)量泛基因組用于基因組學(xué)和醫(yī)學(xué)研究的潛力和必要性。此外,研究人員在CPC參考圖譜中發(fā)現(xiàn)了相當(dāng)大比例的古人來源基因序列——平均每個(gè)族群和每個(gè)樣本中分別有約15 Mb和約9.5 Mb的古人來源新序列——這可能是前期開展大量研究卻未在現(xiàn)代人基因組中發(fā)現(xiàn)的古人基因滲入序列,或?qū)闁|亞現(xiàn)代人基因組中的古人基因滲入研究乃至整個(gè)古DNA領(lǐng)域提供新的信息資料和線索。
從人類基因組計(jì)劃中國只承擔(dān)“1%”的圖譜繪制任務(wù)到今天中國人群泛基因組圖譜“100%”由中國科學(xué)家完成,這項(xiàng)研究成果展現(xiàn)了中國生命科學(xué)尤其是基因組學(xué)科研水平在過去40年間的歷史性跨越,為完整構(gòu)建中華民族參考泛基因組打下了堅(jiān)實(shí)的基礎(chǔ),也為人類參考泛基因組圖譜繪制了獨(dú)特的“中國畫卷”。中國人群參考泛基因組不僅有助于中華民族共同體的遺傳學(xué)研究,加深人們對個(gè)體或群體基因組的“異”與“同”更具象、更深度的認(rèn)知,還將改變過去依賴主體基于歐洲白人的參考基因組而導(dǎo)致東亞特有罕見變異檢出精確度難以提升的困境,從而提高我國生物醫(yī)學(xué)數(shù)據(jù)分析的質(zhì)量和效率,服務(wù)人民生命健康。
復(fù)旦大學(xué)徐書華教授、西安交通大學(xué)葉凱教授、中國醫(yī)學(xué)科學(xué)院褚嘉祐教授和復(fù)旦大學(xué)陸艷副教授為論文的共同通訊作者。復(fù)旦大學(xué)博士后高揚(yáng),西安交通大學(xué)楊曉飛副教授,中國科學(xué)院上海營養(yǎng)與健康研究所博士生陳豪、譚昕江,中國醫(yī)學(xué)科學(xué)院楊昭慶研究員以及復(fù)旦大學(xué)鄧戀青年研究員為論文的并列第一作者。該論文共同作者包括復(fù)旦大學(xué)王寶楠、孔爽、李松洋、崔雨杭、雷暢、趙曉涵、史穎冰、楊子藝,中科院王亦民博士、潘雨聞博士、馬森博士,中國醫(yī)科院孫浩博士,中科院昆明動(dòng)物所吳東東研究員,江蘇師范大學(xué)伍少遠(yuǎn)教授,復(fù)旦大學(xué)趙興明教授,西安交大附屬醫(yī)院施秉銀教授,復(fù)旦大學(xué)金力教授,南京醫(yī)科大學(xué)胡志斌教授等。
中國人群泛基因組圖譜已公開在線發(fā)布:https://pog.fudan.edu.cn/cpc/#/;https://github.com/Shuhua-Group/Chinese-Pangenome-Consortium-Phase-I;
該項(xiàng)研究所涉及的樣本信息和數(shù)據(jù)的公開發(fā)表已獲得國家人類遺傳資源管理部門批準(zhǔn)(批件號(hào):2022BAT2392)。
附:中國人泛基因組聯(lián)盟(1期)成員
徐書華(復(fù)旦大學(xué))、葉凱(西安交通大學(xué))、褚嘉祐(中國醫(yī)學(xué)科學(xué)院)、金力(復(fù)旦大學(xué))、楊昭慶(中國醫(yī)學(xué)科學(xué)院)、吳東東(中國科學(xué)院昆明動(dòng)物研究所)、胡志斌(南京醫(yī)科大學(xué))、趙興明(復(fù)旦大學(xué))、袁慧軍(四川大學(xué)華西醫(yī)院)、高強(qiáng)(復(fù)旦大學(xué)附屬中山醫(yī)院)、金鑫(華大生命科學(xué)研究院)、陳超(中南大學(xué))、李津臣(中南大學(xué))、楊劍(西湖大學(xué))、伍少遠(yuǎn)(江蘇師范大學(xué))、陸艷(復(fù)旦大學(xué))、沈俠(復(fù)旦大學(xué))、楊曉飛(西安交通大學(xué))、鄧戀(復(fù)旦大學(xué))、樊少華(復(fù)旦大學(xué))、戴俊程(南京醫(yī)科大學(xué))、施秉銀(西安交通大學(xué))、韋朝春(上海交通大學(xué))、孫浩(中國醫(yī)學(xué)科學(xué)院)、何光林(四川大學(xué)華西醫(yī)院)、卜楓嘯(四川大學(xué)華西醫(yī)院)、吳洋(四川大學(xué)華西醫(yī)院)、高揚(yáng)(復(fù)旦大學(xué))、陳豪(中國科學(xué)院上海營養(yǎng)與健康研究所)、譚昕江(中國科學(xué)院上海營養(yǎng)與健康研究所)、王亦民(中國科學(xué)院上海營養(yǎng)與健康研究所)、王寶楠(復(fù)旦大學(xué))、李松洋(復(fù)旦大學(xué))、崔雨杭(復(fù)旦大學(xué))、潘雨聞(中國科學(xué)院上海營養(yǎng)與健康研究所)、馬森(中國科學(xué)院上海營養(yǎng)與健康研究所)、孔爽(復(fù)旦大學(xué))、趙曉涵(復(fù)旦大學(xué))、毛創(chuàng)學(xué)(中國科學(xué)院上海營養(yǎng)與健康研究所)、雷暢(復(fù)旦大學(xué))、史穎冰(復(fù)旦大學(xué))、楊子藝(復(fù)旦大學(xué))
更多信息請?jiān)L問CPC網(wǎng)站: https://pog.fudan.edu.cn/cpc/#/
專家點(diǎn)評
趙國屏(中國科學(xué)院院士)
由復(fù)旦大學(xué)、西安交大、中國醫(yī)學(xué)科學(xué)院等研究單位的一批中青年學(xué)者組織的“中國人泛基因組聯(lián)盟”,匯聚我國各方面多年努力積累的數(shù)據(jù),構(gòu)建出高質(zhì)量的中國人群泛基因組圖譜,在國際頂級(jí)科學(xué)期刊Nature正式發(fā)表,是一件值得慶賀和重視的大事。
與曼哈頓原子彈計(jì)劃、阿波羅登月計(jì)劃并稱為人類科學(xué)史上三大科學(xué)工程的人類基因組計(jì)劃(HGP),最主要的成果就是構(gòu)建了一個(gè)沿用至今并在不斷完善中的人類參考基因組(reference genome)。人類參考基因組之所以重要和有用,因?yàn)槿祟愲m然是一個(gè)物種,其基因組大致相似(如果不考慮結(jié)構(gòu)變異,在組成人類基因組的30億個(gè)堿基對中,大約99.9%是一致的),然而,人類個(gè)體的基因組又是各不相同的;而正是這0.1%左右(大約三百萬堿基對)的不同,造成了人類各族群、個(gè)體間表型不同(從長相的不同到健康狀況的差異)的遺傳基礎(chǔ)。所以,要能夠正確使用人類基因組序列,幫助我們認(rèn)識(shí)人類自身特別是與我們健康密切相關(guān)的基因組信息,以獲得有價(jià)值的知識(shí),必須有一張能夠指導(dǎo)待研究對象的基因排序和組合的導(dǎo)航圖,這就是人類參考基因組。
這張被廣泛應(yīng)用于人類遺傳學(xué)和醫(yī)學(xué)研究的遺傳密碼“導(dǎo)航圖”,是解析人類起源與演化、解析人類表型和疾病的遺傳基礎(chǔ)的根基。20年前人類基因組計(jì)劃完成之初,用于國際基因組計(jì)劃(HGP)的大部分DNA來自于住在紐約州布法羅的一名白人男性捐獻(xiàn)者(編號(hào)為RP11)。同時(shí)公布的來自Craig Venter領(lǐng)導(dǎo)的塞雷拉基因組計(jì)劃的DNA樣品來源于五名捐獻(xiàn)者,其中雖然有亞裔和非洲裔人,依然是高加索人為主。因此,通用的人類參考基因組代表的是以白人為主的基因組序列。此后,經(jīng)過人類單堿基差異的單倍型作圖(HAP),單堿基差異的全基因組相關(guān)分析(GWAS)以及對大量自然人群的全基因組測序(WGS),這個(gè)以高加索人為主的尚“不完整”的參考基因組,在過去20年里,推動(dòng)了整個(gè)人類生命科學(xué)和醫(yī)學(xué)研究的長足進(jìn)展!
國際人類基因組計(jì)劃雖然是歐美主導(dǎo)的大型國際合作計(jì)劃,但是,我國科學(xué)家在這個(gè)生命科學(xué)發(fā)展歷程的關(guān)鍵節(jié)點(diǎn)上,不忘為中國人民健康事業(yè)服務(wù)的“初心”,牢記面向國際基因組研究科學(xué)前沿,面向我國生物醫(yī)藥發(fā)展重大需求的“使命”,乘“改革開放”帶來的“科學(xué)春天”的東風(fēng),以“只爭朝夕”的精神,抓住機(jī)遇,成為參與這一重大國際合作計(jì)劃的唯一發(fā)展中國家,為人類基因組測序和基因識(shí)別作出了“兩個(gè)百分之一”的貢獻(xiàn);同時(shí),展開有我國特色的醫(yī)學(xué)基因組學(xué)和以人類健康為宗旨的功能基因組學(xué)研究;使我國生物醫(yī)學(xué)研究在世紀(jì)之交,基本擺脫以往的落后狀態(tài),趕上了新時(shí)代的快車道。
但是,我們應(yīng)該清醒地認(rèn)識(shí)道,我國的人類基因組學(xué)研究與西方尤其是歐美相比,還存在不小的差距,東西方發(fā)展至今依然極度不平衡,我們依然需要積極參與包括人類基因組研究在內(nèi)的生物醫(yī)學(xué)大科學(xué)研究的國際競爭與合作。但是,我注意到上個(gè)月發(fā)表的國際人類泛基因組聯(lián)盟的成果,其中沒有一家中國的研究單位,這說明過去好不容易建立起來的國際合作的氛圍與精神,近年來出現(xiàn)了遲滯的態(tài)勢;雖然個(gè)中原因復(fù)雜,但值得認(rèn)真反思總結(jié)。
無論如何,人類是一個(gè)物種,在人類這個(gè)物種中,亞裔和華裔人群是一個(gè)重要的組成部分;人類社會(huì)是不可分割的命運(yùn)共同體,在人類社會(huì)發(fā)展中,中國和東亞、東南亞地區(qū)和國家占據(jù)不可忽略的重要性。西方發(fā)達(dá)國家,盡管有大量的亞裔和華裔人群,尤其是在美國,如今華裔美國人口的數(shù)量已經(jīng)達(dá)到了500多萬,但是其基于基因組的生物醫(yī)學(xué)研究投資重心依然是聚焦于白人,其次是黑人,亞裔或華裔族群大多數(shù)情況下都很難排到優(yōu)先級(jí)考慮。因此,在如今的基因組研究態(tài)勢中,依然不可忽視我國豐富的人類遺傳資源(特別是由多民族組成的占世界人口總數(shù)20%以上的中華民族群體)是研究人類基因組多樣性、人類進(jìn)化和人類疾病相關(guān)基因的寶貴材料;同樣,發(fā)展中國的醫(yī)療事業(yè)和生物醫(yī)藥產(chǎn)業(yè)必需要擁有中國自己的完整的基因組信息,包括我國專屬參考基因組和泛基因組資源和分析體系,形成我國自主可控的人類基因組資源與核心技術(shù)。忽視這一點(diǎn),不論在學(xué)術(shù)上還是在醫(yī)學(xué)應(yīng)用上考慮,都是嚴(yán)重阻礙我國科學(xué)發(fā)展和醫(yī)學(xué)進(jìn)步的。
今年正值國際人類基因組計(jì)劃(HGP)完成20周年,也成為人類參考基因組從“線性一維序列”過渡到“泛基因組多維圖譜”的轉(zhuǎn)折年。值此歷史發(fā)展重要轉(zhuǎn)折點(diǎn),復(fù)旦大學(xué)、西安交大、中國醫(yī)學(xué)科學(xué)院等研究單位的一批中青年學(xué)者,能團(tuán)結(jié)國內(nèi)的力量,組織中國人自己的基因組聯(lián)盟,并且獨(dú)立自主地構(gòu)建出高質(zhì)量的中國人群泛基因組圖譜,最終得到國際頂級(jí)期刊的認(rèn)可和發(fā)表,這是值得肯定的,也是需要鼓勵(lì)和支持的。這一成果表明我國科學(xué)家在人類基因組學(xué)領(lǐng)域的研究水平得到了顯著提升。我相信這項(xiàng)工作對我國的人類基因組學(xué)和醫(yī)學(xué)中的復(fù)雜疾病遺傳基礎(chǔ)研究等領(lǐng)域會(huì)起到重要的推動(dòng)作用!
專家點(diǎn)評
張亞平(中國科學(xué)院院士)
基因組是生命演化的遺傳信息載體,也是研究人類起源和復(fù)雜疾病的數(shù)據(jù)信息根源。不論是動(dòng)植物,還是人類,復(fù)雜性狀的遺傳學(xué)研究都遇到了一個(gè)瓶頸——“missing heritability”(丟失的遺傳率)問題,即目前的研究未能鑒別出能充分解釋表型預(yù)期遺傳貢獻(xiàn)的基因變異。這部分與參考基因組的不完整性和多樣性覆蓋度不充分有關(guān)。雖然國際上也發(fā)起了以歐美發(fā)達(dá)國家主導(dǎo)的重構(gòu)人類參考基因組的計(jì)劃,然而,是否有必要建立中國人群的參考基因組是應(yīng)該認(rèn)真對待的問題。徐書華團(tuán)隊(duì)在前期研究中從變異判讀、進(jìn)化研究、醫(yī)學(xué)應(yīng)用三個(gè)方面分析和評估了建立高質(zhì)量族群特異性參考基因組的必要性。此次復(fù)旦大學(xué)、西安交大、中國醫(yī)學(xué)科學(xué)院等多家單位聯(lián)合發(fā)布的中國人泛基因組研究成果,再次表明了建立我國人群泛基因組圖譜的必要性以及該圖譜在重構(gòu)人類演化歷程和挽回復(fù)雜疾病研究中“丟失的遺傳率”等研究和應(yīng)用中的潛在價(jià)值。這是一個(gè)很好的開端!希望我國學(xué)者再接再厲,不斷完善我國人群參考基因組和泛基因組資源和分析體系,形成我國完善的人類基因組資源與核心技術(shù),提升我國在人類基因組學(xué)領(lǐng)域的自主地位,支撐“健康中國”、“精準(zhǔn)醫(yī)學(xué)”等國家戰(zhàn)略。
專家點(diǎn)評
金力(中國科學(xué)院院士)
今年,正值“國際人類基因組計(jì)劃”(HGP)完成20周年,我很欣慰地看到這項(xiàng)由我國學(xué)者主導(dǎo)的人類泛基因組研究得以在Nature發(fā)表。
人類基因組研究是基因組學(xué)中起步最早的方向,在數(shù)據(jù)資源、技術(shù)方法和研究成果等方面都曾領(lǐng)先于其他物種的研究。但是,這種“先發(fā)優(yōu)勢”也使得人類基因組研究越來越難以取得新的突破性成果。近年來,動(dòng)物、植物、非人靈長類、反芻動(dòng)物等領(lǐng)域的基因組學(xué)研究進(jìn)展很快,取得了令人矚目的成績。相比之下,人類基因組研究顯得有所“滯后”。而此次發(fā)表的成果,打破了人類基因組學(xué)研究的這種“停滯”,也是我國科學(xué)家在人類基因組研究領(lǐng)域取得的又一重大進(jìn)展。
很有意思的是,這項(xiàng)研究發(fā)現(xiàn)通用參考基因組上缺失的參考序列富集了適應(yīng)性演化和起源于遠(yuǎn)古人類的遺傳變異,并且與角質(zhì)化、紫外線輻射應(yīng)激、DNA 修復(fù)、免疫反應(yīng)以及壽命等表型或功能相關(guān)。這反映了我們的基因組中可能仍有大片有價(jià)值的礦藏尚未得到充分開采。
值得注意的是,這項(xiàng)研究除了在通用參考基因組之外發(fā)現(xiàn)約590萬個(gè)單核苷酸多態(tài)性變異和插入/缺失變異之外,還鑒別出約3.4萬個(gè)結(jié)構(gòu)變異(Structural variation, SV),并且涉及至少1367個(gè)蛋白編碼基因。我想強(qiáng)調(diào)的是,基因組結(jié)構(gòu)變異大概是生物進(jìn)化中從微觀到宏觀演變的關(guān)鍵遺傳基礎(chǔ),也是最有可能連接漸變到躍變這個(gè)“鴻溝”的進(jìn)化密碼。我相信,通過對基因組結(jié)構(gòu)變異的高精度解析,不但能大幅提升“基因型-表型”關(guān)聯(lián)分析的功效,而且有可能最終幫助我們理解生命演化中重要性狀和功能產(chǎn)生的遺傳基礎(chǔ)和分子機(jī)制。
原文鏈接:
https://www.nature.com/articles/s41586-023-06173-7
聯(lián)系客服