結(jié)構(gòu)變異(Structural variation,SVs)和基因拷貝數(shù)變異(gene copy number variations,gCNVs)是動(dòng)植物中主要的遺傳變異來(lái)源,對(duì)于作物進(jìn)化、馴化和改良具有重要貢獻(xiàn)。全面準(zhǔn)確地鑒定和分析SV和gCNV對(duì)挖掘優(yōu)異等位基因、保障水稻糧食安全具有重要意義。
四川農(nóng)業(yè)大學(xué)李仕貴等研究人員合作于2021年發(fā)表于《Cell》期刊“Pan-genome analysis of 33 genetically diverse rice accessions reveals hidden genomic variations”的研究論文,通過(guò)組裝了31個(gè)具有遺傳多樣性的水稻種質(zhì)的高質(zhì)量基因組,并結(jié)合兩個(gè)現(xiàn)有的水稻基因組,開發(fā)了水稻泛基因組,為水稻及其他作物基因組研究、種質(zhì)資源的精準(zhǔn)鑒定、優(yōu)良基因的挖掘、基因功能解析、分子設(shè)計(jì)育種等研究奠定了堅(jiān)實(shí)基礎(chǔ)。
本研究選取了遺傳背景具有高度代表性的33個(gè)水稻材料,包括亞洲栽培稻各亞群代表性材料和非洲栽培稻材料,以及水稻生產(chǎn)和育種上廣泛使用的優(yōu)良品種和核心親本材料。利用PacBio長(zhǎng)片段測(cè)序、Illumina測(cè)序、RNA-seq和NCBI數(shù)據(jù)庫(kù),獲得了31份材料平均深度為60倍的長(zhǎng)片段序列數(shù)據(jù)。利用高質(zhì)量基因組組裝和注釋流程,獲得了31個(gè)均達(dá)到參考基因組水平的高質(zhì)量基因組和基因注釋。結(jié)合已發(fā)表的兩個(gè)高質(zhì)量基因組(日本晴和蜀恢498)和注釋結(jié)果,構(gòu)建了水稻泛基因組,同時(shí)比較分析水稻的結(jié)構(gòu)變異情況。1、獲得31 個(gè)從頭組裝高質(zhì)量水稻基因組,用于遺傳多樣性的種質(zhì)研究;
2、構(gòu)建水稻泛基因組規(guī)模資源和基于圖的基因組揭示隱藏的SV和gCNV;
3、使用O. glaberrima基因組推斷O. sativa SVs的衍生狀態(tài);
4、SVs和gCNVs塑造了水稻基因表達(dá)譜和農(nóng)藝性狀變異。
組裝的31份水稻的高質(zhì)量基因組中,亞洲稻基因組大小平均為385.8 Mbp(371.7–392.9 Mbp),非洲稻CG14基因組大小為344.7 Mbp。平均Contig N50達(dá)到12.88 Mbp。以日本晴基因?yàn)榛A(chǔ)采用迭代策略構(gòu)建泛基因組,獲得了包含66,636個(gè)蛋白質(zhì)編碼基因的首次構(gòu)建了水稻圖形基因組,是水稻中迄今最為完整的基于圖形結(jié)構(gòu)的泛基因組。其中20,374個(gè)基因?yàn)楹诵幕颍?6,262個(gè)為可變基因。表1 31個(gè)水稻高質(zhì)量基因組組裝及注釋結(jié)果
圖1 遺傳多樣性水稻種質(zhì)的不同農(nóng)藝表型
將32個(gè)基因組序列與日本晴基因組序列進(jìn)行比較檢測(cè)SVs,獲得了總共有171,072個(gè)非冗余SVs,包括164,009個(gè)存在/缺失變異(PAVs),6,109個(gè)易位和954個(gè)倒位。SVs在染色體上呈不均勻分布,有140個(gè)SVs熱點(diǎn)區(qū)域。在染色體11上一個(gè)SV熱點(diǎn)區(qū)域與12個(gè)稻瘟病抗性數(shù)量性狀基因座(QTLs)重疊或鄰接。這些發(fā)現(xiàn)表明,位于SV熱點(diǎn)區(qū)域內(nèi)的變異可能經(jīng)歷更強(qiáng)的環(huán)境選擇。圖2 代表衍生狀態(tài)的SVs的推斷和表征
大多數(shù)dSVs與非編碼區(qū)重疊。對(duì)R527的29種不同樣本類型的RNA測(cè)序分析發(fā)現(xiàn)脅迫處理后dSVs基因表達(dá)變化大于3倍的比例明顯高于非dSVs基因,表明dSVs基因通常對(duì)環(huán)境壓力更敏感,水稻進(jìn)化和馴化過(guò)程中SVs具有廣泛的基因表達(dá)譜。。這些基因組變異很難利用傳統(tǒng)手段鑒定到,絕大多數(shù)在先前研究中均未發(fā)現(xiàn),但在農(nóng)藝性狀調(diào)控中發(fā)揮重要作用。例如,著名日本優(yōu)質(zhì)稻品種“越光”中一個(gè)早熟位點(diǎn)(qDTH7-3),可能由OsMADS18基因在“越光”產(chǎn)生兩個(gè)拷貝,導(dǎo)致表達(dá)量升高從而表現(xiàn)早熟表型。圖3 SVs對(duì)基因的影響促成了環(huán)境適應(yīng)和馴化
水稻泛基因組中25,549個(gè)(38.34%)蛋白質(zhì)編碼基因被推斷為gCNVs,包括14,782個(gè)基因PAVs。此外,gCNVs可以導(dǎo)致異位表達(dá)模式,水稻中g(shù)CNV普遍存在并與農(nóng)藝性狀的變異有關(guān)??傮w而言,這個(gè)gCNVs目錄有助于研究水稻表型變異背后潛在的隱藏基因組變異。圖4 廣泛存在的基因CNVs與農(nóng)藝性狀變異相關(guān)
這些SVs主要的形成機(jī)制是轉(zhuǎn)座因子插入(TEI),其次是非同源末端連接(NHEJ)。研究表明TEs,尤其是LTRs,能夠以某種方式頻繁地為NHEJ產(chǎn)生DNA斷裂,或者通過(guò)提供同源序列來(lái)促進(jìn)非等位同源重組(NAHR)。圖5 多種機(jī)制驅(qū)動(dòng)水稻SV的形成
以日本晴基因組作為基礎(chǔ)線性基因組,基于彼此同源性<50%的PAV序列構(gòu)建水稻圖形基因組。總共6,542個(gè)PAVs被整合到圖形基因組中。將水稻3K-RG數(shù)據(jù)集中選擇的674份覆蓋所有亞群、測(cè)序深度>10X的水稻材料比對(duì)到圖形基因組,證明了水稻圖形基因組的實(shí)用性。圖6 水稻圖形基因組的構(gòu)建及效用展示
為了便于使用這些基因組資源,作者搭建了水稻數(shù)據(jù)庫(kù)網(wǎng)站(http://www.RiceRC.com)。該網(wǎng)絡(luò)工具集成了基因組瀏覽器和BLAST功能,便于使用基因組序列和查詢遺傳變異等內(nèi)容,促進(jìn)水稻功能基因組學(xué)和育種應(yīng)用研究。圖7 水稻數(shù)據(jù)庫(kù)網(wǎng)站
總之,本研究獲得了31 個(gè)從頭組裝高質(zhì)量水稻基因組,用于遺傳多樣性的種質(zhì)研究。同時(shí)首次構(gòu)建了水稻圖形基因組,是水稻中迄今最為完整的基于圖形結(jié)構(gòu)的泛基因組。研究對(duì) SV 形成機(jī)制、對(duì)基因表達(dá)的影響以及亞群之間分布的分析說(shuō)明了這些資源在理解 SV 和 gCNV如何塑造水稻環(huán)境適應(yīng)和馴化方面的效用。研究基于水稻泛基因組通過(guò)全基因組關(guān)聯(lián) (GWAS)分析,來(lái)鑒定那些僅通過(guò)SNPs和單個(gè)參考基因組所無(wú)法檢測(cè)的、與表型相關(guān)的遺傳變異。本文的工作提供了水稻群體級(jí)別的基因組資源,同時(shí)配套開發(fā)了在線網(wǎng)站便于用戶獲取相關(guān)資源,有助于促進(jìn)水稻育種以及植物功能基因組學(xué)和進(jìn)化生物學(xué)研究。參考文獻(xiàn)
Pan-genome analysis of 33 genetically diverse rice accessions reveals hidden genomic variations. Cell, 2021.
凌恩生物明星產(chǎn)品,種質(zhì)資源數(shù)字化解決方案重磅來(lái)襲!( 明星產(chǎn)品!種質(zhì)資源數(shù)字化一站式解決方案!)一站式服務(wù),打造種質(zhì)資源農(nóng)業(yè)育種全套分析流程!四大模塊,全方位開展高質(zhì)量農(nóng)業(yè)育種研究!專業(yè)找凌恩!期待與您的合作!
全基因組重測(cè)序/簡(jiǎn)化基因組標(biāo)記開發(fā);
組學(xué)數(shù)據(jù)-育種高通量表型數(shù)據(jù)聯(lián)合構(gòu)建農(nóng)業(yè)育種平臺(tái)!
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。