編輯 | 新銳恒豐研究院
來源 | 南北學(xué)院、百奧云
作者 | 王向峰、張紅偉
當(dāng)您讀完本文時(shí),您有兩種選擇:
1)您可將它分享出去,讓更多的人受益;
2)您也可以不理會(huì)。
這就叫愛出者愛返,福往者福來。讓我們一起轉(zhuǎn)起善緣!贈(zèng)人玫瑰,手有余香!
作者簡(jiǎn)介:王向峰,中國農(nóng)業(yè)大學(xué)作物基因組與生物信息學(xué)系教授,國家玉米改良中心研究員。本文是王教授在南北學(xué)院微信區(qū)發(fā)表的觀點(diǎn)及張紅偉老師的補(bǔ)充,內(nèi)容非常精彩,值得仔細(xì)品讀?;诂F(xiàn)有的生物技術(shù)和IT技術(shù),才能使我國的育種實(shí)現(xiàn)跨越式發(fā)展,越到后來,越需要對(duì)育種分子本質(zhì)的理解!
育種是利用雜交重組對(duì)有利等位基因及遺傳變異進(jìn)行組合,產(chǎn)生以供人工選擇的目標(biāo)性狀。需要強(qiáng)調(diào)的是:“有利”與“有害”是相對(duì)是否有利于性狀的改進(jìn)目標(biāo)而定義的,兩者并非絕對(duì)的對(duì)立;相反“有利”與“有害”會(huì)根據(jù)群體、環(huán)境、性狀、發(fā)育時(shí)期的不同而轉(zhuǎn)換。在研究中,我們更傾向于用“強(qiáng)基因型”與“弱基因型”區(qū)分兩種類型的變異,以表示對(duì)性狀改良的貢獻(xiàn)強(qiáng)度。本文為了理解上的方便,延用“有利”和“有害”區(qū)分變異的種類。
普通農(nóng)藝性狀改良是“偶然性”遠(yuǎn)大于“必然性”的過程,基于以下五點(diǎn)原因:首先,有利變異往往是頻率較低的DNA突變,因此需要通過發(fā)展群體規(guī)模才能提高有利變異在群體中的頻率;其次,有利變異往往與有害變異連鎖,需要在群體規(guī)模足夠大、重組十分充份的條件下,才有可能篩選出與有害變異打破連鎖的有利變異;第三,數(shù)量性狀往往由多基因決定,聚合多個(gè)基因的多個(gè)低頻率有利變異組合所需的群體規(guī)模更是成指數(shù)性增長(zhǎng);第四,目標(biāo)性狀的提升往往是作物整個(gè)發(fā)育過程中,各個(gè)發(fā)育時(shí)期分子調(diào)控模塊的協(xié)同作用的結(jié)果,篩選有利變異組合模塊的組合,則需要多次重復(fù)“建立群體、篩選材料”這一過程而實(shí)現(xiàn);最后,雜種優(yōu)勢(shì)中“上位性抑制”遺傳效應(yīng)猶如“障眼法”,可導(dǎo)致有利變異組合的功能發(fā)揮受到負(fù)調(diào)控作用,有利表型難以表現(xiàn),依靠肉眼觀察性狀則錯(cuò)失優(yōu)良材料。這還僅僅是針對(duì)產(chǎn)量、株型等普通農(nóng)藝性狀的改良,如若加上各種抗性的改良,不得不說育種的的確確是一個(gè)非常艱苦,花費(fèi)巨大,并且需要很強(qiáng)毅力的職業(yè);同時(shí),還要有上天眷顧的運(yùn)氣。
目前,國際種業(yè)向著“多技術(shù)融合型加速育種技術(shù)體系”的方向上發(fā)展。加速育種(AcceleratedBreeding)不是單指某一項(xiàng)育種技術(shù),而是指多層面、跨學(xué)科的技術(shù)融合,重點(diǎn)強(qiáng)調(diào)的是育種體系的頂層設(shè)計(jì),以數(shù)據(jù)和模型為驅(qū)動(dòng)銜接各個(gè)育種環(huán)節(jié),形成閉環(huán)鏈條。這些技術(shù)涵蓋單倍體誘導(dǎo)、快速育種、人工氣候模擬器、全基因組選擇、分子標(biāo)記選擇、機(jī)器學(xué)習(xí)、數(shù)據(jù)決策模型、圖形圖像表型組、轉(zhuǎn)基因、基因編輯、合成生物學(xué)等諸多方面。多技術(shù)的融合無非就是解決兩個(gè)方面的問題:第一,快速、低成本地創(chuàng)制自交系,擴(kuò)大群體以提高有利變異組合的頻率;第二,依靠基因型精準(zhǔn)、定向篩選攜帶有利變異組合的育種材料。但是,如果缺乏對(duì)育種理論、遺傳機(jī)制、基因功能的深入了解,僅依靠引進(jìn)國外先進(jìn)設(shè)備的“拿來主義”,也是很難實(shí)現(xiàn)精準(zhǔn)、高效的工程化育種。與各位一線育種家“由外向內(nèi)”認(rèn)識(shí)育種規(guī)律不同,本人主要從事育種數(shù)據(jù)分析、育種模型構(gòu)建、基因資源挖掘等基礎(chǔ)性研究工作,對(duì)育種有一些“由內(nèi)向外”的粗淺認(rèn)識(shí),希望能對(duì)各位育種家的具體工作有所啟示和幫助。
(張紅偉老師的補(bǔ)充:可能存在三種情況,一是模仿育種,比如定向改良先玉335的抗倒性,如果有對(duì)抗倒伏材料的篩選和遺傳和分子機(jī)制的了解,定向?qū)⒖沟狗w的抗倒伏基因?qū)氲较扔?/span>335的一個(gè)親本,從而利用分子育種技術(shù)快速地進(jìn)行改良。第二個(gè)種情況是,育種家一般手里都會(huì)有好幾個(gè)不錯(cuò)的tester,一般都是固定其中一個(gè)tester,來篩選與該tester配合最好的選材。創(chuàng)新性強(qiáng)的輪回選擇,需要利用大量的育種材料來組配方案,實(shí)際上就是預(yù)測(cè)那種基因型組合(a mosaic combinationof chromosome segment from many donors)跟這個(gè)材料配合最好,這個(gè)預(yù)測(cè)上很難,但是隨著預(yù)測(cè)技術(shù)和大數(shù)據(jù)機(jī)器學(xué)習(xí)等技術(shù)的發(fā)展,以后會(huì)實(shí)現(xiàn)的。第三種情況是最難的創(chuàng)新,沒有固定的tester,就是要從一堆育種資源中篩選哪種基因型組合跟另一種基因型組合、組配最合適,這個(gè)是最難度大的。最后所有技術(shù)的評(píng)價(jià)標(biāo)準(zhǔn)就是F1的表現(xiàn),根據(jù)推測(cè)出來的基因型組合,設(shè)計(jì)育種方案來達(dá)到或者無限接近獲得這種基因型組合的材料。)
李競(jìng)雄先生對(duì)玉米雜種優(yōu)勢(shì)育種最為精辟的總結(jié)是“難在選系,重在組配,中心是配合力問題。”本文結(jié)合我們?cè)谟衩子N理論研究中總結(jié)出來的一些規(guī)律性的東西,詮釋上述三點(diǎn)在分子層面的本質(zhì),以及應(yīng)用什么樣的生物技術(shù)或決策模型加速育種進(jìn)度、縮短育種周期。
一、新型種質(zhì)資源的創(chuàng)制。我國育種領(lǐng)域面臨著遺傳范圍日趨狹窄的問題,缺乏自主知識(shí)產(chǎn)權(quán)的新型優(yōu)異種質(zhì)是我國種業(yè)發(fā)展的瓶頸。將我國地域適應(yīng)性強(qiáng)的優(yōu)異骨干材料與引進(jìn)種質(zhì)進(jìn)行融合,結(jié)合單倍體誘導(dǎo)與基因組優(yōu)化設(shè)計(jì)模型是實(shí)現(xiàn)快速種質(zhì)資源創(chuàng)新的途徑。可以選擇10到20個(gè)來自國內(nèi)外不同雜種優(yōu)勢(shì)群、遺傳多樣性高、優(yōu)異性狀互補(bǔ)的骨干自交系作為基礎(chǔ)材料混合雜交建立群體,再逐步選系。基礎(chǔ)材料進(jìn)行全基因組重測(cè)序后鑒定全基因組范圍的變異位點(diǎn),近而可以用來推測(cè)哪些基礎(chǔ)材料的基因組片段受到高頻率的選擇,并保留在高世代群體中。此為基因組優(yōu)化設(shè)計(jì)模型創(chuàng)制種質(zhì)的數(shù)據(jù)基礎(chǔ)。我們的研究發(fā)現(xiàn),高世代群體中的自交系80%左右的基因組組分是由3~5個(gè)基礎(chǔ)材料提供的。這些材料主要是由綜合性狀好、配合力廣泛的國內(nèi)老牌自交系組成,但其雜交種的產(chǎn)量并不是最高的。這說明老牌自交系可能提供的是具有廣泛環(huán)境適應(yīng)性的遺傳背景。另外20%的基因組組分則是來自其他較新的骨干自交系。這些自交系各自提供1%~3%左右的不等的基因組片段;且隨著測(cè)驗(yàn)種的不同,提供片段的比例也會(huì)有的差異。這說明了兩個(gè)問題:第一,老牌自交系仍有較高的發(fā)掘價(jià)值,是保證廣泛地域適應(yīng)性與基本配合力的遺傳背景基礎(chǔ);第二,新的自交系往往提供的是優(yōu)秀的遺傳前景,即對(duì)提高產(chǎn)量與近一步提高配合力有利的基因。
(張紅偉老師的補(bǔ)充:種質(zhì)資源的引進(jìn)和建立是非常重要的問題,每個(gè)育種家都非常關(guān)心,主要關(guān)心兩個(gè)問題,一是用什么材料來創(chuàng)制,比如本段提到的老牌材料用誰新材料用誰,這一點(diǎn)目前主要是根據(jù)育種家的經(jīng)驗(yàn)來決定的,未來我們?cè)趺从脭?shù)據(jù)來決定,如何決定用誰不用誰,以誰為主,來改良誰。二是如何創(chuàng)制,即創(chuàng)制方法的問題,育種家在做這個(gè)決定的時(shí)候存在一定的主觀性,有人選擇BC1回交改良,有人選擇不斷自交選系,穩(wěn)定后測(cè)配,有人選擇以其中一個(gè)親本為主多供體親本為輔的輪回改良。主觀性意味著缺乏科學(xué)決斷,既是低效率。那未來能不能利用大數(shù)據(jù)進(jìn)行精準(zhǔn)設(shè)計(jì),數(shù)據(jù)分析師直接告訴育種家哪種方案是最好的,按照這個(gè)方案來就可以了。)
二、雜種優(yōu)勢(shì)模式的形成與固定。在初步創(chuàng)制新型種質(zhì)群體后,首先利用來自不同雜種優(yōu)勢(shì)群的測(cè)驗(yàn)種與之組配,確定配合力優(yōu)秀的雜種優(yōu)勢(shì)群;然后,通過群內(nèi)的自交系改良,提升兩群間的配合力,逐步形成具有雜種優(yōu)勢(shì)模式清晰、配合力穩(wěn)定的A、B群。這一過程可以采用全基因組選擇輔助選系,加速雜種優(yōu)勢(shì)模式的形成與固定。換而言之,也是利用基因型到表型預(yù)測(cè)模型預(yù)測(cè)雜交組合的產(chǎn)量,實(shí)現(xiàn)在提高2到3倍的遺傳增益速率同時(shí),降低田間測(cè)試的成本。我們?nèi)旱膹埣t偉老師曾經(jīng)非常全面的介紹過全基因組選擇技術(shù),大家可以回顧一下。此外,A、B群間保持一定的遺傳距離是必要的,但遺傳距離與雜種優(yōu)勢(shì)表現(xiàn)的強(qiáng)度(或配合力)并非是完全正相關(guān)的關(guān)系。父、母本基因組中生育期調(diào)控相關(guān)基因,尤其在營養(yǎng)期到生殖期轉(zhuǎn)換節(jié)點(diǎn),時(shí)間與空間上的基因表達(dá)形成一定的契合度,是產(chǎn)生優(yōu)秀配合力的分子基礎(chǔ)。因此,選系的分子本質(zhì)可以理解為是雙親中生育期基因調(diào)控模式的契合度的選擇。雜種優(yōu)勢(shì)模式形成的另一關(guān)鍵因素是雙親中有利、有害等位基因的互補(bǔ)模式。前人利用經(jīng)典遺傳學(xué)理論在這方面提出很多假說解釋雜種優(yōu)勢(shì),但仍未觸及雜種優(yōu)勢(shì)的分子機(jī)理。本人以前的作業(yè)曾提出雜種優(yōu)勢(shì)應(yīng)當(dāng)在作物的全發(fā)育過程去研究,而不是僅僅關(guān)注產(chǎn)量。產(chǎn)量是整個(gè)發(fā)育過程各個(gè)階段不同基因的加性、顯性、上位性效應(yīng)逐步積累的結(jié)果。
(張紅偉老師的補(bǔ)充:這一段讓我想起兩個(gè)問題,一是預(yù)測(cè)的問題,我個(gè)人覺得GS輔助育種是預(yù)測(cè)的初級(jí)應(yīng)用,而且門檻也比較低,在GS預(yù)測(cè)上線性模型和機(jī)器學(xué)習(xí)模型差別也不大。進(jìn)一步的預(yù)測(cè)問題是前面提到的問題,即固定一個(gè)tester,要從100個(gè)育種資源中預(yù)測(cè)怎么樣的基因組組合跟這個(gè)tester最配,以及不固定tester,要從100個(gè)育種資源中預(yù)測(cè)哪種基因型組合跟哪種基因型組合最配。還有更進(jìn)一步的G BY E,從100個(gè)育種資源中預(yù)測(cè),哪種基因型組合和哪種基因型組合在哪個(gè)縣哪個(gè)市表現(xiàn)最好。這些可能不是一般的線性模型和機(jī)器學(xué)習(xí)模型能做的事情,可能需要加入深度學(xué)習(xí)、神經(jīng)網(wǎng)略等大數(shù)據(jù)技術(shù)來輔助預(yù)測(cè)。另一個(gè)問題是本段提到的:選系的分子本質(zhì)可以理解為是雙親中生育期基因調(diào)控模式的契合度的選擇。這個(gè)問題深入思考無論是在分子生物學(xué)角度和數(shù)據(jù)模型的角度都比較復(fù)雜,我覺得存在廣闊的思考空間。一個(gè)問題是為什么雙親需要契合才能有更好的表現(xiàn),為什么單親不行作為品種,可不可以把所有的優(yōu)良基因型都聚集在單親里面,用自交系作為品種,我覺得這方面不是沒有可能,自交系的優(yōu)點(diǎn)是株高矮、不怕風(fēng)吹、抗倒性強(qiáng),而且制種成本極低,優(yōu)良的自交系播種到10000株每畝也是有可能的。再進(jìn)一步思考為什么雙親需要契合,因?yàn)榉肿油緩蕉疾皇菃我坏?,都是與pathway和network的形式起作用的,雙親需要契合的其中一個(gè)原因是某一個(gè)network在其中一個(gè)親本里面不work,但是組配成F1契合之后,work了,我覺得上位性只是在二維空間上來理解分子的network,可能事實(shí)上這個(gè)二維空間只是network中的一根連線,可能一個(gè)基因參與多個(gè)性狀的上位性互作,從這個(gè)基因出發(fā)可能有很多線,遺傳分析上只是發(fā)現(xiàn)了其中的一條線。那么接下來的問題是,我怎么實(shí)現(xiàn)在F1中存在最好的network,可不可以預(yù)測(cè),如何把自然界中最好的network,通過遺傳設(shè)計(jì)產(chǎn)生一個(gè)包含許許多多最好network的F1。在這條路上,既有分子生物學(xué)家的機(jī)遇與挑戰(zhàn),也有生信和統(tǒng)計(jì)專家的基于和挑戰(zhàn)。目前分子生物學(xué)家設(shè)計(jì)的基于pathway basedbreeding,通過導(dǎo)入生化通路創(chuàng)制了golden rice。那么數(shù)據(jù)分析專家能不能預(yù)測(cè)最佳的通路組分基因的最佳單倍型組合,并把他們從100份育種材料中設(shè)計(jì)到一起呢,可能這需要多學(xué)科的配合,非常具有挑戰(zhàn)性)。
三、農(nóng)藝性狀改良的分子基礎(chǔ)。性狀改良雖然大多情況下是以單獨(dú)或少量性狀為目標(biāo),但極少情況下是在選擇單一基因的有利變異。作物在數(shù)千年的馴化、適應(yīng)、改良的過程中,積累了各種類型的變異,包括馴化變異、緯度適應(yīng)性變異(即光周期、積溫適應(yīng)性變異)、微環(huán)境適應(yīng)性變異(即抗病蟲性、營養(yǎng)吸收利用類變異),以及各類農(nóng)藝性狀改良變異。育種改良中性狀每一輪看似微不足道的提升,其實(shí)都是站在巨人的肩膀上,新的有利變異要與上述各類型有利變異達(dá)到一定的契合度后,才可能有效地提高目標(biāo)性狀,同時(shí)又不會(huì)對(duì)其他性狀產(chǎn)生負(fù)面的效應(yīng)。因此,性狀改良的過程是建立性狀之間的“平衡”,其分子本質(zhì)是選擇最優(yōu)的基因調(diào)控網(wǎng)絡(luò)。通俗的比喻,也就在選擇一個(gè)新成員融入到大家庭中后的新的協(xié)作模式,從而提高團(tuán)隊(duì)的整體效率。普通農(nóng)藝性狀的改良(如株型、緯度適應(yīng)性)是可以通過分子設(shè)計(jì)育種的策略而加速實(shí)現(xiàn)的,但要基于育種大數(shù)據(jù)建立模型預(yù)測(cè)最優(yōu)的基因型組合模式。前提條件是有利變異的頻率不能過低(次等位基因頻率在0.05~0.15之間),否則需要的群體規(guī)模是巨大的。
(張紅偉老師的補(bǔ)充:老一輩育種家通過不斷測(cè)試所選出來的骨干自交系包含了很多優(yōu)良基因,大多數(shù)配合力非常好,所以現(xiàn)在我們成為育種改良,改良的意識(shí)就是一點(diǎn)一點(diǎn)的改進(jìn)提高,前文也提高,不可能通過大比例地引入外援供體基因組來實(shí)現(xiàn)改良,分子上來講,一下子引入了太多,破壞了很多本來很好的interaction,從而產(chǎn)生不符合育種家需求的負(fù)向效應(yīng)。改良的目標(biāo)是性狀,引入的供體背景是通過分子通路和網(wǎng)絡(luò)來起作用的。這里面有兩件事情如果弄清楚將助力大數(shù)據(jù)育種和分子育種。一是能不能從分子上或者數(shù)據(jù)分析上知道,哪些通路網(wǎng)絡(luò)起作用后,田間F1表現(xiàn)就好了,不起作用就不行。二是能不能知道從哪些材料里面引入哪些通路和網(wǎng)絡(luò),能起到改良的效果,進(jìn)一步的復(fù)雜問題是這些通路和網(wǎng)絡(luò)發(fā)揮作用的機(jī)制是什么。)
四、特殊配合力的可預(yù)測(cè)性。特殊配合力是很難預(yù)測(cè)的,主要有三點(diǎn)原因:一、特殊配合力大多由微環(huán)境適應(yīng)性變異導(dǎo)致的,頻率極低(即罕見基因型,遠(yuǎn)小于0.01的變異,即使全基因組標(biāo)記也難以覆蓋),但效應(yīng)可能不低(類似人類的單基因罕見病);二、大多是雙親基因組中各自有利變異的互補(bǔ)結(jié)果,非加性效應(yīng)為主;三、受環(huán)境影響較大。但特殊配合力一定是在一般配合力較為優(yōu)秀的基礎(chǔ)上而形成的。篩選特殊配合力強(qiáng)且穩(wěn)定的組合主要通過田間測(cè)試完成,但可以先通過全基因組選擇縮小候選組合范圍,一般選擇候選組合的預(yù)測(cè)產(chǎn)量不顯著低于對(duì)照品種的組合(群體的Top 10%~15%),進(jìn)行多年多點(diǎn)的測(cè)試,檢驗(yàn)特殊配合力在不同環(huán)境下的穩(wěn)定性。
(張紅偉老師的補(bǔ)充:前人研究SCA是各種加加、加顯、顯顯導(dǎo)致的,現(xiàn)在這種不同的上位性有一定的環(huán)境特異性,要不然也不會(huì)導(dǎo)致某些品種只適合在某些地區(qū)推廣。這種加加、加顯、顯顯的分子基礎(chǔ)有沒有可能從數(shù)據(jù)分析的角度搞清楚,為什么有些通路網(wǎng)絡(luò)重組后表現(xiàn)為加加,而另一些表現(xiàn)為加顯和顯顯,從分子不太好理解,可能也不全是interaction或者網(wǎng)絡(luò)的事情,或許有其他效應(yīng)在里面,比如劑量效應(yīng)。或許這些搞清楚的話有利于更精準(zhǔn)的設(shè)計(jì)育種。)
五、抗性的可預(yù)測(cè)性。抗性包括抗病、抗蟲、抗倒伏、抗脅迫等一系列性狀。抗性變異大多為罕見變異,也經(jīng)常和有害變異連鎖。國外抗性標(biāo)記的開發(fā)一般是在克隆抗性基因后,基因功能解析較為透徹、育種體系較為固定、測(cè)試環(huán)境相對(duì)一致的條件下,經(jīng)過長(zhǎng)年的標(biāo)記有效性驗(yàn)證后獲得的穩(wěn)定標(biāo)記。國外抗性標(biāo)記的開發(fā)投入是巨大的,針對(duì)我國育種的情況,抗性篩選的最有效途徑還是在高壓環(huán)境下進(jìn)行測(cè)試。很多抗性是單基因決定的質(zhì)量性狀,因此也是最有希望通過基因編輯等生物技術(shù)手段解決的。
(張紅偉老師的補(bǔ)充:問題是生物脅迫幾套網(wǎng)絡(luò),非生物脅迫幾套網(wǎng)絡(luò),F1產(chǎn)量表現(xiàn)一套網(wǎng)絡(luò)。如何才能使得F1中有各種最好的網(wǎng)絡(luò)。一個(gè)策略是先以選育為主,選好之后再做抗性篩選,就是保證產(chǎn)量具有最好的網(wǎng)絡(luò),抗性網(wǎng)絡(luò)差不多就可以了。另一種策略是通過對(duì)遺傳和生物通路的挖掘,設(shè)計(jì)同時(shí)包含幾套網(wǎng)絡(luò)的基因型組合。)
我國種業(yè)公司、科研單位的研究隊(duì)伍組成單一,缺乏多元化構(gòu)成;與國外種業(yè)公司“多技術(shù)融合型加速育種體系”的發(fā)展方向形成鮮明對(duì)比。一個(gè)育種項(xiàng)目的頂層設(shè)計(jì)固然重要,但仍依靠足夠規(guī)模的群體才能提供育種選擇的遺傳素材。先進(jìn)的生物技術(shù)與檢測(cè)設(shè)備本質(zhì)上是為了降低育種成本、縮短育種周期、積累育種數(shù)據(jù),育種科學(xué)的質(zhì)的飛躍還是需要依賴于理論的創(chuàng)新。現(xiàn)代生物技術(shù)的應(yīng)用為實(shí)現(xiàn)快速創(chuàng)制我國特色的新型種質(zhì)資源提供了條件,如何將有限的資源投入到種質(zhì)創(chuàng)新上,是需要國家的頂層設(shè)計(jì)和支持的。各種技術(shù)利用好了,其實(shí)是有可能將國外種業(yè)巨頭20~30年走過的路,在5~10年內(nèi)完成的。
本文的諸多觀點(diǎn)基于我們實(shí)驗(yàn)室對(duì)育種基因型、表型數(shù)據(jù),種質(zhì)資源數(shù)據(jù)的分析而得出的,是本人“由內(nèi)向外”對(duì)育種的分子本質(zhì)的理解。有些觀點(diǎn)可能是片面的,甚至是錯(cuò)的,歡迎各位一線育種家的批評(píng)指正。同時(shí)也感謝“達(dá)摩院”的另外九位老師對(duì)本文提出的修改意見與熱烈討論。
聯(lián)系客服