作者 | 王向峰,才卓
玉米科學(xué) 2019,27(1):1~9
21 世紀(jì)的第二個 10 年是全球人工智能技術(shù)、基因工程技術(shù)、生命科學(xué)突飛猛進(jìn)的 10 年,同時也為我國玉米育種領(lǐng)域步入嶄新發(fā)展階段提供了千載難逢的機(jī)遇。我國玉米科研領(lǐng)域雖然在玉米基因工程技術(shù)、玉米功能基因解析、玉米基因組學(xué)、玉米群體遺傳學(xué)等基礎(chǔ)研究方面取得了長足進(jìn)展,但育種現(xiàn)代技術(shù)應(yīng)用方面與西方發(fā)達(dá)國家種業(yè)公司相比仍有很大差距。未來三十年內(nèi),我國乃至世界將面臨全球人口激增、氣候持續(xù)變化、土地資源退化、生態(tài)環(huán)境污染等威脅糧食安全的諸多問題,給作物育種行業(yè)帶來新的挑戰(zhàn),迫使育種科技亟需革命性的改變。提升我國玉米育種的科技競爭力、建立玉米育種自主創(chuàng)新體系、加強(qiáng)科研創(chuàng)新成果轉(zhuǎn)化,將傳統(tǒng)玉米育種技術(shù)與信息科學(xué)、生物技術(shù)等高科技手段的深度交叉融合,是保證我國玉米種業(yè)具有持續(xù)國際競爭力的核心。
農(nóng)作物育種的發(fā)展歷程
近百年來玉米育種模式的發(fā)展大體經(jīng)歷了 3 個時期,即主要依賴表型觀察,通過自交加代選育優(yōu)秀自交系的傳統(tǒng)經(jīng)驗(yàn)育種;以雜種優(yōu)勢群體劃分模式為基礎(chǔ),篩選高配合力親本組合為核心的雜種優(yōu)勢育種;綜合了單倍體育種、分子標(biāo)記育種、轉(zhuǎn)基因育種的現(xiàn)代生物工程育種。2018 年初,美國康奈爾大學(xué)玉米遺傳育種學(xué)家、美國科學(xué)院院士 EdwardsBuckler 教授提出了“育種4.0”的理念,即作物育種技術(shù)的發(fā)展伴隨人類社會的進(jìn)步已經(jīng)歷了 3 個標(biāo)志性階段,目前正跨入第四個階段。
1.育種1.0階段
覆蓋過去上萬年的作物育種發(fā)展歷程,主要依賴對作物表型變異的肉眼觀察,憑借耕作者的經(jīng)驗(yàn)和主觀判斷,篩選具有符合農(nóng)業(yè)生產(chǎn)所需要的產(chǎn)量、品質(zhì)與農(nóng)藝性狀的育種材料。該階段主要是耕作者選育具有廣泛表型變異的地方農(nóng)家品種,為現(xiàn)代栽培品種的培育奠定了遺傳資源基礎(chǔ)。
2.育種2.0階段
始于十九世紀(jì)末,伴隨著人類對生物遺傳規(guī)律的認(rèn)識以及田間統(tǒng)計學(xué)、數(shù)量遺傳學(xué)在育種中的應(yīng)用,由職業(yè)育種家通過預(yù)先設(shè)計雜交育種試驗(yàn),選育現(xiàn)代栽培品種。
3.育種3.0階段
貫穿二十世紀(jì)末至今,伴隨現(xiàn)代分子生物學(xué)與基因工程的發(fā)展,采用分子標(biāo)記輔助選擇及轉(zhuǎn)基因技術(shù)的手段,實(shí)現(xiàn)單一目標(biāo)性狀的導(dǎo)入與修飾。同時,基于連鎖群體的功能基因克隆、自然群體的全基因組關(guān)聯(lián)分析、復(fù)雜農(nóng)藝性狀的基因功能解析等研究領(lǐng)域發(fā)展迅猛,加深了人類對作物基因組及基因功能的認(rèn)識。此外,各類高通量測序與芯片平臺的發(fā)展使全基因組選擇輔助育種技術(shù)在作物育種中逐步應(yīng)用起來,現(xiàn)代育種技術(shù)達(dá)到新的高潮。
4.育種4.0階段
是伴隨人類社會步入互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能育種4.0“三位一體的時代提出的革命性育種理念,強(qiáng)調(diào)生命科學(xué)、信息科學(xué)與育種科學(xué)的深度融合。 人工智能是計算機(jī)科學(xué)的一個分支,是指應(yīng)用計算機(jī)算法和程序模擬人類意識與思維方式以及大腦處理信息的過程。人工智能的研究包括機(jī)器人、語言識別、圖像識別、自然語言處理和專家智能決策系統(tǒng)等領(lǐng)域。機(jī)器學(xué)習(xí)方法學(xué)體系是人工智能的核心,是指應(yīng)用計算機(jī)算法建立模型解析數(shù)據(jù),通過不斷學(xué)習(xí)數(shù)據(jù)的自身特征訓(xùn)練模型,然后對現(xiàn)實(shí)世界中的事物做出判斷和預(yù)測。如圖1 所示,育種 4.0 階段的育種家將依托多層面生物技術(shù)與信息技術(shù)推動育種向著智能化的方向發(fā)展,即以基因組測序技術(shù)與人工智能圖像識別技術(shù)為依托,通過基因型與表型數(shù)據(jù)的自動化獲取與解析,實(shí)現(xiàn)玉米組學(xué)大數(shù)據(jù)的快速積累;以生物信息學(xué)與機(jī)器學(xué)習(xí)技術(shù)為依托,通過遺傳變異數(shù)據(jù)、各類組學(xué)數(shù)據(jù)、雜交育種數(shù)據(jù)的整合,實(shí)現(xiàn)作物性狀調(diào)控基因的快速挖掘與表型的精準(zhǔn)預(yù)測;以基因編輯與合成生物學(xué)技術(shù)為依托,通過人工改造基因元器件與人工合成基因回路,實(shí)現(xiàn)作物具備新的抗逆、高效等生物學(xué)性狀;以作物組學(xué)大數(shù)據(jù)與人工智能技術(shù)為依托,通過在全基因組層面上建立機(jī)器學(xué)習(xí)預(yù)測模型,建立智能組合優(yōu)良等位基因的自然變異、人工變異、數(shù)量性狀位點(diǎn)的育種設(shè)計方案,實(shí)現(xiàn)智能、高效、定向培育新品種。
圖1 依托多層面生命科學(xué)與信息科學(xué)推動育種技術(shù)向著智能化的方向發(fā)展
育種 4.0 階段的核心目標(biāo)是建立“作物基因組智能設(shè)計育種的跨學(xué)科、多交叉技術(shù)體系,該體系涵蓋生命科學(xué)領(lǐng)域的基因組技術(shù)、表型組技術(shù)、基因編輯技術(shù)、生物信息學(xué)、系統(tǒng)生物學(xué)、合成生物學(xué),以及信息領(lǐng)域的人工智能技術(shù)、機(jī)器學(xué)習(xí)技術(shù)、物聯(lián)網(wǎng)技術(shù)、圖形成像技術(shù),共同支撐作物育種科學(xué)向更高的層面發(fā)展。到本世紀(jì)中葉,作物新品種的培育周期可以縮短至一年或數(shù)月,甚至實(shí)現(xiàn)在短時期內(nèi)快速馴化出嶄新的農(nóng)作物品種為人類社會所用。育種 4.0 時代的作物基因組智能設(shè)計育種,將推動育種技術(shù)從“藝術(shù)到“科學(xué)到“智能的革命性轉(zhuǎn)變。
玉米基因組智能設(shè)計育種的大數(shù)據(jù)基礎(chǔ)
1.玉米組學(xué)大數(shù)據(jù)資源
玉米基因組智能設(shè)計育種體系的建立必須以玉米基因組、表型組、轉(zhuǎn)錄組、蛋白組、代謝組等各類組學(xué)大數(shù)據(jù)為基礎(chǔ),采用機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘的策略為玉米育種建立各種基因組預(yù)測模型,輔助育種家智能決策育種方案。隨著二代測序與芯片等高通量基因型檢測費(fèi)用的大幅下降,我國現(xiàn)代玉米育種中廣泛實(shí)際應(yīng)用的親本自交系材料、雜交后代材料的基因型數(shù)據(jù)將會呈指數(shù)積累。同時,轉(zhuǎn)錄組、蛋白組、代謝組等數(shù)據(jù)的積累也將逐步拓展到種質(zhì)資源群體的水平,為進(jìn)一步挖掘優(yōu)良等位基因及調(diào)控元件、解析玉米發(fā)育過程與基因調(diào)控網(wǎng)絡(luò)、解析玉米雜種優(yōu)勢分子機(jī)理、解析玉米抗蟲抗病及脅迫應(yīng)答等生物學(xué)過程提供廣泛的數(shù)據(jù)資源。
表型組學(xué)是生命科學(xué)領(lǐng)域近年來興起的一門新型交叉學(xué)科。作物表型組學(xué)研究發(fā)展迅猛,與人工智能、光學(xué)成像、圖像識別技術(shù)在農(nóng)業(yè)中的應(yīng)用密不可分,同時這些技術(shù)也是未來農(nóng)業(yè)發(fā)展精細(xì)耕作、智能裝備的科學(xué)基礎(chǔ)。未來玉米表型組的研究將注重開發(fā)田間農(nóng)藝性狀的采集裝置,利用野外無人機(jī)、田間機(jī)器人、小區(qū)測產(chǎn)系統(tǒng)等農(nóng)業(yè)機(jī)械搭載的智能裝備完成田間作物表型的自動化獲取。玉米表型組裝置配合物聯(lián)網(wǎng)農(nóng)情監(jiān)測系統(tǒng)實(shí)現(xiàn)對局部地區(qū)氣象數(shù)據(jù)、土壤數(shù)據(jù)、病蟲害數(shù)據(jù)等環(huán)境參數(shù)的自動化采集,不僅可以用于基因與環(huán)境互作的分析,也可以用于對玉米表型預(yù)測精度的校正。
作物生理表型組將成為表型組研究的下一個熱點(diǎn)。玉米等作物在病蟲害、環(huán)境脅迫、營養(yǎng)匱乏等條件下,體內(nèi)會發(fā)生一系列生理生化活動的變化。這些變化可以通過各類光學(xué)成像設(shè)備得以監(jiān)測,如激光三維掃描成像、高光譜成像、多光譜成像、熱成像、普通光學(xué)成像、葉綠素?zé)晒鈩恿W(xué)成像、近紅外成像、雷達(dá)成像等,這些光學(xué)設(shè)備可以用來采集植物內(nèi)部近百種生理指標(biāo)。深度學(xué)習(xí)技術(shù)可以從生理表型組圖像數(shù)據(jù)中提取特征波段,反演出植物在感病、感蟲、脅迫等條件下的生理生化變化狀態(tài)。數(shù)字化的表型組數(shù)據(jù)不僅可以將復(fù)雜的復(fù)合表型進(jìn)行分解,也消除了肉眼性狀調(diào)查引入的主觀偏差,提高挖掘性狀調(diào)控基因的精度。
2.全基因組選擇輔助育種
分子設(shè)計育種的概念自上世紀(jì)末提出,即利用與性狀連鎖的 DNA 變異信息作為“分子標(biāo)記,對重要的性狀決定基因進(jìn)行篩選、優(yōu)化、組合,模擬出滿足不同育種目標(biāo)的理想基因型。在過去三十年的時間里,分子設(shè)計育種在基因?qū)用嫔陷o助育種家選擇親本材料和設(shè)計雜交育種組配方案,其發(fā)展歷程大體經(jīng)歷了以下 3 個階段:單基因選擇、多基因聚合以及全基因組選擇輔助育種。與分子標(biāo)記輔助育種不同的是,基因組選擇育種是考慮基因組中數(shù)萬甚至數(shù)百萬的分子標(biāo)記信息,在訓(xùn)練群體中建立基因組選擇模型推導(dǎo)基因型與表型間的相關(guān)性,在候選群體中模擬和預(yù)測雜交后代可能產(chǎn)生的表型,育種家可以根據(jù)雜種一代表型預(yù)測的結(jié)果選擇育種價值較高的親本材料,設(shè)計合理的雜交、回交育種方案。玉米育種主要利用自交系間的雜種優(yōu)勢現(xiàn)象培育雜交種,是應(yīng)用基因組選擇育種的理想作物。
玉米中應(yīng)用基因組選擇育種的流程分為如下幾個步驟(圖2):首先,選擇來自不同雜種優(yōu)勢群的親本自交系材料進(jìn)行基因組重測序或 SNP 芯片基因分型, 親本群體的基因型數(shù)據(jù)需要生物信息分析進(jìn)一步處理,并通過建立系統(tǒng)發(fā)育樹對親本材料的群體結(jié)構(gòu)和親緣關(guān)系進(jìn)行初步解析;其次,選擇一定比例的代表性親本材料通過雜交實(shí)驗(yàn)建立 F1 訓(xùn)練群體,并對雜種一代的表型進(jìn)行完善、細(xì)致的性狀調(diào)查,每個雜種一代的基因型則可以通過其雙親的基因型推導(dǎo)出來;再次,在已知基因型與表型的 F1 訓(xùn)練群體中構(gòu)建基因組選擇模型,推導(dǎo)基因型與表型的相關(guān)性,模型中可以進(jìn)一步加入親本表型、環(huán)境變量、群體結(jié)構(gòu)等參數(shù)作為固定效應(yīng)調(diào)整模型的預(yù)測精度;最后,在未知表型的候選群體中應(yīng)用基因組選擇模型進(jìn)行預(yù)測,以模擬的 F1 的基因型作為輸入,預(yù)測雜種一代的開花期、株高、產(chǎn)量等表型。在開展玉米基因組選擇育種實(shí)驗(yàn)中,代表性親本自交系材料的選擇,以及訓(xùn)練群體與候選群體的劃分比例尤為重要。
前期研究表明,在群體結(jié)構(gòu)較為一致、親本材料較為固定的前提下,對玉米開花期的預(yù)測精度可以達(dá)到 0.75 左右, 對株高的預(yù)測精度可以達(dá)到 0.85 左右,對穗重和穗重中親優(yōu)勢的預(yù)測精度可以分別達(dá)到 0.65 和 0.80 左右。除了對表型性狀的預(yù)測,基因組選擇模型也可以對遺傳力、一般配合力、特殊配合力、收獲指數(shù)等育種中常用指標(biāo)進(jìn)行預(yù)測,輔助育種家選擇優(yōu)良親本自交系。除了農(nóng)藝性狀相關(guān)表型的預(yù)測,通過全基因組關(guān)聯(lián)分析挖掘的抗蟲抗病、耐鹽耐旱等脅迫應(yīng)答相關(guān)分子標(biāo)記也可以用于建立基因組選擇模型。玉米自交系材料耐鹽研究的結(jié)果表明,利用鹽脅迫條件下獲得的代謝組數(shù)據(jù),與基因組數(shù)據(jù)關(guān)聯(lián)分析挖掘的 2200 個標(biāo)記建立的基因組選擇模型,對親本材料耐鹽等級評價的精度可以達(dá)到 0.75~0.80 的水平。
圖2基因組選擇育種示意圖
傳統(tǒng)基因組選擇模型主要應(yīng)用統(tǒng)計學(xué)中的混合線性模型建立基因型與表型間的相關(guān)性。但是,隨著高通量基因組測序與表型組監(jiān)測技術(shù)的飛速發(fā)展,混合線性模型已無法適應(yīng)數(shù)百萬標(biāo)記和數(shù)萬計樣本量的大數(shù)據(jù)分析與高性能并行運(yùn)算。此外,由于玉米產(chǎn)量雜種優(yōu)勢的表現(xiàn)由非加性遺傳效應(yīng)所決定,并且受環(huán)境因素影響較重,使用混合線性模型預(yù)測產(chǎn)量雜種優(yōu)勢的表現(xiàn)仍存在一定的問題。為突破混合線性模型的預(yù)測精度瓶頸,應(yīng)用機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘的策略,整合基因組、表型組、環(huán)境參數(shù)等多維數(shù)據(jù)源建立基因組選擇模型,是基因組選擇育種的下一步發(fā)展方向。該領(lǐng)域?qū)⒅攸c(diǎn)嘗試深度學(xué)習(xí)、集成學(xué)習(xí)等人工智能領(lǐng)域中的先進(jìn)算法建立作物表型預(yù)測模型。機(jī)器學(xué)習(xí)技術(shù)建立的“基因型到表型的預(yù)測模型育種應(yīng)用將更為廣泛,可以實(shí)現(xiàn)玉米基本農(nóng)藝性狀與產(chǎn)量預(yù)測、親本配合力與子代雜種優(yōu)勢預(yù)測、玉米營養(yǎng)吸收與高效利用評價、玉米抗病蟲與抗逆境評價、玉米最優(yōu)環(huán)境生態(tài)區(qū)選擇等預(yù)測功能,最終實(shí)現(xiàn)智能化、自動化地輔助育種家設(shè)計育種方案。
3.基因編輯構(gòu)建突變體庫
玉米基因組中大約有 4 萬個編碼蛋白的基因, 但僅有不足 200 個基因得以克隆和功能驗(yàn)證。隨著玉米轉(zhuǎn)基因技術(shù)的逐漸成熟,采用基于 CRISPR/Cas9 基因編輯技術(shù)高通量敲除玉米基因,建立玉米全基因組范圍的突變體庫,實(shí)現(xiàn)快速篩選與鑒定調(diào)控重要農(nóng)藝性狀的關(guān)鍵基因。在作物中應(yīng)用基因編輯技術(shù)對單個基因的功能敲除、改變單一目標(biāo)農(nóng)藝性狀已有諸多成功的案例。如在水稻、玉米、大豆、馬鈴薯等作物中以乙酰乳酸合成酶基因(ALS)為靶點(diǎn)編輯創(chuàng)制的 ALS 突變植株,對乙酰乳酸合成酶抑制劑類除草劑的耐受性是野生型的1萬倍。玉米中利用基因編輯技術(shù)通過對 Wx1 基因的修飾提高直鏈淀粉含量、對 TMS5基因的修飾創(chuàng)制熱敏雄性不育材料、對 ZmMTL 基因修飾創(chuàng)制單倍體誘導(dǎo)系材料、對 ARGOS8 基因修飾創(chuàng)制耐旱材料,為玉米遺傳改良育種和分子設(shè)計育種提供重要的供體材料。
采用高通量定向基因編輯技術(shù)建立突變體庫是作物功能基因組研究的重要方向。2017 年 6 月,Mo- lecularPlant 以背靠背的形式發(fā)表了李家洋院士團(tuán)隊(duì)與百格基因研究團(tuán)隊(duì)利用 CRISPR/Cas9 基因編輯結(jié)合寡核苷酸芯片技術(shù),在全基因組范圍內(nèi)對水稻基因進(jìn)行編輯,構(gòu)建水稻定向基因編輯突變體庫。玉米定向基因編輯突變體庫的建立可以參考水稻中的研究思路,在 3~5 年內(nèi)逐步完成全基因組范圍內(nèi)的基因敲除。玉米突變體庫建成后的工作重點(diǎn)將轉(zhuǎn)向突變體表型的鑒定、功能基因的挖掘,以及關(guān)鍵農(nóng)藝性狀分子機(jī)制的解析,為玉米遺傳改良與分子設(shè)計育種提供基礎(chǔ)遺傳材料。
4.人工合成抗逆基因回路
合成生物學(xué)是在系統(tǒng)生物學(xué)的基礎(chǔ)上,采用工程系統(tǒng)設(shè)計的理念合成人工基因回路,為一個物種引入多基因參與的生物通路,使該物種具備新的生物學(xué)功能。人工合成基因回路的最大優(yōu)勢是可以利用來自微生物等其他物種的外源基因,解決依靠改造作物自身基因組難以實(shí)現(xiàn)的性狀改良的問題。合成生物學(xué)的方法在玉米育種中較為適合解決玉米抗逆性和環(huán)境適應(yīng)性的問題。自然界中各種極端環(huán)境微生物包含大量的耐酸、耐鹽、耐熱、耐寒等基因資源。微生物中的合成生物學(xué)研究已積累了大量的抗逆基因元器件與模塊。諸多研究表明,微生物與植物的抗逆通路存在生物學(xué)共性。隨著玉米轉(zhuǎn)基因技術(shù)的成熟,將微生物中現(xiàn)有的抗逆基因回路整合到玉米基因組中,快速培育高抗玉米新品種有望在不久的將來實(shí)現(xiàn)。
以玉米為底盤生物的合成生物學(xué)研究仍有大量前期基礎(chǔ)研究工作需要開展,尤其是如何提高微生物的基因與玉米基因組脅迫應(yīng)答系統(tǒng)的兼容性,以及建立基于玉米環(huán)境信號感應(yīng)的智能反饋系統(tǒng),控制和調(diào)節(jié)基因抗逆回路的開與關(guān)、高與低。未來10 年內(nèi),玉米人工合成抗逆回路的研究將分階段逐步開展,包括玉米抗逆基因元器件的挖掘、評價與篩選,玉米環(huán)境信號反饋通路與基因調(diào)控網(wǎng)絡(luò)建模,玉米抗逆基因回路的智能化組裝與穩(wěn)定性表達(dá)等。最后,隨著數(shù)據(jù)的積累與基因回路的反復(fù)優(yōu)化,最終實(shí)現(xiàn)高適配性、高靶向性玉米人工合成抗逆基因回路的智能設(shè)計、組裝、表達(dá)。
5.基因組智能設(shè)計育種體系
隨著人類社會步入人工智能的新紀(jì)元,未來作物育種模式將發(fā)生歷史性的變革。玉米育種科學(xué)將在組學(xué)大數(shù)據(jù)與生物信息學(xué)、基因編輯技術(shù)與合成生物學(xué)、人工智能與機(jī)器學(xué)習(xí)技術(shù)等多學(xué)科、多領(lǐng)域的共同支撐下,推動玉米育種快速邁進(jìn)育種 4.0 階段。未來十年到二十年里,我國玉米育種領(lǐng)域的核心發(fā)展目標(biāo)之一是創(chuàng)建“玉米基因組智能設(shè)計育種” 技術(shù)體系,集成生命科學(xué)與信息科學(xué)領(lǐng)域的技術(shù)優(yōu)勢,全方位提高我國玉米育種科技的國際競爭力。所謂“基因組智能設(shè)計的核心體現(xiàn),是應(yīng)用人工智能模擬的方法,為某一育種群體材料人工設(shè)計聚合了所有優(yōu)勢基因,具有“理想基因型”的虛擬基因組; 再用機(jī)器學(xué)習(xí)模型預(yù)測虛擬親本基因組與測試親本基因組組配產(chǎn)生的雜交后代的“理想表型”。所謂“理想表型”則是該育種群體所能創(chuàng)造的雜種后代性狀的理論上限,是該育種群體的雜種優(yōu)勢利用的潛力極限。根據(jù)智能設(shè)計的理想基因型,建立親本自交系創(chuàng)制方案和雜交育種方案,快速逼近雜交后代的理想表型。
常規(guī)玉米雜交育種的應(yīng)用場景如圖3 所示,假設(shè)某一育種群體包含 5000 個親本自交系作為母本,與某一骨干父本作為測驗(yàn)種雜交,獲得 5000 個 F1 的產(chǎn)量分布與對照品種進(jìn)行比較,篩選比對照品種產(chǎn)量提高的組合。玉米基因組智能設(shè)計育種的流程則分為以下 4 個環(huán)節(jié):首先,鑒定親本的基因型,以及與測驗(yàn)種雜交后 F1 的產(chǎn)量表型;其次,通過對 5000 個母本自交系的優(yōu)勢等位基因型、劣勢等位基因型進(jìn)行推導(dǎo),建立針對該雜交育種群體最優(yōu)的理想基因組,該理想基因組聚合了該群體中所有的優(yōu)勢等位基因,以及盡量排除了所有劣勢等位基因,虛擬的理想基因組與測試種雜交獲得表型即該群體理想產(chǎn)量的理論上限;第三,根據(jù)理想基因組聚合優(yōu)勢等位基因的規(guī)律,從母本自交系中選擇一定比例的材料,創(chuàng)制新的優(yōu)良母本自交系材料,如 500 個理想基因型自交系;第四,500 個理想基因型自交系與測驗(yàn)種雜交獲得的產(chǎn)量分布更加接近理論上限,同時有更高比例的組合高于對照品種的表型。
圖3 玉米基因組智能設(shè)計育種示意圖
基因組智能設(shè)計育種商業(yè)模式—玉米育種4.0
作物育種 4.0 階段的核心是大數(shù)據(jù)驅(qū)動的基因組智能設(shè)計育種,其跨學(xué)科、多技術(shù)交叉的特點(diǎn)決定了育種 4.0 階段的育種商業(yè)運(yùn)作模式需要多學(xué)科領(lǐng)域的技術(shù)支撐與產(chǎn)學(xué)研一體的研發(fā)鏈條,圍繞育種行業(yè)的需求為總體目標(biāo),整合生命科學(xué)、信息科學(xué)、數(shù)據(jù)科學(xué)、人工智能等領(lǐng)域的技術(shù)專長,推動我國玉米育種產(chǎn)業(yè)向著工程化、智能化的方向發(fā)展(圖4)。最終,通過育種大數(shù)據(jù)與人工智能決策,實(shí)現(xiàn)輔助育種家精準(zhǔn)篩選玉米優(yōu)良親本組合,快速創(chuàng)制玉米優(yōu)良自交系,有效地縮短育種周期,提高育種效率,降低育種成本。
圖4 玉米育種4.0 商業(yè)模式
1.玉米基因型大數(shù)據(jù)體系
大數(shù)據(jù)驅(qū)動的智能育種運(yùn)作模式的前提條件是標(biāo)準(zhǔn)化大數(shù)據(jù)體系,即建立來自玉米科研領(lǐng)域與育種行業(yè)的基因型與表型數(shù)據(jù)的規(guī)范化采集、處理、提煉、分析、存儲與管理的數(shù)據(jù)庫系統(tǒng)。玉米科研領(lǐng)域主要貢獻(xiàn)種質(zhì)資源群體的基因組、轉(zhuǎn)錄組、代謝組、蛋白組等數(shù)據(jù)類型,通過多維度生物組學(xué)數(shù)據(jù)的聯(lián)合分析,挖掘株型、產(chǎn)量、抗病、抗蟲、耐鹽、耐旱、耐寒等性狀相關(guān)的重要基因與自然變異,為分子設(shè)計育種與基因人工改造提供素材。商業(yè)化基因編輯與轉(zhuǎn)基因技術(shù)公司為玉米基因改造提供專業(yè)化技術(shù)服務(wù),大規(guī)模建立玉米定向基因突變體庫與創(chuàng)制育種供體材料。以玉米為底盤細(xì)胞的合成生物學(xué)將逐步開展起來,借助極端微生物中的抗性基因創(chuàng)造人工合成抗逆基因回路,突破玉米自身基因抗脅迫的瓶頸。我國也將建立為育種行業(yè)提供數(shù)據(jù)共享服務(wù)的玉米基因型與分子標(biāo)記數(shù)據(jù)庫,為商業(yè)育種提供有效的分子檢測標(biāo)記資源。隨著二代測序、SNP 芯片等不同通量的基因型檢測成本的降低,為商業(yè)育種的骨干親本、測試親本、親本衍生系、DH 系等不同群體提供更加靈活和便利的基因分型解決方案。與雜交組合測試實(shí)驗(yàn)的費(fèi)用相比,越來越多的育種企業(yè)將選擇更低成本的基于基因型的表型預(yù)測輔助每年育種方案的設(shè)計和決策。
2.玉米表型與環(huán)境大數(shù)據(jù)體系
在圖形圖像技術(shù)、人工智能技術(shù)、物聯(lián)網(wǎng)技術(shù)的支撐下,玉米育種實(shí)驗(yàn)數(shù)據(jù)與種植生產(chǎn)數(shù)據(jù)將指數(shù)增長,逐步形成玉米表型與環(huán)境大數(shù)據(jù)體系。未來 10 年里,將有一大批商業(yè)化農(nóng)業(yè)服務(wù)科技公司崛起,為玉米種業(yè)行業(yè)提供表型監(jiān)測的各類技術(shù)服務(wù)。田間表型數(shù)據(jù)的采集使用小型無人機(jī)、野外機(jī)器人、農(nóng)業(yè)機(jī)械裝備搭載的光學(xué)設(shè)備、雷達(dá)設(shè)備在不同玉米生長時期內(nèi)自動化采集表型圖像。圖形圖像數(shù)據(jù)經(jīng)過專業(yè)的深度學(xué)習(xí)模型數(shù)字化處理,轉(zhuǎn)換成育種中常用的標(biāo)準(zhǔn)化農(nóng)藝性狀數(shù)據(jù)。用于采集玉米生長發(fā)育過程中的生理生化指標(biāo)的離子檢測傳感器等便攜式設(shè)備將逐步應(yīng)用起來,用于生理表型數(shù)據(jù)的獲取。生理表型組數(shù)據(jù)將有助于挖掘抗逆相關(guān)基因,以及氮磷鉀等營養(yǎng)物質(zhì)高效吸收利用材料的篩選。作物的田間長勢、產(chǎn)量性狀與環(huán)境因素息息相關(guān)。應(yīng)用農(nóng)業(yè)物聯(lián)網(wǎng)技術(shù)配合田間農(nóng)情監(jiān)測系統(tǒng)對測試區(qū)域的氣象與土壤數(shù)據(jù)、蟲害與病害數(shù)據(jù)、生長與產(chǎn)量數(shù)據(jù),以及收獲后測產(chǎn)數(shù)據(jù)進(jìn)行自動化采集。各類環(huán)境數(shù)據(jù)通過通信網(wǎng)絡(luò)傳輸至云端服務(wù)器進(jìn)行處理、分析、存儲與管理,實(shí)現(xiàn)對育種實(shí)驗(yàn)站點(diǎn)的常年多點(diǎn)式追蹤。環(huán)境因子數(shù)據(jù)整合到預(yù)測模型中可以顯著提高模型預(yù)測精度,更加精準(zhǔn)的預(yù)測產(chǎn)量雜種優(yōu)勢、基因型與環(huán)境互作,為玉米品種最優(yōu)種植生態(tài)區(qū)的選擇提供決策。
3.玉米基因組育種模型體系
玉米育種材料基因型數(shù)據(jù)與田間表型數(shù)據(jù)的集中式采集與管理為建立育種智能決策模型提供廣泛的訓(xùn)練集合。在國際知名種業(yè)公司的商業(yè)化育種體系中,育種信息管理系統(tǒng)、育種價值評估模型、分子設(shè)計育種工具、育種決策工具等一系列信息管理與數(shù)據(jù)分析模塊是銜接整個育種流程中每個環(huán)節(jié)的重要節(jié)點(diǎn),用數(shù)據(jù)決策每個環(huán)節(jié)的育種方案。我國育種 4.0 階段的重要任務(wù)之一是結(jié)合中國的實(shí)際情況, 為我國玉米種業(yè)行業(yè)建立工程化育種與信息化管理體系,應(yīng)用大數(shù)據(jù)與機(jī)器學(xué)習(xí)技術(shù)建立一系列育種智能決策模型,覆蓋育種流程中的每一環(huán)節(jié),為育種企業(yè)提供數(shù)據(jù)分析與決策服務(wù),包括基因型與表型數(shù)據(jù)的自動化處理、親本自交系材料的雜優(yōu)群體劃分、玉米基礎(chǔ)農(nóng)藝性狀的表型預(yù)測、玉米產(chǎn)量與雜種優(yōu)勢的預(yù)測、一般配合力與特殊配合力的預(yù)測、營養(yǎng)高效利用與吸收效率的預(yù)測、育種材料的抗蟲與抗病等級評價、抗逆境與非生物脅迫等級評價、玉米品種的環(huán)境適應(yīng)性與最優(yōu)種植生態(tài)區(qū)預(yù)測,以及供體親本材料的標(biāo)記篩選等育種決策服務(wù)。未來將有一大批提供育種數(shù)據(jù)分析與決策服務(wù)的農(nóng)業(yè)科技公司涌現(xiàn),推動玉米育種數(shù)據(jù)的規(guī)?;c標(biāo)準(zhǔn)化,逐步形成針對我國玉米育種材料的訓(xùn)練群體,提高育種決策模型的普遍適用性。
4.玉米精準(zhǔn)種植模型體系
玉米育種模型與種植模型是相輔相成的。大數(shù)據(jù)驅(qū)動的精準(zhǔn)種植模型重點(diǎn)結(jié)合天氣、土壤、遙感等環(huán)境大數(shù)據(jù),針對某一玉米雜交種品種建立的氣候模型、土壤模型、播種模型、植保模型、營養(yǎng)模型,以及該品種的地上生長模擬模型、根系生長模擬模型, 為玉米種植者提供實(shí)時、高效、精準(zhǔn)的耕作管理決策。氣候模型可以通過調(diào)取過去 10 年目標(biāo)種植區(qū)域的衛(wèi)星遙感圖像,以及過去 20 年氣候情況、地形變化、耕作制度等信息,進(jìn)行綜合分析建模。同時, 根據(jù)擬播種玉米品種的生長特性,計算目標(biāo)種植區(qū)域的氣溫、降水量、病蟲害等環(huán)境限制因素,預(yù)測擬播種品種的潛在產(chǎn)量或推薦最佳種植品種,確定最佳種植密度和最優(yōu)單產(chǎn)產(chǎn)量。土壤模型可以通過對耕作土壤地表下 100cm的深度范圍進(jìn)行橫切面分析,與全球范圍收集的 500 個土壤樣本進(jìn)行對比,確定土壤土質(zhì)類型;同時,提取土壤樣本在專業(yè)化實(shí)驗(yàn)室對土壤內(nèi)的化學(xué)元素進(jìn)行分析建模,精確計算目標(biāo)區(qū)域的土壤供肥能力。播種模型可以根據(jù)過去 8~10 年的歷史播種日期、地表溫度與 5cm 土層土壤溫度、歷史與實(shí)時氣象數(shù)據(jù)、未來 10d 降雨與氣溫預(yù)測最佳播種日期,確保播種后 8d 內(nèi)的 100% 出苗率并達(dá)到出苗整齊。在玉米生長過程中,可以利用玉米發(fā)育模型推斷玉米生長發(fā)育進(jìn)程和根系生長情況是否正常;利用便攜式葉綠素儀、離子傳感器等設(shè)備動態(tài)監(jiān)測玉米植株內(nèi)營養(yǎng)成分是否正常;同時,利用營養(yǎng)模型預(yù)測最佳追肥時間與追肥數(shù)量。病蟲害預(yù)測模型可以根據(jù)當(dāng)年的氣溫、濕度等情況以及孢子捕獲器的數(shù)據(jù)推測疾病防控的最佳時期,確定農(nóng)藥噴灑的劑量和時間。目前在我國精準(zhǔn)種植決策已作為農(nóng)業(yè)科技服務(wù)的項(xiàng)目之一,優(yōu)先在玉米種植中發(fā)揮作用。實(shí)踐表明,通過玉米的精準(zhǔn)種植決策,在單產(chǎn)產(chǎn)量不變的情況下有效地降低種植管理成本 15 到 30 個百分點(diǎn),實(shí)現(xiàn)成本效益最大化。
5.玉米育種方案設(shè)計決策體系
玉米育種模型的分析與預(yù)測結(jié)果將整理成標(biāo)準(zhǔn)化報告,輔助育種家篩選育種材料與設(shè)計育種流程。基因組設(shè)計育種的智能決策主要在基因組選擇的水平上體現(xiàn)兩個層面的內(nèi)容:其一是根據(jù)雜種一代的表型預(yù)測結(jié)果篩選一般配合力和特殊配合力整體優(yōu)于對照品種的優(yōu)良親本自交系,建立雜交育種組合實(shí)驗(yàn)方案,該步驟基本可以直接獲得可接近品種的玉米雜交種;其二是采用基因組智能設(shè)計算法, 模擬適用于該育種群體的親本理想基因組與子代理想表型,以理想表型為目標(biāo),設(shè)計親本自交系的雜交方案并結(jié)合單倍體育種技術(shù)實(shí)現(xiàn)快速創(chuàng)制新的優(yōu)良自交系。親本理想基因組理論上聚合了該育種群體的自交系所涵蓋的大部分優(yōu)勢等位基因,同時排除了大部分劣勢等位基因。親本理想基因組與測試親本雜交產(chǎn)生的子代理想表型,尤其是產(chǎn)量及其雜種優(yōu)勢相關(guān)性狀,基本代表了該育種群體所能實(shí)現(xiàn)的理論產(chǎn)量的上限。有了理想基因組作為參考,隨即可以根據(jù)理想基因組中包含優(yōu)勢等位基因的染色體片段的重組規(guī)律,從眾多親本自交系中遴選包含優(yōu)良染色體片段較多的少數(shù)親本組合,建立最優(yōu)雜交組合方式,結(jié)合單倍體育種技術(shù)實(shí)現(xiàn)優(yōu)良親本自交系的快速創(chuàng)制。
6.中國育種4.0商業(yè)模式初探
育種 4.0 商業(yè)模式的建立需要以數(shù)據(jù)為基礎(chǔ)。與國際種業(yè)公司完善的育種實(shí)驗(yàn)數(shù)據(jù)管理系統(tǒng)與基因組選擇預(yù)測模型相比,我國玉米育種行業(yè)內(nèi)的基因型、表型、環(huán)境數(shù)據(jù)缺乏統(tǒng)一、規(guī)范化的管理。因此,當(dāng)務(wù)之急是建立符合我國玉米育種實(shí)際情況的基因型、表型與環(huán)境數(shù)據(jù)管理標(biāo)準(zhǔn)體系,以及在此基礎(chǔ)上建立起普遍適用于我國玉米育種行業(yè)的基因組選擇育種的訓(xùn)練群體與預(yù)測模型,作為公共平臺為我國玉米種業(yè)行業(yè)提供育種決策服務(wù)。
建立公共基因組選擇訓(xùn)練群體的基礎(chǔ)材料可以由我國玉米育種行業(yè)和玉米學(xué)科群內(nèi)的單位提供。首批標(biāo)準(zhǔn)訓(xùn)練群體可以主要針對我國東華北與黃淮海生態(tài)區(qū)選擇應(yīng)用較為廣泛、在各個雜種優(yōu)勢群中有較高代表性的 200 個左右優(yōu)良骨干親本自交系作為基礎(chǔ)群體,每個基礎(chǔ)群體雜交產(chǎn)生的 F1 代雜交種再通過單倍體加倍生產(chǎn) 200 個左右的DH 系。DH 系群體再與 1 到 2 個公共測驗(yàn)種雜交獲得 F1 代雜交種訓(xùn)練群體。那么,標(biāo)準(zhǔn)訓(xùn)練群體將包括 4 萬到 8 萬個左右的 F1 代雜交種。通過誘導(dǎo)優(yōu)良基礎(chǔ)群體建立的大規(guī)模訓(xùn)練群體,不僅提高了群體的遺傳多樣性,同時也聚合了高產(chǎn)、抗逆等優(yōu)良等位基因,更加適合基因組選擇預(yù)測模型的建立以及理想基因組的模擬。
DH 系親本群體的基因型通過統(tǒng)一的 SNP 芯片或 SNP 捕獲測序的方式進(jìn)行檢測,并與測試種的基因型合并模擬出F1代雜交種的基因型。表型性狀數(shù)據(jù)將按照統(tǒng)一、規(guī)范的采集方法進(jìn)行三年五點(diǎn)的調(diào)查、錄入、處理、存儲與管理。該標(biāo)準(zhǔn)訓(xùn)練群體首先將用于實(shí)現(xiàn)基本農(nóng)藝性狀與產(chǎn)量的預(yù)測,在此群體基礎(chǔ)之上再設(shè)計更多的脅迫、營養(yǎng)、抗病、抗蟲等實(shí)驗(yàn)逐步積累數(shù)據(jù),最終實(shí)現(xiàn)親本配合力與雜種優(yōu)勢預(yù)測、玉米營養(yǎng)吸收與高效利用評價、玉米抗病蟲與抗逆境評價、玉米最優(yōu)環(huán)境生態(tài)區(qū)選擇等各個方面的育種決策。此外,建立該標(biāo)準(zhǔn)訓(xùn)練群體的基礎(chǔ)自交系材料是固定的,更有助于研究優(yōu)良等位基因型的組合模式與優(yōu)良農(nóng)藝性狀的關(guān)系,為理想基因組智能設(shè)計與新的優(yōu)良自交系的創(chuàng)制提供參考。
結(jié)語
育種 4.0 時代的育種技術(shù)變革依賴于基因組技術(shù)、大數(shù)據(jù)技術(shù)、人工智能技術(shù)的緊密結(jié)合。本世紀(jì)前二十年生物技術(shù)與人工智能技術(shù)的突飛猛進(jìn),為我國玉米育種行業(yè)的歷史性變革與國際競爭力的提升帶來前所未有的機(jī)遇與挑戰(zhàn)。未來五到十年的時間里,我國玉米育種學(xué)科群將緊緊把握歷史機(jī)遇、協(xié)同創(chuàng)新建立適合我國玉米育種產(chǎn)業(yè)的育種 4.0 技術(shù)體系。育種 4.0 的實(shí)現(xiàn)將以玉米育種為突破口,逐步拓展到水稻、小麥、大豆等農(nóng)作物、園藝作物與經(jīng)濟(jì)作物的育種應(yīng)用中,在未來 10 到 20 年內(nèi)實(shí)現(xiàn)育種從“藝術(shù)到“科學(xué)到“智能的革命性轉(zhuǎn)變。
來源:玉米科學(xué) 2019,27(1):1~9
參考文獻(xiàn):略
- END -