病毒是嚴格胞內(nèi)寄生的病原,盡管依賴于宿主細胞存活,但其進化是自主的,在與宿主的博弈中保持基因組和進化軌跡。2022年7月13日,美國國家生物信息中心的Eugene V. Koonin、Valerian V. Dolja和法國巴斯德研究所的Mart Krupovic聯(lián)名在Cell Host & Microbe發(fā)表觀點文章The logic of virus evolution,討論一種解釋病毒宏觀進化的簡單功能邏輯。作者認為一小部分負責基因組復制的核心基因傳承自原始復制子,但從編碼衣殼蛋白的基因起,大部分病毒基因陸續(xù)來自于自宿主。上述基因中最古老的可以追溯至所謂的最后一個共有細胞祖先(LUCA)。病毒基因的獲取主要來自兩種途徑:直接有助于病毒復制的基因可直接招募,當宿主基因可被重利用做某些病毒功能時可擴展利用。現(xiàn)有理論和經(jīng)驗證據(jù)都支持一種假設:除某些胞內(nèi)病原體,所有細胞生物都可作為多種病毒的宿主。病毒多樣性之豐富遠超其宿主,至少表現(xiàn)在兩個維度上:其一,細胞生物使用統(tǒng)一的遺傳信息儲存和表達模式,即由雙鏈DNA基因組轉錄成mRNA,再翻譯成蛋白質,但病毒可高效利用上述兩類核酸分子進行任何形式的信息傳遞。其二,病毒基因的進化速度通常遠快于其宿主,且病毒基因在其序列中占比更高。事實上,同一科(family)中的病毒序列多樣性甚至超過細胞生物一個域(domain)的多樣性,這使得分析病毒基因的深度進化關系和祖先更具挑戰(zhàn)性。病毒基因組的大小橫跨三個數(shù)量級——最小不過2kb(單鏈RNA),最大甚至超過2Mb(某些DNA病毒,如巨型潘多拉病毒)。因此病毒基因組既包括已知最簡單的蛋白編碼復制子,也包括巨型病毒,后者甚至超過某些原核和單細胞真核生物基因組的尺度和復雜性。當我們談論病毒進化時,標準概念是指病毒被限定于其細胞宿主中持續(xù)進行對抗的過程。在這場軍備競賽中,宿主演化并創(chuàng)造出多種抗病毒防御機制,病毒也相應地產(chǎn)生對抗系統(tǒng)用于壓制宿主防御。而病毒和宿主間大量的基因交換使這種競爭更加復雜糾纏:病毒頻繁地獲取宿主基因,并使其服務于病毒復制和病毒-宿主互作;相對應地,宿主也獲取病毒基因,并將其改造為防御手段或其他功能【1】。與物種間的水平基因轉移不同,病毒和宿主間的基因流得益于病毒復制的關鍵特征,即嚴格限定于胞內(nèi),這允許復制中的病毒基因組與宿主的基因組和mRNA近距離接觸。在這篇觀點文章中,作者討論了病毒如何獲得宿主基因,及病毒-宿主共進化過程如何塑造病毒基因組。作者認為病毒基因的獲取導致基因組的巨大差異,該過程由簡單的邏輯支配——病毒將宿主蛋白轉變?yōu)橛欣谧陨韽椭频幕竟δ埽鲜鲞m應過程既包括直接獲取某一功能基因,又包括基因功能的擴展(所獲得蛋白的功能變化,伴隨著原功能的喪失,但蛋白結構大致不變)。這種細胞蛋白重賦能(repurposing)的邏輯決定了病毒宏觀進化的軌跡,包括新病毒類群的出現(xiàn)。病毒蛋白質組比較分析顯示存在一小組病毒標志蛋白,廣泛分布于不同病毒中,在病毒復制(復制相關VHP)和病毒顆粒形成(結構性VHP)中扮演關鍵角色。這兩類VHP的起源強烈暗示進化存在不同路徑,進而轉化為病毒起源的一種簡約場景【2】。復制相關VHP,包括RNA依賴的RNA聚合酶(RdRP)和逆轉錄酶(RT)、蛋白引發(fā)的DNA聚合酶、滾環(huán)復制內(nèi)切酶、超家族3解旋酶(S3H),僅與胞內(nèi)蛋白存在微弱的同源性,暗示起源于遠古,可能早于LUCA。使用多種計算方法重建的進化過程顯示,LUCA是一群生物,復雜程度類似現(xiàn)存的原核生物。LUCA中顯然已出現(xiàn)多種聚合酶和解旋酶。此外,RdRP和RT很可能是在推測的RNA世界向RNA-蛋白世界轉變過程中出現(xiàn)的, DNA-RNA-蛋白樣生物隨后出現(xiàn)并演化出LUCA,最后進化出細胞生物。在病毒復制酶多樣化的表象下,是驚人的一致性:所有上述蛋白的結構核心都是RNA識別基序(RRM)結構域,用于結合核酸。在病毒中,該結構域還包含核苷酸多聚化的催化位點及核酸酶活性。這種相對簡單、普遍存在又差異巨大的RRM結構域可能是最早出現(xiàn)的蛋白結構域之一,可能在RNA世界晚期就已作為核酶聚合酶的輔因子。RRM的多樣性進化產(chǎn)生RdRP、RT及其他病毒或細胞復制相關蛋白,可能發(fā)生在原細胞(protocells)中的一系列原始復制子(replicators)中,在DNA基因組的現(xiàn)代復制類型建立之前,當然也在原核樣細胞出現(xiàn)之前。病毒衣殼蛋白(CP)有多種類型,其氨基酸序列的進化速度通常遠快于復制相關VHPs。不同類群病毒間進化關系的分析方法是蛋白結構比較。目前已知的CP結構主要有20種【3】,但不同種CP的豐度差異巨大,少數(shù)為通用類型,另有一部分罕見的非常規(guī)類型。大部分病毒衣殼呈正二十面體,另有相當一部分呈螺旋形,兩種衣殼在蛋白聚集過程中都是熱動力學允許的,可通過數(shù)種蛋白組裝而成。正二十面體衣殼中至少存在10種不同的蛋白折疊類型,其中僅三種蛋白家族廣泛存在于不同病毒中,它們可被認為是結構性VHPs。第一種普遍存在的是單一β桶“果凍卷”(SJR)結構。SJR衣殼是多種正鏈RNA病毒的正二十面體衣殼的主要組分,包括Orthornavirus和Monodnaviria。此外,SJR還出現(xiàn)在某些雙鏈DNA病毒,如Helvetiavirae、Papillomaviridae和Polyomaviridae中。胞內(nèi)蛋白中也常有SJR結構域的身影,主要用于結合碳水化合物,某些是碳水化合物活化酶。多數(shù)胞內(nèi)的SJR蛋白,尤其是腫瘤壞死因子家族,可聚集形成衣殼樣顆粒【4】。真核生物的RNA和DNA病毒、原核中的微小病毒(Monodnaviria)及Varidnaviria中的SJR衣殼結構與胞內(nèi)SJR蛋白最相近,暗示病毒中的SJR衣殼至少經(jīng)歷兩次獨立的招募過程。招募的SJR蛋白必須首先獲得與病毒核酸互作的能力,方可行使CP功能,方法是在CP蛋白末端添加帶正電的氨基酸。第二種是雙DJR衣殼,即某些雙鏈DNA病毒(如Bamfordvirae)中包含兩個“果凍卷”結構域,它有數(shù)個可能的胞內(nèi)蛋白祖先家族,其中DUF2961家族糖苷水解酶的結構最相近【5】。第三種結構性VHP來自Duplodnaviria正二十面體衣殼中的HK97-折疊,可能源于細菌蛋白Dodecins。在細菌中Dodecins用于儲存黃素,也可形成球狀結構。上述三種普遍存在的CP結構凸顯出病毒進化的一種主要路徑——擴展適應(exaptation)。這一概念最早由Gould和Vrba提出【6】,用于描述生物實體(如動物器官)的再利用,賦予其區(qū)別于初始功能的新功能。在分子層面上,這一概念已經(jīng)用于蛋白和RNA分子的進化重賦能。在病毒衣殼蛋白中,“預適應”的胞內(nèi)蛋白可以重賦能為特定病毒功能,如聚集形成規(guī)則、對稱的多聚體結構,甚至獲得對碳水化合物的親和力。上述聚集是蛋白的通用特征,已經(jīng)被人工病毒樣衣殼的重建實驗證實。衣殼蛋白的擴展適應過程產(chǎn)生巨大變化,包含蛋白折疊方式的打破。故,病毒衣殼與其胞內(nèi)蛋白祖先可能僅有微弱的結構相似性,很難直接由序列推測出傳承關系。因此,結構性HVP的祖先似乎區(qū)別于細胞前系統(tǒng)中關鍵復制酶的可能起源。前述三種常見CP蛋白的胞內(nèi)先祖能夠發(fā)現(xiàn),而經(jīng)歷過擴展適應的胞內(nèi)蛋白如今分布在三域生物中,說明其分化可能追溯至LUCA時代。這類HVP最可能由生命進化早期出現(xiàn)的胞內(nèi)先祖演化而來。這種病毒復制機器及結構蛋白起源的明顯時空分離,說明在生命進化的初期,全新的病毒起源于無衣殼、病毒樣的自在性遺傳元件。這類原始的遺傳元件現(xiàn)今仍有存留,如narnaviruses和mitoviruses等某些“無衣殼病毒”,它們僅編碼RdRP基因【7】。前述三種標志性CP蛋白的招募使得后續(xù)更多的擴展適應成為可能,如,包裝病毒基因組的ATPase的遠古擴展適應。在病毒長達30億年的進化歷程中經(jīng)歷過多種擴展進化事件,可概括為兩類:(1)獲得病毒特異的功能,而非直接繼承其胞內(nèi)蛋白祖先的功能;(2)適應蛋白復制的要求,但仍帶有原始生化特征,即擴展適應表現(xiàn)在生物學層面,而非生化層面。擴展適應的第一條路徑通常涉及蛋白結構的顯著改變。除上述三種CP蛋白,另一個典型例子來自巨大潘多拉病毒,它攝取了其Nucleocytovirecetes祖先的DJR衣殼,轉而從宿主獲得一個失活的GH16家族糖苷水解酶,作為其病毒顆粒兩種主要蛋白之一,形成非對稱的罐狀外殼。但其近親molliviruses仍保留DJR衣殼,而以上述糖苷水解酶的同源蛋白作為病毒顆粒的次要組分。這個例子似乎反映出一種普遍的趨勢:病毒從宿主獲取的基因之所以被保留,最初必須可以為病毒感染過程立即提供某種便利,隨后經(jīng)歷漸進的重賦能過程,先作為次要成分,然后成為病毒顆粒的主要成分。另一個更復雜的例子來自甲病毒(alphaviruses)糜蛋白酶的擴展適應替代其先祖SJR衣殼的過程。甲病毒衣殼的序列和結構均類似另一類正鏈RNA病毒(黃病毒)中的蛋白酶,后者不作為病毒顆粒的組分,但顯示出病毒蛋白酶活性,參與病毒多聚蛋白的加工過程。甲病毒衣殼經(jīng)一步酶切從多聚蛋白中釋放出來,隨后失活掉其蛋白酶活性【8】。類似SJR衣殼,甲病毒衣殼的擴展適應也是在N端添加一段帶正電的無序區(qū)段。類似的進化場景也發(fā)生在噬菌體尾管蛋白上,其結構類似病毒絲氨酸蛋白酶的折疊形式。帶有同樣折疊的蛋白酶出現(xiàn)在大部分Herviviricetes病毒中。此外,在皰疹病毒(herpesviruses)中這類蛋白酶被稱為assemblins,催化主要衣殼蛋白的酶切成熟及腳手架蛋白的切割。還有minivirus中的例子,兩種密切相關的葡萄糖-甲醇-膽堿(GMC)-型氧化還原酶被重賦能為結構蛋白,分別形成外部糖基化纖絲(修飾在正二十面體衣殼外)及螺旋形的核衣殼纖維(包裹其1.2Mb的基因組)【9】。盡管兩種蛋白的氧化還原酶活性均已失去,但所有活性位點仍然是保守的,輔因子FAD依然穩(wěn)定結合其上。Nucleocytoviricota其他成員中的GMC-型氧化還原酶則不保守,它們可能源自細菌。此外,擴展適應的例子還包括:逆轉錄病毒的基質蛋白,是整合酶中結合DNA的螺旋-轉角-螺旋結構域;Mononegavirales成員的基質蛋白似乎來源于親環(huán)素,是一類帶有肽基脯氨酸異構酶活性的分子伴侶;而沙粒病毒的基質蛋白來自一種E3泛素連接酶的RING結構域。上述例子顯示出病毒蛋白進化的一種顯著趨勢,即,招募酶作為結構蛋白,但酶活丟失。追溯由擴展適應獲得的病毒蛋白源頭的結果往往出乎意料,通常需要用最敏銳的方法進行蛋白序列和結構的比較。如痘病毒中參與出芽的蛋白F12,被證實是一種衍生的、失活的DNA聚合酶;另一種未知功能蛋白F16,是一種失活的絲氨酸重組酶。類似F12,皰疹病毒蛋白UL8是一種失活的B族DNA聚合酶,被招募為無酶活但必需的解旋酶-啟發(fā)酶復合體的組分,參與多種蛋白-蛋白相互作用。巨型噬菌體類核結構外殼的主要蛋白可保護病毒DNA免于細胞防御系統(tǒng)(如限制性內(nèi)切酶和CRISPR-Cas)的傷害。結構比較顯示,主要外殼蛋白Chimallin含兩個結構域:N端結構域帶有α+β折疊,類似一種未鑒定的細菌蛋白;C端結構域來自一種GCN5-相關的N-乙酰轉移酶,結構類似于大腸桿菌AtaT及tRNA乙?;舅氐耐唇Y構。類似其他源自酶的病毒蛋白,乙酰轉移酶的活性位點也發(fā)生突變,酶活性喪失。因此,原蛋白的擴展適應可能是病毒結構蛋白進化的主要路徑。也有許多擴展適應的例子并不涉及結構的劇烈變化,蛋白生化活性得以保留,盡管功能已發(fā)生改變。典型例子是ATPase,作為病毒基因組包裝入衣殼的馬達,存在于幾乎所有雙鏈DNA病毒(Varidnaviria及Duplodnaviria)中。不同于前述組成病毒顆粒的蛋白,這里ATPase擴展適應的祖先更易于追溯。雖然DNA包裝入病毒顆粒是病毒獨有的功能,但ATPase保留著與其胞內(nèi)祖先相當程度的序列相似性——不僅結構折疊上相似,甚至包含相同的ATP結合和水解基序。Varidnaviria的ATPase屬于FtsK家族,負責在細胞分裂過程中將細菌和質粒DNA泵入子細胞。絲狀單鏈DNA噬菌體Loebvirae也編碼FtsK樣ATPase,在病毒擠出宿主細胞時將單鏈DNA泵過宿主細胞膜。當然,ATPase的擴展適應也有發(fā)生較大改動的例子,如Duplodnaviria中雙鏈DNA包裝ATPase作為最大的末端酶,含有一個額外的RNase H折疊核酸酶結構域,但仍可通過保守區(qū)段識別出其來源。多數(shù)RNA病毒并不編碼基因組包裝酶,而是核酸直接與結構蛋白組裝成病毒顆粒。已知唯一的例外是雙鏈RNA噬菌體Cystoviridae,編碼類似超家族4解旋酶的包裝酶。Parvoviruses編碼的超家族3解旋酶代表的是一個近期發(fā)生的擴展適應事件,其S3H負責將病毒基因組包裝入已形成的空顆粒中。此外,病毒中的解旋酶還可能具備啟發(fā)酶活性、脫衣殼功能、或RNA加帽等功能。保守性擴展適應的第三種酶是蛋白酶,用于處理病毒蛋白前體。許多正鏈RNA病毒(如Kitrinoviricota和Pisuviricota)整個基因組RNA或大部分非結構蛋白都是首先翻譯為一個多聚蛋白,其中帶有一個或多個蛋白酶結構域。這些蛋白酶分屬兩類不相關的折疊,木瓜蛋白酶-樣或糜蛋白酶-樣,某些病毒同時編碼這兩類蛋白酶。逆轉錄RNA病毒Pararnaviria還編碼一類獨特的天冬氨酸蛋白酶。某些RNA病毒蛋白酶的胞內(nèi)蛋白起源是可追溯的,Picornavirales編碼的糜蛋白酶樣蛋白酶明顯來源于HtrA家族細菌蛋白酶;逆轉錄病毒的天冬氨酸蛋白酶似乎源于Ddi蛋白酶,是真核生物泛素信號系統(tǒng)的高度保守組分。由于上述多聚蛋白加工或衣殼蛋白成熟都是典型的病毒功能,病毒對這類蛋白酶的招募顯然經(jīng)歷了擴展適應過程,但其生化活性得以保留,表現(xiàn)在序列保守性上。然而,對病毒主要進化事件進行分期通常是困難的。在上述例子中,進化的邏輯似乎決定了病毒蛋白酶和多聚蛋白起源的特定時間順序??紤]到病毒基因組5’端轉錄起始位點來源于真核,很可能病毒多聚蛋白最先進化出來,且起初由宿主蛋白酶切割成熟,這類酶的基因隨后被病毒捕獲。盡管DNA病毒通常不編碼多聚蛋白,但Varidnaviria成員大多編碼一種半胱氨酸蛋白酶,是其衣殼酶切成熟必需的。該蛋白酶類似真核去泛素酶Ulp1,很可能是病毒在進化早期從其真核宿主處獲得的。此外,前述duplodnaviruses編碼的assemblin樣絲氨酸蛋白酶包含一種獨特的折疊,應該源于病毒基因組,但在某些噬菌體(Caudoviricetes)中這類蛋白酶被細菌來源的ClpP-樣蛋白酶代替【10】。病毒有充足的機會從其宿主獲取基因,這種“從外部”獲取的基因可被稱為“外部擴展適應(extramural exaptation)”。而在病毒進化過程中,還發(fā)生多種病毒自身基因的擴展適應,可稱為“內(nèi)部擴展適應(intramural exaptation)”,即病毒自身基因的功能被重置,通常發(fā)生在基因復制后,其中一個拷貝獲得新功能,或同一個蛋白獲得額外的功能。例如,前述duplodnaviruses的主要尾部蛋白、assemblin及pandoraviruses的主要結構蛋白;mastadenoviruses的E1B-55K,源于一個編碼LH3-樣次要衣殼蛋白基因的復制。此外,擁有已知最大ssRNA基因組的closteroviruses的主要CP蛋白復制成三份,其中兩份擴展進化為病毒在細胞-細胞間運動所必需的功能。某些closteroviruses的木瓜蛋白酶樣前導蛋白酶復制后,其中一個基因演變?yōu)榛蚪M復制相關,另一個促進病毒在植物中的遠距離運輸。相較于從宿主獲取基因,這種病毒將自身基因復制后適應進化出新功能的方式可能更加高效,尤其是RNA病毒。但實驗證據(jù)顯示,某些基因經(jīng)復制后擴展出的功能可能對RNA病毒有害【11】,表明存在相當大的選擇壓力用于新功能出現(xiàn)或丟失其中一個重復基因。“內(nèi)部擴展適應”的另一種途徑是為病毒蛋白添加額外功能,又稱為兼職(moonlighting)或基因共享【12】。典型的例子是病毒的解旋酶,既保持病毒復制中的作用,又額外獲得ATP依賴的病毒基因組包裝、脫衣殼或加帽等功能,如前所述。所有病毒都面臨宿主防御系統(tǒng)的威脅?;蚪M較小的病毒(如Riboviria和Monodnaviria)通常不編碼對抗蛋白,而是將病毒基礎蛋白兼職化使用;也有一些植物、真菌或動物病毒可以編碼RNA干擾(RNAi)抑制子,它們的功能模式和結構各異。其中一類RNAi抑制子含有雙鏈RNA結合結構域(dsRBD),該結構域廣泛存在于多數(shù)細胞生物中,因此幾乎毫無疑問,病毒的這類抑制子來自保守性擴展適應。而大型雙鏈DNA病毒(如Varidnaviria和Duplodnaviria)編碼多種對抗基因,如chordopoxviruses編碼的200基因中的一半都靶向宿主防御,包含阻斷天然免疫通路、泛素降解體系、凋亡通路等。這些基因的起源可以追溯至動物祖先,但無法確定具體基因。故,病毒對抗基因在招募后會發(fā)生巨大改變,包括核心折疊模式的重組。當然也有例外,新近獲得的蛋白仍與其真核祖先保留較高的序列相似性,如凋亡過程中caspase的抑制劑serpin。這種將宿主防御系統(tǒng)組分擴展適應為病毒自身對抗功能的情形,是病毒-宿主共進化中的一個關鍵趨勢。細菌和古菌中的病毒也會使用這種“租借武器”的策略,如招募CRISRR系統(tǒng)作為自身對抗組分。除上述擴展適應的方式,病毒還會直接招募宿主中的某些蛋白,幾乎不加修改地使用,獲取的蛋白活性幾乎被完整保留。通常招募的都是酶,如DNA解旋酶、DNA聚合酶、啟發(fā)酶、DNA連接酶、單鏈DNA結合蛋白等【13】。此外,催化核苷酸生物合成的酶(如核苷和核苷酸激酶、胸苷酸合成酶、核糖核酸還原酶),也基本保留序列相似性。通常確認病毒招募的酶的直接祖先很困難,但也有例外,如,系統(tǒng)發(fā)育樹顯示古菌中的病毒從其宿主中招募復制性MCM解旋酶。這足以說明大型雙鏈DNA病毒復制機器進化的一個主流趨勢是直接獲取酶并保留其活性。但這些酶并非普遍存在的,說明病毒編碼和宿主獲取的蛋白功能是可交換的,特別是原核生物的病毒,更易于接近宿主復制機器。而真核生物中的病毒,如Nucleocytoviricota在宿主胞漿的病毒工廠中復制,所需的幾乎全部蛋白都是招募而來并保留原功能【14】。此外,病毒也會直接招募宿主的酶用于補全細胞過程。如噬藍藻體招募光合系統(tǒng)組分、Nucleocytoviricota捕獲蛋白翻譯系統(tǒng)組分(如核糖體蛋白),在上述兩個例子中,病毒招募蛋白仍執(zhí)行原宿主系統(tǒng)中的功能,其作用可能是防止上述系統(tǒng)在病毒感染過程中關閉。快速進化往往掩蓋了病毒基因的祖先,這是病毒的一個突出特征,而擴展適應又蒙上一層紗。導致的結果是蛋白序列和結構上的進化約束變得十分松弛,從而使得病毒基因組中出現(xiàn)“暗物質”,即祖先已無法確認的基因。即便在許多小基因組的病毒中也存在暗物質蛋白,如前述RNAi抑制子。在大型雙鏈DNA病毒基因組(如Varidnaviria)中,暗物質基因占比相當大,在巨型潘多拉病毒中甚至高達90%【15】。至少兩類不同的進化路徑最可能導致病毒基因組暗物質的出現(xiàn):其一是劇烈的擴展適應;其二,這類基因可能原本就是全新出現(xiàn)的蛋白編碼基因。為確認前者,可綜合利用近期發(fā)展的蛋白結構預測方法對病毒蛋白進行分析。后者出現(xiàn)的可能原因是所謂的“疊印(overprinting)”,即基因中出現(xiàn)核苷酸替換時導致讀碼框移動,翻譯后產(chǎn)生全新功能的蛋白,這類新功能在后續(xù)進化中得以固定。這類疊印通常出現(xiàn)于小基因組病毒中,如leviviruses裂解細菌細胞壁的蛋白;RNA病毒及ssDNA病毒中也有疊印的例子。考慮到病毒與宿主的激烈軍備競賽驅動了快速進化,病毒基因組中的多數(shù)暗物質可能都與對抗防御相關。盡管病毒及其基因千差萬別,作者認為進化的許多路徑都適用于一個簡單而邏輯的概念框架:病毒的進化似乎萌芽于一小組涉及基因組復制的核心基礎蛋白,它們可以追溯至細胞出現(xiàn)前階段。除上述原始蛋白,病毒的進化過程就是一個不斷從宿主獲取基因的過程,及隨后出現(xiàn)的病毒間水平擴散基因的擴展適應。獲取自宿主的基因遵循兩條進化途徑:直接招募(蛋白功能保持不變)或擴展適應(基因重賦能以獲得病毒特異的功能)。擴展適應又可進一步分為保守的(生化活性得以保留)及激進的(功能徹底改變)。而直接招募和擴展適應獲得的基因顯示出普遍的趨同性(convergence),這是由于涉及病毒復制和表達的基因功能范圍相對較窄。除全新出現(xiàn)的病毒基因,已知的病毒及其基因組的多樣性僅由有限的進化路徑產(chǎn)生。通常來說,病毒的基因組越大,帶有的輔助功能越多。病毒基因組的擴展過程伴隨著多種輔助基因的獲得,這增加了病毒的適應性或自主性,盡管伴隨著與宿主功能的大量冗余。但這種冗余背后的邏輯在于,可以克服宿主設置的功能使用限制。此外,冗余的功能還可促進宿主代謝以維持活躍的病毒復制。DNA和RNA病毒基因組擴展的機會是不同的。RNA病毒基因組的尺度限定在40kb之內(nèi),決定了僅必需功能的基因可被納入基因組中。而dsDNA病毒的基因組尺寸和功能復雜性甚至比肩某些細胞,于是編碼代謝相關、蛋白糖基化修飾、胞內(nèi)運輸相關蛋白、翻譯系統(tǒng)的基因均可納入基因組中。所以大型基因組病毒的進化取決于增強感染效率、擴大宿主范圍、增加粘附成功率、降低衰敗率等。總之,病毒進化的邏輯決定于病毒的關鍵生物學特征,即嚴格胞內(nèi)寄生。這使得病毒有充足的機會直接獲取或擴展進化宿主功能基因,但也需要克服宿主的防御系統(tǒng)。相對應地,病毒的基因也多次被宿主獲取,病毒的某些基因也被宿主擴展功能,從而使得基因和功能在病毒和宿主間實現(xiàn)雙向傳遞。深入理解病毒進化的邏輯將有助于探究病毒-宿主共進化及抗病毒療法的開發(fā)。https://doi.org/10.1016/j.chom.2022.06.008
1. Koonin, E.V., Makarova, K.S., Wolf, Y.I., and Krupovic, M. (2020). Evolutionary entanglement of mobile genetic elements and host defence systems: guns for hire. Nat. Rev. Genet. 21, 119–131
2. Krupovic, M., Dolja, V.V., and Koonin, E.V. (2019). Origin of viruses: primordial replicators recruiting capsids from hosts. Nat. Rev. Microbiol. 17, 449–458.
3. Krupovic, M., and Koonin, E.V. (2017). Multiple origins of viral capsid proteins from cellular ancestors. Proc. Natl. Acad. Sci. USA 114, E2401–E2410.
4. Zhukovsky, E.A., Lee, J.O., Villegas, M., Chan, C., Chu, S., and Mroske, C. (2004). TNF ligands: is TALL-1 a trimer or a virus-like cluster? Nature 427, 413–414.
5. Krupovic, M., Makarova, K.S., and Koonin, E.V. (2022). Cellular homologs of the double jelly-roll major capsid proteins clarify the origins of an ancient virus kingdom. Proc. Natl. Acad. Sci. USA 119. e2120620119.
6. Gould, S.J., and Vrba, E.S. (1982). Exaptation—a missing term in the science of form. Paleobiology 8, 4–15.
7. Koonin, E.V., and Dolja, V.V. (2014). Virus world as an evolutionary network of viruses and capsidless selfish elements. Microbiol. Mol. Biol. Rev. 78, 278–303.
8. Aggarwal, M., Dhindwal, S., Kumar, P., Kuhn, R.J., and Tomar, S. (2014). transProtease activity and structural insights into the active form of the alphavirus capsid protease. J. Virol. 88, 12242–12253.
9. Villalta, A., Schmitt, A., Estrozi, L.F., Quemin, E.R.J., Alempic, J.-M., Lartigue, A., Prazák, V., Belmudes, L., Vasishtan, D., Colmant, A.M.S., et al. (2022). The giant mimivirus 1.2 Mb genome is Elegantly Organized into a 30 Nm helical protein Shield. Preprint at bioRxiv.
10. Liu, J., and Mushegian, A. (2004). Displacements of prohead protease genes in the late operons of double-stranded-DNA bacteriophages. J. Bacteriol. 186, 4369–4375.
11. Willemsen, A., Zwart, M.P., Higueras, P., Sardanyés, J., and Elena, S.F. (2016). Predicting the stability of homologous gene duplications in a plant RNA virus. Genome Biol Evol 8, 3065–3082.
12. Copley, S.D. (2014). An evolutionary perspective on protein moonlighting. Biochem. Soc. Trans. 42, 1684–1691.
13. Kazlauskas, D., Krupovic, M., and Venclovas, C. (2016). The logic of DNA replication in double-stranded DNA viruses: insights from global analysis of viral genomes. Nucleic Acids Res. 44, 4551–4564.
14. Koonin, E.V., and Yutin, N. (2019). Evolution of the large nucleocytoplasmic DNA viruses of eukaryotes and convergent origins of viral gigantism. Adv. Virus Res. 103, 167–202.
15. Legendre, M., Fabre, E., Poirot, O., Jeudy, S., Lartigue, A., Alempic, J.M., Beucher, L., Philippe, N., Bertaux, L., Christo-Foroux, E., et al. (2018). Diversity and evolution of the emerging Pandoraviridae family. Nat. Commun. 9, 2285.