撰文:珍奇
IF:54.908
推薦度:?????
亮點(diǎn):
1、本文提出了一種多模式結(jié)構(gòu)化嵌入 (MUSE)技術(shù),它可發(fā)現(xiàn)任一模態(tài)遺漏的組織亞群并補(bǔ)償特定于模態(tài)的噪聲。
2、研究者將 MUSE 應(yīng)用于包含空間轉(zhuǎn)錄組學(xué)和成像模式的各種數(shù)據(jù)集,在健康的大腦皮層和腸道組織中確定了具有生物學(xué)意義的組織亞群和定型空間模式。
3、在患病組織中,MUSE 揭示了與腫瘤區(qū)域接近的基因生物標(biāo)志物和阿爾茨海默病腦區(qū)淀粉樣前體蛋白加工的異質(zhì)性。
組織由處于不同狀態(tài)的細(xì)胞集合構(gòu)成,顯微鏡可以通過形態(tài)學(xué)的相似性來識別和表征細(xì)胞類型。單細(xì)胞轉(zhuǎn)錄組學(xué)提供了互補(bǔ)的方法來通過轉(zhuǎn)錄狀態(tài)的相似性來表征細(xì)胞類型。空間轉(zhuǎn)錄組學(xué)的最新進(jìn)展將這兩種方法結(jié)合起來,允許在空間轉(zhuǎn)錄組學(xué)、順序熒光原位雜交、多重抗錯熒光原位雜交和空間分辨轉(zhuǎn)錄擴(kuò)增子讀出映射 (STARmap)。然而,用于對來自同一細(xì)胞的形態(tài)學(xué)和轉(zhuǎn)錄組學(xué)數(shù)據(jù)進(jìn)行綜合分析的通用方法卻很少存在。2022年3月28日,美國加州大學(xué)舊金山藥學(xué)院的研究團(tuán)隊(duì)在《Nature Biotechnology》雜志上發(fā)表了一篇名為“Integrative spatial analysis of cell morphologies and transcriptional states with MUSE”的研究型論文,他們證實(shí)了這項(xiàng)深度學(xué)習(xí)技術(shù)可用于結(jié)合來自最先進(jìn)的空間轉(zhuǎn)錄組學(xué)和顯微鏡技術(shù)的信息,以深入了解異質(zhì)組織的組織、功能和疾病進(jìn)展。
MUSE 建立在標(biāo)準(zhǔn)的多視圖 AE 神經(jīng)網(wǎng)絡(luò)架構(gòu)之上,并添加了自監(jiān)督損失函數(shù)。學(xué)習(xí)分三個步驟進(jìn)行:(1)特定于模態(tài)的轉(zhuǎn)換:輸入特征 x 和 y 被轉(zhuǎn)換為潛在表示 hx 和 hy; (2)偽標(biāo)簽學(xué)習(xí):對特征空間hx和hy分別進(jìn)行聚類,得到每種模態(tài)的偽標(biāo)簽lx和ly; (3) 聯(lián)合特征學(xué)習(xí):特定模態(tài)的特征 hx 和 hy 被合并并轉(zhuǎn)換為聯(lián)合潛在特征表示 z。學(xué)習(xí)過程以最小化組合的自我重建和自我監(jiān)督損失函數(shù)為指導(dǎo)。整個神經(jīng)網(wǎng)絡(luò)中的模型參數(shù)在每次迭代中聯(lián)合更新。最后,在模型訓(xùn)練之后,聯(lián)合潛在特征 (z) 可以用于各種任務(wù),例如聚類和軌跡推斷。
為了評估 MUSE 的性能,他們最初使用模擬的轉(zhuǎn)錄本和形態(tài)數(shù)據(jù),其中每個樣本(細(xì)胞或組織點(diǎn))的地面實(shí)況亞群分配是已知的。作為基準(zhǔn),MUSE 與幾種現(xiàn)有的方法進(jìn)行了比較,這些方法結(jié)合了數(shù)據(jù)(CCA、MOFA 和 AE)以及來自兩種模式的特征的簡單連接作為基線。首先研究者使用模擬數(shù)據(jù)來評估 MUSE 從每種模態(tài)中捕獲判別信息的能力。他們在完整的多模態(tài)空間中保留了 10 個地面實(shí)況亞群,并通過隨機(jī)合并每種模態(tài)的一組不同樣本集群分配來降低兩種單一模態(tài)解決這些亞群的能力。隨著聚類數(shù)量的減少,分解方法 MOFA 和特征連接保持了與單模態(tài)方法相似的準(zhǔn)確度水平,而 MUSE 超過了單模態(tài)基準(zhǔn)。接下來,他們評估了當(dāng)一種模式中的數(shù)據(jù)質(zhì)量下降時 MUSE 的性能。單細(xì)胞數(shù)據(jù)中的兩個持續(xù)存在的問題是測序丟失和特征測量中的噪聲。結(jié)果顯示,較低質(zhì)量的模態(tài)不會過度損害 MUSE 的使用能力更高質(zhì)量的模式。在潛在空間中可視化結(jié)果表明 MUSE 表示保持了十個集群的可辨別的亞群結(jié)構(gòu)。依賴于最大化多模態(tài)相關(guān)性(CCA)、沒有自我監(jiān)督的重建精度(AE 和 MOFA )或特征連接的多模態(tài)方法在任何一種模態(tài)中都受到數(shù)據(jù)退化的強(qiáng)烈影響。
總之,合成數(shù)據(jù)表明 MUSE 滿足了他們對成功的多模態(tài)方法的兩個先驗(yàn)要求。也就是說,MUSE 使用的結(jié)構(gòu)化自我監(jiān)督方法有助于捕獲和組合僅從任何一種方式都無法獲得的判別性信息。此外,MUSE 并沒有因?yàn)橐环N或兩種方式的數(shù)據(jù)質(zhì)量差而過度混淆。
圖1. MUSE 概述和模擬數(shù)據(jù)的性能評估。
由于缺乏基本事實(shí),在真實(shí)數(shù)據(jù)上評估推斷的亞群結(jié)構(gòu)可能具有挑戰(zhàn)性。然而,具有特定細(xì)胞類型空間組織的組織可以提供獨(dú)立的證據(jù)來評估學(xué)習(xí)表示的質(zhì)量和確定的亞群。一個特別好的例子是大腦皮層,其多層模式提供正交信息來評估發(fā)現(xiàn)的亞群。因此,他們將 MUSE 應(yīng)用于兩個實(shí)驗(yàn)性小鼠皮層數(shù)據(jù)集。
第一個皮層數(shù)據(jù)集是使用 seqFISH 技術(shù)獲得的。該數(shù)據(jù)集包括約10,000 個基因的表達(dá)譜和 523 個細(xì)胞的 DAPI 和 Nissl 染色細(xì)胞圖像。他們擴(kuò)展了亞群分析,在三個類別中的每個類別中包含四種方法,基于:(1)僅轉(zhuǎn)錄特征 x(PCA、ZIFA34、SIMILR25 和 scScope26,在方法中有詳細(xì)描述);(2)只有形態(tài)特征y(PCA、多維縮放(MDS)、等距映射(Isomap)和t分布隨機(jī)鄰域嵌入(tSNE));或 (3) x 和 y 的組合(CCA、MOFA 18、AE 和 MUSE)。
MUSE 確定了相對大量的空間共定位的集群。在某些情況下,可以看到同一皮質(zhì)層內(nèi)的 MUSE 簇具有不同的形態(tài)分布,以及與最近單細(xì)胞 RNA 測序(scRNA-seq)中報(bào)道的不同谷氨酸能細(xì)胞類型相匹配學(xué)習(xí)。
圖2. MUSE 對 seqFISh 小鼠皮層數(shù)據(jù)的評估。
第二個皮層數(shù)據(jù)集是使用 STARmap 技術(shù)獲得的。對于轉(zhuǎn)錄模式,該數(shù)據(jù)集包含 1,020個基因的 973 個單細(xì)胞表達(dá)譜;然而,對于形態(tài)學(xué)模式,只提供了細(xì)胞形狀掩碼。數(shù)據(jù)的處理方式與之前的皮層數(shù)據(jù)集相同,以獲得潛在的表示和亞群。他們將基于偽彩色皮層深度“發(fā)現(xiàn)”皮層結(jié)構(gòu)的方法進(jìn)行了可視化。作為案例研究,他們分析了在 MUSE 提供的聯(lián)合潛在空間中從個體(基于 PCA)或組合(基于 MUSE)模態(tài)識別的 STARmap 集群。他們根據(jù) MUSE是否精確、復(fù)制或與從單模態(tài)分析中獲得的集群相比是否發(fā)現(xiàn)了新集群來對集群進(jìn)行分類。“精確”的 MUSE 簇基于轉(zhuǎn)錄特征分離不佳,但基于形態(tài)特征分離得相當(dāng)好。在綜合分析中,MUSE 利用形態(tài)多樣性進(jìn)一步將細(xì)胞分解為亞組。“復(fù)制”的 MUSE 簇僅基于轉(zhuǎn)錄特征是不同的。差異表達(dá)分析使他們能夠?qū)⑦@些簇注釋為星形膠質(zhì)細(xì)胞 (Astro.)、海馬神經(jīng)元 (Hippo.)、少突膠質(zhì)細(xì)胞 (Oligo.) 或平滑肌 (SMC) 細(xì)胞。 “發(fā)現(xiàn)”的 MUSE 集群從任何一種單一模式中都被遺漏了,它們單獨(dú)只提供了微弱的差異。在這里,來自兩種模式的弱異質(zhì)性的組合使 MUSE 能夠識別不同的 L2/3、L5 和 L6 結(jié)構(gòu)。
圖3. 在 STARmap 皮層數(shù)據(jù)集上分析 MUSE 集群。
遺傳多樣性和腫瘤微環(huán)境變異可以極大地影響癌癥進(jìn)展、診斷和治療。在這里,他們利用了 ST 收集的胰腺導(dǎo)管腺癌 (PDAC) 數(shù)據(jù)集,該數(shù)據(jù)集提供了基于組織點(diǎn)(而不是基于單細(xì)胞)的轉(zhuǎn)錄狀態(tài)報(bào)告。研究者將 MUSE 應(yīng)用于可用的 ST 和圖像多模態(tài)數(shù)據(jù),并確定了兩個形態(tài)上不同的癌癥區(qū)域,每個癌癥區(qū)域都基于特征標(biāo)記基因捕獲了兩個不同的克隆之一。在癌癥區(qū)域之外,MUSE 還將非腫瘤組織分解為空間上不同的子區(qū)域。他們對這些簇進(jìn)行了差異表達(dá)分析,以研究跨組織區(qū)域的變化。頂部過表達(dá)的癌癥區(qū)域基因是先前鑒定的 PDAC 生物標(biāo)志物;這些基因隨著與癌癥區(qū)域距離的增加呈下降趨勢。相比之下,頂部過表達(dá)的非癌區(qū)基因顯示出相反的距離趨勢。
圖4. MUSE在St PDAc數(shù)據(jù)集上的應(yīng)用。
接下來,他們使用市售的 10xVisium 空間平臺將 MUSE 應(yīng)用于最近生成的男性成人結(jié)腸數(shù)據(jù)集。受最近一項(xiàng)研究的啟發(fā),他們使用來自該組織中主要細(xì)胞類型的已知標(biāo)記來評估已識別簇的一致性。他們專注于四種主要細(xì)胞類型,它們被標(biāo)記為上皮細(xì)胞、肌肉細(xì)胞、免疫細(xì)胞和內(nèi)皮細(xì)胞。在簇內(nèi)清楚地識別出上皮和肌肉層。與單獨(dú)的圖像模態(tài)相比,MUSE 和轉(zhuǎn)錄簇通常顯示出更高的層特異性基因富集。免疫和內(nèi)皮細(xì)胞在 H&E 圖像中出現(xiàn)空間分組。對于免疫區(qū)域,僅圖像和 MUSE 亞群顯示更高的標(biāo)記富集,而對于內(nèi)皮區(qū)域,僅轉(zhuǎn)錄本和 MUSE 顯示更高的標(biāo)記富集。
圖5. MUSE 在 10x Visium 人體腸道數(shù)據(jù)集上的應(yīng)用。
最后,他們研究了 MUSE 如何利用組合的 ST 和病理生物標(biāo)志物圖像數(shù)據(jù)。為此,他們利用了一項(xiàng)關(guān)于大腦中淀粉樣蛋白-β (Aβ) 肽沉積(阿爾茨海默?。?/span>AD)的關(guān)鍵病理生理學(xué)標(biāo)志)的研究。在這里,他們在具有轉(zhuǎn)錄本 (ST) 和 Aβ 分布(免疫熒光成像)的區(qū)域信息的多模式 AD 數(shù)據(jù)集上評估了 MUSE50。對于每個樣本,他們分析了一個組織切片,該切片在空間上進(jìn)行了 ST 測序,以及相鄰切片的 Aβ 免疫染色。對于形態(tài)學(xué)模態(tài),他們?yōu)槊總€ ST 點(diǎn)分割相鄰熒光圖像(僅 Aβ 通道)中的相應(yīng)區(qū)域,并使用 Inception v3 模型學(xué)習(xí)深度嵌入。他們利用 MUSE 簇來尋找 Aβ 相關(guān)基因。他們確定了四組具有相似區(qū)域組成(富含丘腦、下丘腦、海馬和皮層)但年齡組成不同的 MUSE 集群。總之,對 MUSE 集群的分析揭示了反映 AD 進(jìn)展的區(qū)域、時間和生物學(xué)差異,并提出了 APP 處理在大腦區(qū)域之間不均勻的假設(shè)。
圖6. MUSE 在多模式 AD 數(shù)據(jù)集上的應(yīng)用。
細(xì)胞異質(zhì)性的表征對于了解健康和疾病中組織的組織和功能至關(guān)重要。研究組織多樣性的兩種廣泛使用且經(jīng)過充分驗(yàn)證的方法是顯微鏡(捕獲形態(tài)差異)和 scRNA-seq(捕獲轉(zhuǎn)錄差異)。 MUSE 利用包含自我監(jiān)督和自我重建損失的學(xué)習(xí)架構(gòu),鼓勵在這些不同模式中觀察到的亞群結(jié)構(gòu)的綜合。本研究證明,對于合成數(shù)據(jù)和來自不同平臺的各種生物數(shù)據(jù)集合,MUSE 可以揭示單一模式或其他方法遺漏的新亞群結(jié)構(gòu)和組織。
教授介紹:
LaniF. Wu,美國加州大學(xué)舊金山藥學(xué)院教授,主要從事系統(tǒng)生物學(xué)、細(xì)胞信號、細(xì)胞極性、細(xì)胞集體行為、癌癥生物學(xué)、藥物發(fā)現(xiàn)、計(jì)算機(jī)視覺和圖像分析等方面的研究。其實(shí)驗(yàn)室將實(shí)驗(yàn)科學(xué)、工程學(xué)和數(shù)學(xué)的融合,整合了先進(jìn)技術(shù)、實(shí)驗(yàn)、基于機(jī)器學(xué)習(xí)的分析和數(shù)據(jù)驅(qū)動的數(shù)學(xué)建模,從而試圖了解生物系統(tǒng)的設(shè)計(jì)原理以及生物網(wǎng)絡(luò)在疾病進(jìn)展過程中如何重新連接。
參考文獻(xiàn):
Bao, F., Deng, Y., Wan,S. et al. Integrative spatial analysis of cell morphologies and transcriptionalstates with MUSE. Nat Biotechnol (2022). https://doi.org/10.1038/s41587-022-01251-z
聯(lián)系客服