畢業(yè)救星!6 生信SCI,一個數(shù)據庫就搞定?沒有比它更適合臨床碩博畢業(yè)神器了吧?
分分鐘搞定 6分 單基因聯(lián)合免疫浸潤的預后套路生信文章 小伙伴們大家好,我是菠小蘿。今天為大家復現(xiàn)一篇2020年10月發(fā)表在《Front Oncol》(影響因子:4.848)上的單基因聯(lián)合免疫浸潤的預后套路生信文章。題目是“HTRA3 Is a Prognostic Biomarker and Associated With Immune Infiltrates in Gastric Cancer ”。感謝作者為我們提供了很好的學習典范!
研究目的( 文章類型 ) : 單基因聯(lián)合免疫浸潤的預后套路生信文章。本篇范文涉及到的是胃癌,由于胃癌是一種異質性惡性腫瘤,盡管在治療上通過手術、化療、放療和免疫治療可以有治愈的可能,但二期和IIIA期胃癌患者的五年生存率分別約為34%和20%。關于胃癌分子靶向治療的研究還有很大的挖掘空間,作者也是由此出發(fā),分析可能涉及到的發(fā)病機制,以及有助于改善胃癌患者預后的因素。作者發(fā)現(xiàn)HtrA絲氨酸肽酶3 (HTRA3)在先前的研究中證實,該基因可能通過降解細胞外基質蛋白多糖,間接抑制TGF-β家族蛋白介導的信號傳導。另有研究表明HTRA3可能作為腫瘤抑制因子,促進肺癌細胞中藥物誘導的細胞毒性效應的促凋亡蛋白酶表達。以及其他一些研究報道過表達的HTRA3抑制TGFb1的致癌作用,從而抑制非小細胞肺癌早期的轉移。如此種種,作者就利用從TCGA數(shù)據庫檢索的RNA測序數(shù)據,通過差異分析、富集分析、免疫浸潤等分析來逐步挖掘HTRA3在胃癌中的作用的意義。 HtrA絲氨酸肽酶3 (HTRA3)參與多種信號通路,在多種惡性腫瘤中發(fā)揮重要的調節(jié)作用。然而,其在胃癌預后和免疫浸潤中的作用仍不清楚。范文即分析了HTRA3在腫瘤組織中的表達及其與免疫浸潤的關系,其在胃癌患者中的預后作用。胃癌患者是從癌癥基因組圖譜(TCGA)中收集的,先是差異分析比較胃癌組織和正常胃粘膜組織中HTRA3的表達,Cox回歸分析HTRA3與臨床病理特征的關系。富集分析包括GO/KEGG/GSEA富集,并量化HTRA3的免疫細胞浸潤程度。Kaplan-Meier分析和Cox回歸用于評估HTRA3和生存率之間的相關性。接下來是基于Cox多變量分析的列線圖用于預測HTRA3對預后的影響。隨后HTRA3的表達與適應性免疫細胞(T輔助細胞17細胞)的豐度呈負相關,與先天免疫細胞(自然殺傷細胞,巨噬細胞等。).HTRA3在胃癌進展和預后中起著至關重要的作用,可能是預測胃切除術后生存率的中度生物標志物。 ▲ 圖1. HTRA3在泛癌中的表達差異及共表達差異表達基因。 ▲ 圖3. HTRA3的表達水平與腫瘤微環(huán)境中的免疫浸潤的相關性。 ▲ 圖5. Kaplan-Meier法分析HTRA3高表達和低表達組間的生存差異。 ▲ 圖6. 預測胃癌患者1、3、5年預后生存的模型構建。 ▲ 表1. HTRA3高表達和低表達組間的基線資料差異分析。 ▲ 表2. HTRA3表達與臨床病理特征的關系(Logistics回歸) ▲ 表3. 單變量及多變量Cox回歸分析影響胃癌患者總生存的預后因素。 ( https://www.xiantao.love/products ) ( http://gepia.cancer-pku.cn/ ) 首先,在圖1A中作者展示了HTRA3在TCGA數(shù)據庫泛癌中的表達差異。我們可以通過仙桃學術工具中“表達差異(挑)-非配對樣本”模塊進行復現(xiàn)。 因為有的癌種的正常樣本數(shù)不夠,用GTEx數(shù)據庫的正常樣本補足,將TCGA與GTEx數(shù)據庫聯(lián)合分析。如果大家選擇XENA-TCGA-GTEx泛癌數(shù)據。參數(shù)部分的類型選擇-箱圖/柱狀圖,輸入目的基因HTRA3。點擊確認。 隨后,作者在圖1B-C中展示了TCGA-STAD數(shù)據集和GTEx數(shù)據庫中比較了32個癌旁樣本和375個癌旁樣本中HTRA3的表達差異。并且還包括非配對樣本和配對樣本。這一部分可以通過仙桃學術生信工具中“表達差異”模塊輕松復現(xiàn)。 首先,在“非配對樣本”分析模塊中,由“選擇數(shù)據集-輸入目的基因-調節(jié)分析/圖片參數(shù)-分析結果”的步驟進行分析。 隨后,在“配對樣本”分析模塊中,由“選擇數(shù)據集-輸入目的基因-調節(jié)分析/圖片參數(shù)-分析結果”的步驟進行分析。 (1)選擇數(shù)據集 :前面我們也有介紹過因為有的癌種的正常樣本數(shù)不夠而GTEx數(shù)據庫的正常樣本可以彌補這一方面的不足,將TCGA與GTEx數(shù)據庫聯(lián)合分析。在數(shù)據格式的選擇上一般建議用TPM格式。我們處理TCGA基因表達譜數(shù)據最常用的方法,就是是將FPKM (Fregments Per Kilobase per Million) 格式的RNAseq數(shù)據轉換成了TPM (transcripts per million reads) 格式,并進行l(wèi)og2轉化后進行樣本間的表達比較。TCGA數(shù)據庫中基于不同的平臺有不同的格式,RNAseq平臺有FPKM和TPM格式;miRNA平臺有RPM格式。 在圖1E中展示了差異分析的火山圖,用于可視化差異結果。 根據基因表達中位值分組的差異基因分析需要在仙桃學術“差異分析-[云] 單基因差異分析”模塊進行。依次“選擇數(shù)據集-輸入目的基因-規(guī)定分組方式-調整參數(shù)-分析結果” (3)分組方式: 分組方式一般就以中位值分組就可以了 (1)選擇數(shù)據: 首先選中“云端數(shù)據”,這里有我們剛剛分析過的差異結果,選中即可。 (2)閾值設置: 差異變化倍數(shù)可以根據自己的數(shù)據結果來進行調整,一般1-2均可。顯著性閾值一般為0.05,嚴格的話可以到0.01/0.001。還可以選擇標注哪些比較重要的基因,或是相關性強的基因。 另外,作者還收集了自己的臨床數(shù)據,是44對人胃癌樣本和距腫瘤樣本至少5厘米的癌旁胃組織。所有病例均經病理證實。以及五種人胃癌細胞系(SGC7901、BGC823、MGC803、HGC27和MKN45)和一種永生化正常胃細胞系(GES1)。從這些標本中獲得總RNA和蛋白質做了PCR和Western。 接下來,作者對差異基因進行了富集分析。我們可以利用仙桃學術“圈”這一大分析模塊進行復現(xiàn)。 首先是GO/KEGG富集分析,需要準備如下格式的文件,就是一列差異基因。 下圖是我們差異分析的結果列表,從“歷史結果”中可以下載。我們將第一列提取出來整理成一個新的文件。 (3)分子列表: 上傳數(shù)據后自動識別到其中。 (6)分析結果: 這里我們還需要保存結果,后面才可以進行可視化。 可視化的樣式及顏色等都可以通過參數(shù)設置。 分析出結果,可視化結果如下,雖然不太與原文一致,但生信分析由于都諸多因素,并不能完全的 然后是GSEA富集分析,首先看一下示例數(shù)據,第一列是基因名,第二列是差異倍數(shù)。我們需要把之前的差異分析結果列表整理為如下格式,并且注意是所有基因的差異分析結果,不需要進行閾值篩選的。 (2)選擇富集數(shù)據集: GSEA分析包含了眾多數(shù)據集,分析工具中包含的就是來自于MSigDB Collections數(shù)據庫中的參考基因集合,從基因功能、位置,表達量變化趨勢等多重角度進行富集分析?;谌祟惢?,從位置,功能,代謝途徑,靶標結合等多種角度出發(fā)構建出的不同基因集合,劃分為H和C1-C7八個Cluster。C2類別數(shù)據庫收錄了已經確定的具有重要生物學和臨床狀態(tài)特征的基因集信息。并且包含BioCarta、KEGG、Matrisome Project、Reactome等在內的Pathway數(shù)據集。因此,我們推薦選擇默認的包含2232個子數(shù)據集的“c2.cp.v7.2.symbols.gmt”集和進行富集分析。 接下來就是分析結果的可視化,我們選擇下圖中的模塊,選中后會自動讀入剛剛的分析結果。 在選擇展示哪個富集結果時,我們可以自行輸入富集的ID,下圖中紅框中圈出的都是富集ID的名稱。 如果輸入單個ID即展示1條曲線,如果想要展示多條富集結果,可以獲得多條富集結果的聯(lián)合GSEA富集結果,最多可以展示5條。 圖3A作者展示了24種免疫細胞相對豐度與HTRA3表達水平的相關性。這里我們可以通過仙桃學術“免疫浸潤”模塊分析。 (3)選擇算法參數(shù): 我們這里一般選擇所有的免疫細胞即可,方法即ssGSEA。 范文圖3B-D展示了以HTRA3表達中位值分為高、低表達組,組間免疫細胞的差異性。我們以NK細胞為例進行復現(xiàn)展示。 需要用到的是“免疫浸潤-[云] 分組比較圖”這個模塊。 范文圖3E-G展示了以HTRA3表達中位值分為高、低表達組,組間免疫細胞的相關性。我們以NK細胞為例進行復現(xiàn)展示。 需要用到的是“免疫浸潤-[云] 散點圖”這個模塊。 選擇數(shù)據集、輸入目的基因、參數(shù)設置等方式與前一致,我們可以個性化設置圖片風格,就是范文展示的散點圖為例。 ROC曲線預測HTRA3對于胃癌診斷/ 預后的預測性能 圖1D 是以HTRA3表達中位值分為高、低表達組,使用接收機工作特性(ROC)曲線來估計組間差異性能。由“選擇數(shù)據集-輸入目的基因-調整圖片風格等參數(shù)”的操作順序進行。 作者在圖4中以箱式圖展示了HTRA3表達和臨床病理特征的相關性,包括組織學類型,組織學分級,病理分期,TNM分期,TP53狀態(tài),殘余腫瘤和治療結果。我們可以利用仙桃學術“[云] 臨床相關性”模塊進行復現(xiàn)。我們這里以T分期為例展示復現(xiàn)方式。 (4)選擇臨床變量: 納入需要分析的臨床變量及需要展示的亞組。(5)調整參數(shù): 可以設置點、箱的大小、顏色、透明度等。 作者在表1中展示了基線資料表,是以HTRA3中位值分組進行的列聯(lián)表分析。我們可以通過仙桃學術“基線資料表”來進行復現(xiàn)。 我們需要依次選擇數(shù)據集-輸入目的基因-選擇“列聯(lián)表”分析-納入分析的臨床變量-調節(jié)參數(shù)的步驟進行分析。 作者在圖5中展示了Kaplan-Meier生存曲線,比較HTRA3高表達和低表達的生存差異。圖5A–C展示了高HTRA3和低HTRA3胃癌患者的OS、DSS和PFI生存曲線。我們可以利用仙桃學術“[云] KM曲線圖”模塊進行分析。我們以總生存OS為例演示復現(xiàn)方法。 (1)選擇數(shù)據集-輸入分子-調整參數(shù) (2)預后參數(shù): 選擇分析的預后類型,這里以OS為例,我們還可以分別進行分析,展示結果,如同范文。 作者在表3中展示了通過多變量Cox邏輯回歸分析臨床病理特征與HTRA3的關系。 需要用 到仙桃學術“[云] 單因素|多因素Cox回歸”模塊。 多變量Cox分析比較了HTRA3表達對生存率的影響以及其他臨床特征(分期、肌層浸潤、淋巴結狀態(tài)、遠處轉移狀態(tài)、組織學分級和亞型)。我們依次選定數(shù)據集、預后參數(shù)、納入臨床變量及需要分析的亞組。 接下來,作者在圖6中展示了基于Cox回歸模型,從多變量分析中獲得的獨立預后因素用于建立列線圖和校準圖,對1年、3年和5年的預測生存概率進行個體化。可以通過仙桃學術的“[云] 預后Nomogram圖”和“[云] Calibration分析”模塊進行復現(xiàn)。 首先,在選定數(shù)據集后,設置預測年限為1、3、5年。然后是臨床變量及亞組的選擇。 大家可以根據自身情況調節(jié)其他參數(shù),然后點擊確定,分析結果如下。 作者在表2中展示了HTRA3表達與臨床病理特征的關系,運用的是Logistics回歸分析。我們可以通過仙桃學術“”模塊進行復現(xiàn)。logistic 回歸也稱為 logit 模型,是對分類變量進行回歸分析時最為常用的一種方法??偟膩碚f,是以目的基因中位值分為高、低表達組,分析多個臨床分類變量對結局的影響。點擊“確認”進行分析,隨后我們可以下載結果列表如下,整理成三線表即可。 分析結果包括了Characteristics;Odds Ratio in gene expression;Odds Ratio(OR);P-value。logistic回歸結果解讀中最重要的部分就是OR值,也就是通過優(yōu)勢比(odds ratio,OR)這一廣為人知的指標,使得疾病發(fā)生危險不再僅是一個理論層面的概念,而是一個可以理解的危險程度。 本篇范文通過差異分析、富集分析、免疫浸潤等分析來逐步挖掘HTRA3在胃癌中的作用的意義。我們利用仙桃學術的各種分析模塊及網絡平臺復現(xiàn)了全文的生信相關的數(shù)據及可視化。感興趣的小伙伴可以多多關注仙桃學術,挖掘更多的分析方法呢!
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請
點擊舉報 。