【生信挖掘】模塊化代碼復現(xiàn)6分免疫相關lncRNA預后模型
生信已經成為科研圈發(fā)SCI的神器了,檢索PubMed上可見發(fā)表的文章不管高分低分都涉及生信,但是許多人聽見生信編程就望而卻步,產生恐懼心理,我們特邀請醫(yī)科堂生信挖掘一對一輔導訓練營周老師開設專欄,通過文章實例復現(xiàn)的方式幫助大家學懂文章,看懂代碼,希望能夠給大家有所幫助。
大家好!今天分享一篇2021年4月發(fā)表在《Frontiers in Oncology》(IF=6.244,中科院二區(qū)期刊)上的一篇文章,題為"An Immune-Related lncRNA Expression Profile to Improve Prognosis Prediction for Lung Adenocarcinoma: From Bioinformatics to Clinical Word" 在這項研究中,系統(tǒng)的闡明了肺腺癌中的免疫相關lncRNA表達圖譜,并且通過單因素,多因素回歸分析構建了包含4個免疫相關lncRNA的預后模型,從而形成高低風險組,發(fā)現(xiàn)具有不同的預后和免疫細胞浸潤。GO、KEGG分析顯示了高低風險組差異基因的富集通路,GEPIA數(shù)據(jù)庫展示了單個免疫相關lncRNA在腫瘤和癌旁的表達情況,以及和生存預后的關系。最后此研究中,收集了臨床78例肺腺癌的表達情況,于體外驗證了四個免疫相關lncRNA的預后模型。 從TCGA數(shù)據(jù)庫中下載497個LUAD樣本以及54個癌旁樣本的表達矩陣,使用perl腳本分離出lncRNA和mRNA,從中提取出331個免疫基因的表達矩陣,并通過person相關分析得到免疫相關lncRNA。緊接著,采用單因素、多因素分析構建了4個免疫預后相關lncRNA模型。 主要使用代碼:perl分離腳本,單因素R腳本,多因素R腳本 2.評估細胞和組織中免疫相關 lncRNA 的表達 進一步探討了四個相關lncRNA在細胞和組織中的表達,采用PCR檢測肺腺癌細胞和對照的表達量,組織及生存曲線采用數(shù)據(jù)庫Gepia里面的數(shù)據(jù)。 主要使用代碼:Gepia數(shù)據(jù)庫http://gepia.cancer-pku.cn/。Gepia數(shù)據(jù)庫是北大開發(fā)的對TCGA數(shù)據(jù)可視化的一個在線網(wǎng)站,對于腫瘤分析是一個非常不錯的工具。 3.四種免疫相關 lncRNA 與其他臨床病理特征的關聯(lián) 采用R語言對高低風險組的四個免疫相關lncRNA進行熱圖可視化,并且分別展示了在stage, T分期,M分期和N分期中四種免疫相關lncRNA的表達情況。 4.風險評分與年齡、性別、AJCC分期以及AJCC-TNM的關系 采用柱狀圖,比較了不同臨床形狀中高低風險的表達水平,類似卡方檢驗,結果發(fā)現(xiàn)高低風險和性別,AJCC分期,M分期,N分期相關 采用limma包得出高低風險組的差異基因,對部分差異基因進行熱圖展示,并且采用GO和KEGG進行富集分析。 主要使用代碼:R語言差異分析腳本,GO分析腳本和KEGG富集分析腳本。 基于PCA降維分析,比較了全基因組,所有免疫相關lncRNA,四種免疫相關lncRNA三種模型的區(qū)分度,可以發(fā)現(xiàn)四種免疫相關lncRNA的紅色綠色分開良好。進一步,采用GSEA富集分析,查看Immune Response和Immune System Process的富集情況。最后采用CIBERSORT比較高低分析組的免疫細胞情況。 主要使用代碼:PCA降維分析R腳本,GSEA軟件使用,CIBERSORT算法R腳本使用。 臨床收集78對肺腺癌樣本,采用PCR檢測四種免疫相關lncRNA的表達,并且基于前期構建的模型計算出風險分數(shù),并結合臨床資料分析,體外驗證四種免疫相關lncRNA的模型 這篇生信文章相對來說結構思路還是很清晰的,構建了一個四種免疫相關lncRNA的預后模型并在體外驗證。其實換一個套路,做點糖酵解,鐵死亡,缺氧,細胞焦亡生信的預后模型分析都是類似的。 醫(yī)科堂精心整理模塊化代碼幫助大家復現(xiàn)論文主要內容,具體獲取代碼方式見文末! 01-03 從TCGA數(shù)據(jù)庫中下載數(shù)據(jù),構建基因表達矩陣 11-12 對cibersort結果進行可視化腳本
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請
點擊舉報 。