從小白的角度,30分鐘復(fù)現(xiàn)生信套路。今天為大家?guī)硪黄?020年9月發(fā)表于International Journal of Chronic Obstructive Pulmonary Disease的生信文章《Construction of Potential miRNA–mRNA Regulatory Network in COPD Plasma by Bioinformatics Analysis》的復(fù)現(xiàn)。
本文是一篇挖掘GEO數(shù)據(jù)庫的純生信文章,涉及9個(gè)圖片,3張表格,用到的數(shù)據(jù)集是GPL570平臺(tái)的GSE56768,GPL9040平臺(tái)的GSE24709、GSE61741、GSE31568。
9張圖包括:
- 差異表達(dá)miRNA潛在轉(zhuǎn)錄因子的預(yù)測(cè)
- 差異表達(dá)miRNA潛在靶基因的預(yù)測(cè)
- miRNA-hub gene網(wǎng)絡(luò)
- 前12 hub genes在GSE56768中的表達(dá)
下載GSE24709、GSE61741、GSE31568表達(dá)矩陣,以GSE24709為例:進(jìn)入GEO網(wǎng)站https://www.ncbi.nlm.nih.gov/geo/,檢索GSE24709:點(diǎn)擊“series matrix files”:點(diǎn)擊“GSE24709_series_matrix.txt.gz”:打開“GSE24709_series_matrix.txt”:將表達(dá)矩陣部分復(fù)制粘貼到新表格,并刪掉肺癌樣本數(shù)據(jù),只保留normal樣本和COPD樣本:新建一個(gè)sheet,整理出樣本名對(duì)應(yīng)的組別:進(jìn)入仙桃學(xué)術(shù)網(wǎng)站https://www.xiantao.love/products。進(jìn)入主頁,選擇高級(jí)版,點(diǎn)擊“立即使用”。(注:免費(fèi)版和基礎(chǔ)版都可以進(jìn)行統(tǒng)計(jì)和可視化,由于高級(jí)版功能最全,這里選擇高級(jí)版作為范例)選擇“分析工具”后,在左側(cè)選擇“表達(dá)差異”下的“復(fù)雜熱圖”,參數(shù)選擇如下圖所示:Figure 2B、C根據(jù)同樣的操作即可復(fù)現(xiàn)。回到GEO網(wǎng)站的GSE24709檢索結(jié)果頁面,點(diǎn)擊“analyze with GEO2R”:分別定義組別COPD、normal,并對(duì)樣本賦予組別:按“|LogFC|>1.5 and an adjusted P value <0.05”對(duì)其進(jìn)行篩選:將GSE24709、GSE61741、GSE31568的DEMs整理成表格:回到仙桃學(xué)術(shù)網(wǎng)站,選擇“分析工具”后,在左側(cè)選擇“基礎(chǔ)繪圖”下的“韋恩圖”,上傳該表格,點(diǎn)擊確認(rèn):點(diǎn)擊“excel表格下載”,得到9個(gè)交集的DEMs:在GSE24709、GSE61741、GSE31568的差異分析表格中分別檢索以上9個(gè)交集的DEMs,找到其對(duì)應(yīng)的logFC。另外,可以注意到以上9個(gè)交集的DEMs中有一些miRNA的命名中帶有星號(hào),到miRBase網(wǎng)站中進(jìn)行轉(zhuǎn)換。分別檢索hsa-miR-182*、hsa-miR-126*、hsa-miR-130b*:發(fā)現(xiàn)hsa-miR-182*最新ID為hsa-miR-182-3p:發(fā)現(xiàn)hsa-miR-126*最新ID為hsa-miR-126-5p:發(fā)現(xiàn)hsa-miR-130b*最新ID為hsa-miR-130b-5p:另外檢索hsa-miR-1468和hsa-miR-497發(fā)現(xiàn)分別有兩個(gè)成熟序列:回到差異分析表格中比對(duì)序列,發(fā)現(xiàn)其實(shí)分別是hsa-miR-1468-5p和hsa-miR-497-5p:然后回到仙桃學(xué)術(shù)網(wǎng)站,選擇“分析工具”后,在左側(cè)選擇“差異表達(dá)”下的“復(fù)雜熱圖”,上傳該表格,點(diǎn)擊確認(rèn):PS:至于hsa?miR?126?5p的結(jié)果為什么和原文不一致,這應(yīng)該是作者的失誤。圖四&表二:差異表達(dá)miRNA潛在靶基因的預(yù)測(cè)
打開miRNet網(wǎng)站https://www.mirnet.ca/miRNet/home.xhtml,點(diǎn)擊miRNAs:輸入上調(diào)交集DEMs,點(diǎn)擊submit和proceed:點(diǎn)擊mir2gene和proceed:即可整理出靶基因的數(shù)量。下調(diào)交集DEMs也是同樣的操作。即可復(fù)現(xiàn)Figure 4和Table 2。圖三:差異表達(dá)miRNA潛在轉(zhuǎn)錄因子的預(yù)測(cè)
Funrich預(yù)測(cè)不了miRNA的轉(zhuǎn)錄因子,該文獻(xiàn)應(yīng)該寫錯(cuò)了,猜測(cè)應(yīng)該是用Funrich預(yù)測(cè)的miRNA靶基因的轉(zhuǎn)錄因子。打開Funrich 3.1.3軟件,點(diǎn)擊“gene enrichment”,“add dataset”:點(diǎn)擊analysis,選擇transcription factor,點(diǎn)擊OK:下調(diào)的交集DEMs也是同樣的操作,即可復(fù)現(xiàn)Figure 3B。圖五&圖六:靶基因的GO和KEGG富集結(jié)果
在仙桃學(xué)術(shù)網(wǎng)站的“分析工具”頁面選擇 “功能聚類”下的“GO|KEGG 富集分析”,下載示例數(shù)據(jù):上傳該表格,在參數(shù)欄中選擇全部GO+KEGG,點(diǎn)“確認(rèn)”:得到分析結(jié)果,保存結(jié)果,并下載Excel表:對(duì)富集結(jié)果表格按照“adjusted P < 0.05”的條件進(jìn)行篩選:從GO-BP、GO-CC、GO-MF條目中分別挑選一些自己想要展示的條目。然后選擇仙桃學(xué)術(shù)網(wǎng)站左側(cè)的“功能聚類”下的“GO|KEGG 可視化”,選擇剛才保存的富集分析結(jié)果,選擇圖片類型為柱狀圖,將GO條目輸入到紅框中,并選擇分面:圖片類型改為氣泡圖,即可復(fù)現(xiàn)Figure 5B:輸入想要展示的KEGG條目,圖片類型選擇柱狀圖或氣泡圖,“不分面”,即可復(fù)現(xiàn)Figure 6:將上調(diào)DEMs的靶基因復(fù)制到list of names中,organism選擇“homo sapiens”,檢索(因?yàn)镾tring不支持輸入基因超過2000個(gè),所以只選擇1000個(gè)基因進(jìn)行后續(xù)分析):打開Cytoscape軟件(3.8.0),載入互作表格:點(diǎn)擊cytohubba,點(diǎn)擊calculate:輸入Top 30,選擇“MCC算法”,點(diǎn)擊submit:點(diǎn)擊style,選擇圓形,點(diǎn)擊apply:根據(jù)同樣的操作,即可復(fù)現(xiàn)Figure 7B。在軟件下方點(diǎn)擊最右側(cè)的表格,復(fù)制該表格:即可得到MCC算法下上調(diào)DEMs靶基因的top 10 hub genes及其score。根據(jù)同樣的操作即可得到MCC算法下下調(diào)DEMs靶基因的top 10 hub genes及其score。整理成表格,即可復(fù)現(xiàn)Table 3。圖八:miRNA-hub gene網(wǎng)絡(luò)
打開之前在miRNet網(wǎng)站檢索到的靶基因表格,分別搜索上/下調(diào)DEMs靶基因的top 10 hub genes對(duì)應(yīng)的DEMs,整理成表格miRNA-hub gene。新建一個(gè)表格color,第一列為miRNA-hub gene表格中的分子,第二列為上下調(diào)狀態(tài):新建一個(gè)表格shape,第一列為miRNA-hub gene表格中的分子,第二列為分子類型:打開cytoscape(3.8.0)軟件,載入miRNA-hub gene表格:點(diǎn)擊File——import——table from file,導(dǎo)入color表格和shape表格:在style中點(diǎn)擊fill color,選擇column參數(shù)為DE,mapping type參數(shù)為discrete mapping,DOWN參數(shù)為綠色,UP參數(shù)為紅色:點(diǎn)擊shape,選擇column參數(shù)為Kind,mapping type參數(shù)為discrete mapping,gene參數(shù)為diamond,miRNA參數(shù)為ellipse:圖片可以導(dǎo)出(點(diǎn)擊File——Export——Network to Image):圖九:前12個(gè)hub gene在GSE56768中的表達(dá)
打開平臺(tái)注釋文件,檢索hub gene RPS25,發(fā)現(xiàn)對(duì)應(yīng)的探針號(hào)200091_s_at:打開表達(dá)矩陣表格,檢索探針號(hào)200091_s_at:復(fù)制該行數(shù)據(jù)以及樣本名行、樣本特點(diǎn)行到一個(gè)新的表格:將該表的第一列和第三列復(fù)制到一個(gè)新表中:回到仙桃學(xué)術(shù),在 “分析工具”頁面選擇 “基礎(chǔ)繪圖”下的“分組比較圖”,上傳該表格,選擇點(diǎn)圖,Y軸標(biāo)題輸入RPS25,點(diǎn)擊確認(rèn):其余11個(gè)hub gene的表達(dá)也是同樣的操作,即可復(fù)現(xiàn)Figure 9。好了,本期零代碼生信文章復(fù)現(xiàn)就到這里啦!有沒有覺得仙桃學(xué)術(shù)的工具很贊很奈斯?希望大家好好利用這個(gè)寶藏,多多發(fā)文章~
3+SCI套路,零代碼搞定,復(fù)現(xiàn)的太精彩了吧~請(qǐng)問有沒有更多的文章復(fù)現(xiàn)?往下看~掃描下方二維碼即可免費(fèi)獲取超千頁的實(shí)操手冊(cè)
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。