今天我們不介紹文章了,回答一個(gè)問題:批量miRNA的靶基因預(yù)測,不用代碼怎么實(shí)現(xiàn)?
具體來說是這樣的:有同學(xué)說在做數(shù)據(jù)分析的時(shí)候通過GEO的芯片分析找到了幾十條顯著差異的miRNA,想對這些miRNA進(jìn)行靶基因預(yù)測,下面是22條舉例的miRNA:
我們可以看到這里出現(xiàn)了miRNA的名字,但是出現(xiàn)了星號*等標(biāo)記,我們前面在miRNA的名字,到底是什么意思?和3p還是5p,有必要區(qū)分嗎?中說過,對于大多數(shù)miRNA來說,如果編號一樣但3p和5p不同,其功能及調(diào)控的靶基因可能都是不同的,如miR-223-3p和miR-223-5p(通過mirbase查詢):
我們看到miR-223-3p和miR-223-5p的序列是不同的,而兩條miRNA的previous ID分別是hsa-miR-223和hsa-miR-223*,而平時(shí)我們在文章里面經(jīng)常見到的很多時(shí)候都是只出現(xiàn)hsa-miR-223或者h(yuǎn)sa-miR-223*,
而不出現(xiàn)具體的3p還是5p信息,因此當(dāng)我們看到這樣信息的時(shí)候就可以通過mirbase(http://www.mirbase.org/)查詢了。
下面我們回到問題,當(dāng)我們拿到22條miRNA后,我們可以通過以前介紹過的一個(gè)工具進(jìn)行靶基因預(yù)測(我好像發(fā)現(xiàn)了一個(gè)miRNA各種軟件的大本營……),
工具:DIANA Tools,網(wǎng)址:http://diana.imis.athena-innovation.gr/DianaTools/index.php?r=site/page&view=software
我們用microT-CDS這個(gè)軟件:
在搜索框中直接輸入22條miRNA的名字后回車:
我們看到一個(gè)名字匹配到了多條miRNA,我們需要確定是哪一條,如果數(shù)量少的情況下,我們通過mirbase查詢即可:
通過查詢結(jié)果我們知道hsa-mir-96指的是hsa-mir-96-5p:
這樣我們在界面選擇hsa-mir-96-5p前面的箭頭就可以了:
同樣的道理,如果數(shù)量少我們可以一個(gè)個(gè)查,然后選擇。
如果數(shù)量比較多的情況下,我們可以用mirbase的注釋文件,需要進(jìn)入FTP site:
然后選擇aliases.txt.zip文件下載后打開:
我們看到hsa-mir-96*與hsa-mir-96-3p對應(yīng)的是一個(gè)ID,這樣我們就可以在Excel里面批量操作了。具體的操作方法大家可以通過Vlookup函數(shù)等實(shí)現(xiàn),比較簡單(不懂的同學(xué)可看這篇教程:(工具篇):S4E07: 用Excel就能實(shí)現(xiàn)的幾個(gè)逆天功能!)
好了,當(dāng)我們選好以后在新的頁面里面就出現(xiàn)了靶基因的情況:
每個(gè)預(yù)測的通過箭頭可以打開:
右上角的紅框里面可以下載:
簡單篩選一下就可以了:
聯(lián)系客服