赵丽颖合成视频,动漫美女被挠脚心视频

如何把kegg數據庫的hsa系列id轉為基因名字呢

2023.04.05 廣東

首先我問了一下chatGPT關于kegg數據庫的hsa系統(tǒng)介紹：

KEGG (Kyoto Encyclopedia of Genes and Genomes) 是一個集成了基因組、代謝組和信號傳導通路等多種生物信息學數據和分析工具的綜合性數據庫。KEGG數據庫的hsa系統(tǒng)是其中的一個分支，專注于人類基因組和蛋白質組的信息整合、注釋和分析。下面是hsa系統(tǒng)的一些主要特點：

基因信息：hsa系統(tǒng)提供了關于人類基因的詳細信息，包括基因名稱、別名、序列、染色體位置、功能注釋等。這些信息可通過多種途徑進行查詢和訪問，如基因搜索、染色體瀏覽、KEGG PATHWAY等。
代謝通路：hsa系統(tǒng)包含了大量的代謝通路信息，可用于研究代謝通路中基因、蛋白質、代謝產物之間的關系以及代謝通路在生理、疾病等方面的作用。hsa系統(tǒng)中的代謝通路可通過KEGG PATHWAY進行瀏覽和查詢。
疾病信息：hsa系統(tǒng)還提供了關于人類疾病的信息，包括疾病名稱、分類、癥狀、基因、代謝通路等方面的信息。這些信息可用于研究基因與疾病之間的關系，以及發(fā)現潛在的藥物靶點等。
蛋白質信息：hsa系統(tǒng)也包含了大量的蛋白質信息，包括蛋白質名稱、序列、功能、亞細胞定位等。這些信息可用于研究蛋白質的結構與功能，以及蛋白質在代謝通路中的作用。
工具與資源：除了上述信息之外，hsa系統(tǒng)還提供了一系列的生物信息學工具和資源，如BLAST搜索、KEGG Mapper、KEGG Orthology等。這些工具和資源可用于研究基因、蛋白質和代謝通路等方面的生物學問題。

總之，KEGG數據庫的hsa系統(tǒng)為研究人類基因組和蛋白質組提供了一個非常有價值的資源和工具，廣泛應用于生物醫(yī)學研究、藥物研發(fā)等領域。

目前（2023-04-03）在 https://rest.kegg.jp/list/pathway/hsa 可以看到全部的人類的通路，比如：

hsa01100 Metabolic pathways - Homo sapiens (human)
hsa01200 Carbon metabolism - Homo sapiens (human)
hsa01210 2-Oxocarboxylic acid metabolism - Homo sapiens (human)
hsa01212 Fatty acid metabolism - Homo sapiens (human)

目前（2023-04-03）在 https://rest.kegg.jp/link/hsa/pathway 可以看到全部的人類的通路以及它對應的基因的hsa系列id，比如：

path:hsa00010 hsa:10327
path:hsa00010 hsa:124
path:hsa00010 hsa:125
path:hsa00010 hsa:126
path:hsa00010 hsa:127

這樣就有一點尷尬，因為人類的通路我們可以容忍它是kegg數據庫的id，但是人類的基因我們不需要 hsa:127這樣的東西，也很難理解，關于這些id的定義當然了看kegg的官網即可；

比如：https://www.genome.jp/dbget-bin/www_bget?hsa:230 就可以看到這個基因的很詳細的信息：

ALDOC, ALDC 
(RefSeq) aldolase, fructose-bisphosphate C

NCBI-GeneID:  230
NCBI-ProteinID:  NP_005156
OMIM:  103870
HGNC:  418
Ensembl:  ENSG00000109107
Pharos:  P09972(Tbio)
UniProt:  P09972 A0A024QZ64

那么就需要一個轉換，如何把kegg數據庫的hsa系列id轉為基因名字呢，我繼續(xù)詢問chatGPT，這次它給了我一個略有瑕疵的代碼：

略有瑕疵的代碼

如果有r基礎，很容易修改成功：

library(KEGGREST)

# example list of hsa IDs
hsa_ids <- c("hsa:10458", "hsa:23545", "hsa:10157")

# retrieve information about the genes
gene_info <- keggGet( hsa_ids  )

# extract the gene names from the information
gene_names <- sapply(gene_info, function(x) x$NAME)

# print the gene names
print(gene_names)

所以，接下來只需要去 https://rest.kegg.jp/link/hsa/pathway 拿到人類的全部的基因的hsa格式的id，然后使用 keggGet 函數即可批量轉換啦。

本站僅提供存儲服務，所有內容均由用戶發(fā)布，如發(fā)現有害或侵權內容，請點擊舉報。

打開APP，閱讀全文并永久保存查看更多類似文章

經常提到的KEGG數據庫是什么樣子的

利用KEGG的API獲取基因對應的pathway 信息

GO 和 KEGG 的區(qū)別 | GO KEGG數據庫用法 | 基因集功能注釋 | 代謝通路富集

wikipathway : 代謝通路專用數據庫

Pathview包：整合表達譜數據可視化KEGG通路

[重磅]KEGG API，你會用嗎

更多類似文章 >>

中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频