我们直奔主题,今天给大家介绍下利用R语言去下载KEGG数据库的所有数据。这里需要用到的包是KEGGREST。首先看下包的安装以及所需要的相关包:
代码语言:javascript复制BiocManager::install("KEGGREST")
BiocManager::install("fmcsR")
devtools::install_git("https://github.com/cran/RbioRXN.git")
接下来我们直接通过实例来看下如何获取所有的数据:
代码语言:javascript复制##包加载
library(KEGGREST)
library(RbioRXN)
代码语言:javascript复制##查看KEGG数据库包含的数据
listDatabases()
代码语言:javascript复制##获取单个数据集中的数据,
pathway<- keggList("pathway")
代码语言:javascript复制##对单个数据库进行组织的选择
org <-keggList("pathway","hsa")
从上面可以看出keggList不仅可以提取单个数据集还可以获取对应物种的信息。在这里我们发现同样的通路编码ID却不一样,map num泛指KEGG中的所有通路;has num指的是人类物种的通路信息。
代码语言:javascript复制##获取所有的代谢反应和化合物数据
keggAll = get.kegg.all()
save(keggAll,file="C:/data/metabolism/database/KEGG/keggAll.Rdata")
###提取数据
reaction=keggAll$reaction
write.csv(reaction," reaction.csv")
compound=keggAll$compound
write.csv(compound," compound.csv")
至此我们就可以将KEGG中的数据提取到本地进行接下来的分析处理。
欢迎大家学习交流!