作者:聋言瞎面
审核:Listenlii
本文主要解决的问题:
1、QIIME2做完PICRUSt2后,只输出pathway id,如何比对得到pathway description?
2、PICRUSt2得到结果后,再怎么分析?
1. pathway ID --- pathway description
PICRUSt2结果输出后,会得到基于KEGG及MetaCyc的通路预测。KEGG是2011年的版本了,就建议不要用了。
所以以下介绍MetaCyc:直接用PICRUSt2软件做的话会直接输出pathway description,而在QIIME2里做则需要下面的方法。
读入metacyc官网下载的pathway id及描述文件
下载地址:
https://metacyc.org/group?id=biocyc17-61025-3865826896
代码语言:javascript复制id <- read_csv("All-pathways-of-MetaCyc.txt",col_names = T)
dsct <- read_delim("All-pathways-of-MetaCyc-2.txt",col_names = T,delim = "t") #注意使用read_csv读取的行数有错误!
id_dsct <- cbind(id,dsct = dsct$Pathways)
保存所有的metacyc数据库的pathway id及通路描述
代码语言:javascript复制write.table(id_dsct,file = "all_metacyc_id_dsct.tsv",row.names = F,col.names = T,quote = F,sep ="t")
导入pcirust2的输出结果:
1、导出所有的id,输入到metacyc数据库;
2、把id替换成描述,输出STAMP的输入文件
代码语言:javascript复制pic_output <- read_tsv("feature-table.biom.tsv",col_names = T)
metacyc_input <- pic_output$`OTU-ID`
write.table(metacyc_input,file = "metacyc_input.tsv",row.names = F,col.names = F,quote = F,sep ="t")
stamp_input <- merge(pic_output,id_dsct,all.x = T,by.x = "OTU-ID",by.y = "Pathways")
write.table(stamp_input,file = "stamp_input.tsv",row.names = F,col.names = F,quote = F,sep ="t")
2. PICRUSt2得到结果后,再怎么办?
最后的输出结果也是组成型数据,所以。。。首先我们知道没有最好的统计模型了;其次,各种多元统计分析是不是可以搞一搞了?差异通路是不是可以STAMP、ANCOM、ALDEx2都试试?
怎么解释就看你自己了。可以结合下面的层级树逐一层级查看你所关注的通路。
同时也可以创建自己筛选出的差异通路表。
链接如下:https://metacyc.org/smarttables
(花10s注册账号后,把上面生成的metacyc_input.tsv导入后,可以生成mysmarttables,然后你就可以点点点点点。。。
因为本人只是瞎点,也没有完全会用这个smarttable,就不班门弄斧了,我觉得参照上面的层级树就行。想深入学习见这个视频教程:
https://biocyc.org/webinar.shtml)
下图展示如何导入metacyc_input.tsv
最后,本周大半时间搭在这上面踩坑,希望本文能给大家科研路上以帮助;
感谢“需要鼓励的小昱”的指导。