不管是 GO或者KEGG这样的常见数据库的注释结果,还是mesh,reactomePA, DOSE这样的略微小众的数据库资源,不管是超几何分布检验的富集还是GSEA的算法,都Y叔都有对应的可视化函数支持。
见Y叔的网络在线书籍《clusterProfiler: universal enrichment tool for functional and comparative study》的 Chapter 12 Visualization of Functional Enrichment Result , 自己简单搜索就可以直达这个在线书籍的链接:
代码语言:javascript复制1 Bar Plot
2 Dot plot
3 Gene-Concept Network
4 Heatmap-like functional classification
5 Enrichment Map
6 UpSet Plot
7 ridgeline plot for expression distribution of GSEA result
8 running score and preranked list of GSEA result
9 pubmed trend of enriched terms
10 goplot
11 browseKEGG
12 pathview from pathview package
你最喜欢哪一种可视化方法呢?
如果你的clusterProfiler安装有困难
R语言对临床医师/医学生来说已经是最容易学的编程语言了,相比起C语言,python,java,PHP来说。可能把大多数人挡在门外的就是R包安装了,因为我们之所以会选择R语言,就是因为它丰富的第三方包,可以不费吹灰之力实现大量的统计可视化。
但是最近频繁看到粉丝留言表明安装clusterProfiler包失败,这个clusterProfiler是大名鼎鼎的Y叔开发,基本上是每个做生物信息学数据分析的人都会使用它的,做超几何分布检验(富集分析),而且内置了很多数据库,好用的函数。
但是它依赖的包有点多,所以总是会安装失败,譬如下面的报错:
而且还取决于你的操作系统,如果是Windows或者Mac,基本上看:Windows电脑使用Rstudio会有多少错误呢 以及【紧急通知】下载R包却联网失败?初学者的痛,就能解决了。
其实本质上还是联网的问题,缺什么包就安装它即可。使用下面的代码:
代码语言:javascript复制options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/"))
options(download.file.method = 'libcurl')
options(url.method='libcurl')
BiocManager::install("miRNAtap",ask = F,update = F)
BiocManager::install("topGO",ask = F,update = F)
BiocManager::install("miRNAtap.db",ask = F,update = F)
但是在ubuntu等Linux系统上面,有时候就需要系统库文件迭代更新了,比如下面的报错;
代码语言:javascript复制* DONE (DOSE)
ERROR: dependency ‘europepmc’ is not available for package ‘enrichplot’
* removing ‘/opt/R/3.6.3/lib/R/library/enrichplot’
ERROR: dependency ‘enrichplot’ is not available for package ‘clusterProfiler’
* removing ‘/opt/R/3.6.3/lib/R/library/clusterProfiler’
所以通常我们不建议大家使用ubuntu等Linux系统来操作R语言代码,各种花式报错:
代码语言:javascript复制ERROR: dependencies ‘httr’, ‘xml2’ are not available for package ‘GEOquery’
* removing ‘/opt/R/3.6.3/lib/R/library/GEOquery’