跟着Nature Methods学画图:R语言ggplot2+ggtree+aplot画气泡图组合聚类树图

2021-03-15 09:50:12 浏览数 (1)

今天继续昨天推文的内容跟着Nature Methods学画图:R语言ggplot2画气泡图(dotplot)展示基因表达量,今天的内容介绍如何在气泡图和左侧和上方添加聚类树图,今天的内容主要参考 aplot包:让你画出更复杂的图

这篇论文是在简书 土豆学生信 分享的内容看到的。简书的链接是 https://www.jianshu.com/p/bbf9cb13b41a

论文是

论文对应的代码是公开的 https://github.com/ajwilk/2020_Wilk_COVID

image.png

今天重复的内容是论文中的figure2f

image.png

按照论文提供的代码得到了画图用到的数据,部分数据如下

image.png

但是用他提供的画图代码没有能够画出图来。因为他用到了一个dot_plot()函数,没有找到这个函数是怎么来的。既然已经拿到了数据,就用ggplot2自己来画吧

读入数据做气泡图,
代码语言:javascript复制
data.final<-read.csv("NM/figure2f.csv",header=T,check.names=F)
head(data.final)

library(ggplot2)
ggplot(data.final,aes(x=features.plot,y=id)) 
  geom_point(aes(size=`Percent expressed`,
                 color=`Average expression`)) 
  theme_bw() 
  theme(panel.grid = element_blank(),
        axis.text.x=element_text(angle=90,hjust = 1,vjust=0.5)) 
  scale_color_gradient(low="lightgrey",high="blue") 
  labs(x=NULL,y=NULL) 
  guides(size=guide_legend(order=3))

image.png

以y轴为变量,做层次聚类,并使用ggtree展示层次聚类结果

聚类用到的是平均表达量那一列
代码语言:javascript复制
df<-data.final[,c(1,2,4)]
首先是长格式数据转换为宽格式
代码语言:javascript复制
df1<-reshape2::dcast(df,id~features.plot,value.var = "Average expression")
rownames(df1)<-df1$id
df1.1<-df1[,2:22]

image.png

层次聚类,ggtree展示结果
代码语言:javascript复制
df1.1.clust<-hclust(dist(df1.1))
df2.1.clust<-hclust(dist(df2.1))
library(ggtree)
p2<-ggtree(df1.1.clust)
p2 
  geom_tiplab() 
  xlim(NA,7)

image.png

使用aplot包拼图
代码语言:javascript复制
library(ggplot2)
p1<-ggplot(data.final,aes(x=features.plot,y=id)) 
  geom_point(aes(size=`Percent expressed`,
                 color=`Average expression`)) 
  theme_bw() 
  theme(panel.grid = element_blank(),
        axis.text.x=element_text(angle=90,hjust = 1,vjust=0.5)) 
  scale_color_gradient(low="lightgrey",high="blue") 
  labs(x=NULL,y=NULL) 
  guides(size=guide_legend(order=3))

library(aplot)
p1%>%
  insert_left(p2,width = 0.2)

image.png

接下来就是在上方叠加聚类树,一样的操作
代码语言:javascript复制
df2<-reshape2::dcast(df,features.plot~id,value.var = "Average expression")
rownames(df2)<-df2$features.plot
df2.1<-df2[,2:15]
df2.1.clust<-hclust(dist(df2.1))
p3<-ggtree(df2.1.clust) 
  #geom_tiplab(angle=90) 
  #theme_tree2() 
  layout_dendrogram()
p3
p1%>%
  insert_left(p2,width = 0.2)%>%
  insert_top(p3,height = 0.2)

这里多了一个知识点是ggtree作图默认开口树的方向是向右,如果需要把开口改成向下,需要加上layout_dendrogram()函数

最终的结果如下

image.png

这里和论文中的图有些不一致,可能是聚类算法的原因;ggtree有一个默认的从上到下排序,比如左侧的树现在第一个是H6,第二个是H5,如果想把H5放到第一个也是可以实现的,可以参考之前的推文 R语言ggtree按照指定的节点旋转树 如果需要示例数据可以直接文末留言!

小明的数据分析笔记本

0 人点赞