今天继续昨天推文的内容跟着Nature Methods学画图:R语言ggplot2画气泡图(dotplot)展示基因表达量,今天的内容介绍如何在气泡图和左侧和上方添加聚类树图,今天的内容主要参考 aplot包:让你画出更复杂的图
这篇论文是在简书 土豆学生信 分享的内容看到的。简书的链接是 https://www.jianshu.com/p/bbf9cb13b41a
论文是
论文对应的代码是公开的 https://github.com/ajwilk/2020_Wilk_COVID
image.png
今天重复的内容是论文中的figure2f
image.png
按照论文提供的代码得到了画图用到的数据,部分数据如下
image.png
但是用他提供的画图代码没有能够画出图来。因为他用到了一个
dot_plot()
函数,没有找到这个函数是怎么来的。既然已经拿到了数据,就用ggplot2自己来画吧
读入数据做气泡图,
代码语言:javascript复制data.final<-read.csv("NM/figure2f.csv",header=T,check.names=F)
head(data.final)
library(ggplot2)
ggplot(data.final,aes(x=features.plot,y=id))
geom_point(aes(size=`Percent expressed`,
color=`Average expression`))
theme_bw()
theme(panel.grid = element_blank(),
axis.text.x=element_text(angle=90,hjust = 1,vjust=0.5))
scale_color_gradient(low="lightgrey",high="blue")
labs(x=NULL,y=NULL)
guides(size=guide_legend(order=3))
image.png
以y轴为变量,做层次聚类,并使用ggtree展示层次聚类结果
聚类用到的是平均表达量那一列
代码语言:javascript复制df<-data.final[,c(1,2,4)]
首先是长格式数据转换为宽格式
代码语言:javascript复制df1<-reshape2::dcast(df,id~features.plot,value.var = "Average expression")
rownames(df1)<-df1$id
df1.1<-df1[,2:22]
image.png
层次聚类,ggtree展示结果
代码语言:javascript复制df1.1.clust<-hclust(dist(df1.1))
df2.1.clust<-hclust(dist(df2.1))
library(ggtree)
p2<-ggtree(df1.1.clust)
p2
geom_tiplab()
xlim(NA,7)
image.png
使用aplot包拼图
代码语言:javascript复制library(ggplot2)
p1<-ggplot(data.final,aes(x=features.plot,y=id))
geom_point(aes(size=`Percent expressed`,
color=`Average expression`))
theme_bw()
theme(panel.grid = element_blank(),
axis.text.x=element_text(angle=90,hjust = 1,vjust=0.5))
scale_color_gradient(low="lightgrey",high="blue")
labs(x=NULL,y=NULL)
guides(size=guide_legend(order=3))
library(aplot)
p1%>%
insert_left(p2,width = 0.2)
image.png
接下来就是在上方叠加聚类树,一样的操作
代码语言:javascript复制df2<-reshape2::dcast(df,features.plot~id,value.var = "Average expression")
rownames(df2)<-df2$features.plot
df2.1<-df2[,2:15]
df2.1.clust<-hclust(dist(df2.1))
p3<-ggtree(df2.1.clust)
#geom_tiplab(angle=90)
#theme_tree2()
layout_dendrogram()
p3
p1%>%
insert_left(p2,width = 0.2)%>%
insert_top(p3,height = 0.2)
这里多了一个知识点是ggtree作图默认开口树的方向是向右,如果需要把开口改成向下,需要加上layout_dendrogram()
函数
最终的结果如下
image.png
这里和论文中的图有些不一致,可能是聚类算法的原因;ggtree有一个默认的从上到下排序,比如左侧的树现在第一个是H6,第二个是H5,如果想把H5放到第一个也是可以实现的,可以参考之前的推文 R语言ggtree按照指定的节点旋转树 如果需要示例数据可以直接文末留言!
小明的数据分析笔记本