有读者在公众号后台留言问下图应该如何实现
image.png
实现这个图的办法很多,今天的推文介绍使用R语言ggplot2包实现这个图的方法。
第一步是准备数据
部分数据集如下
image.png
总共4列
- 前两列是变量
- 第三列是相关系数
- 第四列是 显著性P值
前面的变量需要注意的是,因为只画上三角,所以准备数据的时候是 :
总共的变量是10个 第一列10个x1,接下来是紧接着9个x2,然后是8个x3
第一步树读入数据
代码语言:javascript复制df<-read.csv("20210320.csv",header=T)
head(df)
增加一列显著性的星号
代码语言:javascript复制library(dplyr)
df%>%
mutate(label=case_when(
signi<0.001 ~ "***",
signi>0.001&signi<0.01 ~ "**",
signi>0.01&signi<0.05 ~ "*",
TRUE ~ ""
)
) -> df1
接下来是作图
首先是上三角的气泡图
代码语言:javascript复制library(ggplot2)
ggplot(data=df1,aes(x=var_x,y=var_y))
geom_point(aes(size=value,color=value))
scale_color_gradient(low = "#80fcfe",high = "#ff80fc",
breaks=seq(-1,1,0.2))
scale_size_continuous(range = c(5,15))
guides(size=F)
image.png
这样的话X10的位置是不对的,所以要设置一下因子的水平
代码语言:javascript复制df1$var_x<-factor(df1$var_x,
levels = paste0("X",1:10))
df1$var_y<-factor(df1$var_y,
levels = paste0("X",1:10))
ggplot(data=df1,aes(x=var_x,y=var_y))
geom_point(aes(size=value,color=value))
scale_color_gradient(low = "#80fcfe",high = "#ff80fc",
breaks=seq(-1,1,0.2))
scale_size_continuous(range = c(5,15))
guides(size=F)
这样就对了
接下来是添加文字,首先把对角线那一列去掉
代码语言:javascript复制df1%>%
filter(var_x!=var_y) -> df2
head(df2)
ggplot(data=df1,aes(x=var_x,y=var_y))
geom_point(aes(size=value,color=value))
scale_color_gradient(low = "#80fcfe",high = "#ff80fc",
breaks=seq(-1,1,0.2))
scale_size_continuous(range = c(5,15))
guides(size=F)
theme_bw()
geom_text(data=df2,aes(x=var_y,y=var_x,
label=paste0(value,label)))
image.png
最后调整一下图例的高度
代码语言:javascript复制df1%>%
filter(var_x!=var_y) -> df2
head(df2)
ggplot(data=df1,aes(x=var_x,y=var_y))
geom_point(aes(size=value,color=value))
scale_color_gradient(low = "#80fcfe",high = "#ff80fc",
breaks=seq(-1,1,0.2))
scale_size_continuous(range = c(5,15))
guides(size=F)
theme_bw()
geom_text(data=df2,aes(x=var_y,y=var_x,
label=paste0(value,label)))
theme(legend.key.height = unit(3.5,'cm'),
legend.justification = c(0,0),
legend.title = element_blank())
image.png
这样就做好了
欢迎大家关注我的公众号小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!