跟着Nature microbiology学画图~ggplot2散点图添加分组边界

2021-01-06 14:11:15 浏览数 (4)

今天要模仿的图片来自于论文 Core gut microbial communities are maintained by beneficial interactions and strain variability in fish。期刊是 Nature microbiology

image.png

今天重复论文中Figure4中的小b这幅图

image.png

论文中他实际做的分析是主坐标分析(Principal coordinates analysis of samples),今天的推文内容不涉及分析过程,只讨论作图。用到的示例数据是鸢尾花的数据集做完主成分分析的结果。需要示例数据的可以在文末留言

数据格式

image.png

第一步读入数据
代码语言:javascript复制
df<-read.csv('irispca.csv',row.names = 1,header=T)
head(df)

image.png

基本的散点图,根据group分组来映射颜色和形状
代码语言:javascript复制
library(ggplot2)
ggplot() 
  geom_point(data=df,aes(x=PC1,y=PC2,
                         color=group,shape=group),
             size=2)

image.png

接下来是一些简单的美化
代码语言:javascript复制
ggplot() 
  geom_point(data=df,aes(x=PC1,y=PC2,
                         color=group,shape=group),
             size=3) 
  theme_bw() 
  theme(panel.background = element_blank(),
        panel.grid = element_blank(),
        legend.title = element_text(hjust=0.5)) 
  labs(x="Coordinate 1 (15%)",y="Coordinate 2 (8%)") 
  scale_color_manual(values = c("#008080","#ffa500","#8b008b"))

image.png

接下来是添加分组边界

添加分组边界主要参考了文章 https://chrischizinski.github.io/rstats/vegan-ggplot2/

添加分组边界用到的是geom_polygon()函数,这里需要借助chull()函数重新构造一份数据。chull()函数是我第一次接触,具体作用我还得在学习一下,用如下代码可以解决问题,但是代码具体的作用我还得再研究一下

比如给setosa这一组数据添加分组边界

构造一份新的数据 集

代码语言:javascript复制
df1<-df[df$group=="setosa",][chull(
  df[df$group=="setosa",c("PC1","PC2")]
),]

画图

代码语言:javascript复制
ggplot() 
  geom_point(data=df,aes(x=PC1,y=PC2,
                         color=group,shape=group),
             size=3) 
  theme_bw() 
  theme(panel.background = element_blank(),
        panel.grid = element_blank(),
        legend.title = element_text(hjust=0.5)) 
  labs(x="Coordinate 1 (15%)",y="Coordinate 2 (8%)") 
  scale_color_manual(values = c("#008080","#ffa500","#8b008b")) 
  geom_polygon(data=df1,aes(x=PC1,y=PC2,group=group),
               color="#008080",fill="#008080",alpha=0.2,size=1)

image.png

按照这个思路再给另外两个品种添加分类边界就好了

代码语言:javascript复制
library(ggplot2)
table(df$group)
df1<-df[df$group=="setosa",][chull(
  df[df$group=="setosa",c("PC1","PC2")]
),]
df2<-df[df$group=="versicolor",][chull(
  df[df$group=="versicolor",c("PC1","PC2")]
),]
df3<-df[df$group=="virginica",][chull(
  df[df$group=="virginica",c("PC1","PC2")]
),]
ggplot() 
  geom_point(data=df,aes(x=PC1,y=PC2,
                         color=group,shape=group),
             size=3) 
  theme_bw() 
  theme(panel.background = element_blank(),
        panel.grid = element_blank(),
        legend.title = element_text(hjust=0.5)) 
  labs(x="Coordinate 1 (15%)",y="Coordinate 2 (8%)") 
  scale_color_manual(values = c("#008080","#ffa500","#8b008b")) 
  geom_polygon(data=df1,aes(x=PC1,y=PC2,group=group),
               color="#008080",fill="#008080",alpha=0.2,size=1) 
  geom_polygon(data=df2,aes(x=PC1,y=PC2,group=group),
               color="#ffa500",fill="#ffa500",alpha=0.2,size=1) 
  geom_polygon(data=df3,aes(x=PC1,y=PC2,group=group),
               color="#8b008b",fill="#8b008b",alpha=0.2,size=1)

image.png

0 人点赞