ggplot2:堆叠柱状图

2021-04-29 10:04:20 浏览数 (1)

在朋友圈晒了一下后台的粉丝提问,马上就被热心的好友写教程解答了!

下面是墨眉 《共享我们的大脑 》 的投稿

全部的代码都是复制粘贴即可运行

在数据展示时为了体现各因素的比重(百分比),有时会用到堆叠柱状图,这里介绍下用 ggplot2 画堆叠柱状图的代码和相应的美化方法。

一、数据准备

为了省事我加载了R自带的一个数据框,有30个样本,7个观测值

代码语言:text复制
data_test = datasets::attitude

# 这个数据长这样,很普通,普普通通

# 因为后面想要做百分比的堆叠柱状图,先查看这个数据适不适合

代码语言:text复制
statistics = apply(data_test, 1, sum)   # 得到每个样本的观测值总和
plot(statistics)

# 每个样本的累加值不相等,不能直接用来做百分比柱状图,需要转换下

# 不过这段仅仅是为了作图好看,已经准备好数据的可以不看下面的处理

代码语言:text复制
data_percent = data.frame()   # 建立空数据框

# 每个值除以前面得到的总和获得占比

代码语言:text复制
for (n in 1:30) {
  data_percent = rbind( data_percent, data_test[n,] / statistics[n] )  
} 

# 再来看下,每个样本总和都等于1,现在符合要求了

代码语言:text复制
statistics = apply(data_percent, 1, sum)   
plot(statistics)

# 再加上样本的命名信息,方便看图,已有命名的请忽略

代码语言:text复制
data_percent$names = c(LETTERS[seq( from = 1, to = 15 )],
 letters[seq( from = 1, to = 15 )])

二、ggplot2作柱状图

作图前有个很重要的前置动作,要把宽矩阵转换为长矩阵(具体名词解释可以百度,关键原因是计算机和人的识别习性是不同的)

代码语言:text复制
library(reshape2)
data_plot = melt(data_percent)
colnames(data_plot) = c('name','attitude','percent')

# 再加个分组信息

代码语言:text复制
group = c( rep('Upper',15), rep('Lower',15))
data_plot$group = rep(group,7)

# OK,数据成型,先做个简单的柱状图

代码语言:text复制
library(ggplot2)
p = ggplot( data_plot, aes( x = name, weight = percent, fill = attitude)) 
 geom_bar( position = "stack")  # 如果把 "stack" 改成 "dodge",可以变成分组柱状图
P

三、颜色设置

推荐一个比较方便的包 "ggsci"

代码语言:text复制
library(ggsci)
p    scale_fill_nejm()

# 如果想改成自己要的颜色也好办,比如改成 rainbow 色条

代码语言:text复制
p    scale_fill_manual( values = rainbow(7))

# 还可以自定义

代码语言:text复制
p    scale_fill_manual( values = c('yellow','green','red','blue','brown','black','blue'))

# 顺带,可以把标签给改了

代码语言:text复制
p   xlab('people')   ylab('percent')   scale_fill_nejm()

四、观测值和样本排序

然后是排序的问题,如果我想调整不同类型柱子的顺序,让他们按大小排序,可以用factor 函数

代码语言:text复制
order_x =  apply( data_percent[,1:7], 2, sum)   # 查看各种 attitude 的总和
order_x = order_x[order(order_x, decreasing = T)]  # decreasing = T 代表是倒序
order_x  # 看一下,是从大到小排着的

# 此时 data_plot数据框里面的 attitude 就按照给定的 levels 排序了

代码语言:text复制
data_plotattitude = factor(data_plotattitude,
 levels = names(order_x) ,  
 ordered = T )

# 看下排序对不对

代码语言:text复制
p2 = ggplot( data_plot,aes(x = name, weight = percent, fill = attitude)) 
  geom_bar(position = "stack")  
p2

# 还可以给样本排序,同样的道理

代码语言:text复制
data_plotname = factor(data_plotname,
 levels = name ,     
 ordered = T )
p3 = ggplot(data_plot,aes(x = name, weight = percent, fill = attitude)) 
 geom_bar(position = "stack")  
p3

其他可用的调整

# 可以考虑分组展示

代码语言:text复制
p3   facet_wrap(~group, scales = 'free', nrow = 2)

# 可以查看各种attitude的整体情况

代码语言:text复制
ggplot(data_plot, aes(x = attitude, y = percent,
 fill = attitude)) 
 geom_boxplot()

# 另外还可以做成线图,不过这个数据做出来不好看

代码语言:text复制
ggplot(data_plot, aes(x =name, y = percent,
 group =attitude,  color = attitude)) 
 geom_line() 
 scale_color_nejm()

最后,展示下参考jimmy老师教程做的一些免疫浸润的图

过程和代码参考自:https://mp.weixin.qq.com/s/rK7FFQuEPKpEU6qYbVB4Rw

0 人点赞