在朋友圈晒了一下后台的粉丝提问,马上就被热心的好友写教程解答了!
下面是墨眉 《共享我们的大脑 》 的投稿
全部的代码都是复制粘贴即可运行
在数据展示时为了体现各因素的比重(百分比),有时会用到堆叠柱状图,这里介绍下用 ggplot2 画堆叠柱状图的代码和相应的美化方法。
一、数据准备
为了省事我加载了R自带的一个数据框,有30个样本,7个观测值
代码语言:text复制data_test = datasets::attitude
# 这个数据长这样,很普通,普普通通
# 因为后面想要做百分比的堆叠柱状图,先查看这个数据适不适合
代码语言:text复制statistics = apply(data_test, 1, sum) # 得到每个样本的观测值总和
plot(statistics)
# 每个样本的累加值不相等,不能直接用来做百分比柱状图,需要转换下
# 不过这段仅仅是为了作图好看,已经准备好数据的可以不看下面的处理
代码语言:text复制data_percent = data.frame() # 建立空数据框
# 每个值除以前面得到的总和获得占比
代码语言:text复制for (n in 1:30) {
data_percent = rbind( data_percent, data_test[n,] / statistics[n] )
}
# 再来看下,每个样本总和都等于1,现在符合要求了
代码语言:text复制statistics = apply(data_percent, 1, sum)
plot(statistics)
# 再加上样本的命名信息,方便看图,已有命名的请忽略
代码语言:text复制data_percent$names = c(LETTERS[seq( from = 1, to = 15 )],
letters[seq( from = 1, to = 15 )])
二、ggplot2作柱状图
作图前有个很重要的前置动作,要把宽矩阵转换为长矩阵(具体名词解释可以百度,关键原因是计算机和人的识别习性是不同的)
代码语言:text复制library(reshape2)
data_plot = melt(data_percent)
colnames(data_plot) = c('name','attitude','percent')
# 再加个分组信息
代码语言:text复制group = c( rep('Upper',15), rep('Lower',15))
data_plot$group = rep(group,7)
# OK,数据成型,先做个简单的柱状图
代码语言:text复制library(ggplot2)
p = ggplot( data_plot, aes( x = name, weight = percent, fill = attitude))
geom_bar( position = "stack") # 如果把 "stack" 改成 "dodge",可以变成分组柱状图
P
三、颜色设置
推荐一个比较方便的包 "ggsci"
代码语言:text复制library(ggsci)
p scale_fill_nejm()
# 如果想改成自己要的颜色也好办,比如改成 rainbow 色条
代码语言:text复制p scale_fill_manual( values = rainbow(7))
# 还可以自定义
代码语言:text复制p scale_fill_manual( values = c('yellow','green','red','blue','brown','black','blue'))
# 顺带,可以把标签给改了
代码语言:text复制p xlab('people') ylab('percent') scale_fill_nejm()
四、观测值和样本排序
然后是排序的问题,如果我想调整不同类型柱子的顺序,让他们按大小排序,可以用factor 函数
代码语言:text复制order_x = apply( data_percent[,1:7], 2, sum) # 查看各种 attitude 的总和
order_x = order_x[order(order_x, decreasing = T)] # decreasing = T 代表是倒序
order_x # 看一下,是从大到小排着的
# 此时 data_plot数据框里面的 attitude 就按照给定的 levels 排序了
代码语言:text复制data_plotattitude = factor(data_plotattitude,
levels = names(order_x) ,
ordered = T )
# 看下排序对不对
代码语言:text复制p2 = ggplot( data_plot,aes(x = name, weight = percent, fill = attitude))
geom_bar(position = "stack")
p2
# 还可以给样本排序,同样的道理
代码语言:text复制data_plotname = factor(data_plotname,
levels = name ,
ordered = T )
p3 = ggplot(data_plot,aes(x = name, weight = percent, fill = attitude))
geom_bar(position = "stack")
p3
其他可用的调整
# 可以考虑分组展示
代码语言:text复制p3 facet_wrap(~group, scales = 'free', nrow = 2)
# 可以查看各种attitude的整体情况
代码语言:text复制ggplot(data_plot, aes(x = attitude, y = percent,
fill = attitude))
geom_boxplot()
# 另外还可以做成线图,不过这个数据做出来不好看
代码语言:text复制ggplot(data_plot, aes(x =name, y = percent,
group =attitude, color = attitude))
geom_line()
scale_color_nejm()
最后,展示下参考jimmy老师教程做的一些免疫浸润的图
过程和代码参考自:https://mp.weixin.qq.com/s/rK7FFQuEPKpEU6qYbVB4Rw