本篇推文的主要内容来自于 https://nycdatascience.com/blog/student-works/nba-shot-log/,主要内容是探索14-15赛季NBA篮球运动员 库里、哈登、詹姆斯、威少的常规赛数据。前面的数据清洗过程就不再介绍了,主要内容就是作图。做小提琴图需要准备的数据是两列,第一列是用来表示用来分组的标签,第二列是数据,实际数据如下
image.png
换成我们自己的实验的话可以类比为 4个处理,每个处理有多个重复的数据,记录每个重复的数据
需要示例数据的可以直接在文末留言
作图代码
代码语言:javascript复制library(ggplot2)
library(ggthemes)
g <- ggplot(mydf, aes(x = player_name, y = accuracy))
geom_violin(aes(fill = player_name), alpha = 0.8)
xlab("Player") ylab("Shot Accuracy")
ggtitle("Summary of Shot Accuracy")
theme_gdocs()
scale_fill_manual("Players",
values = c("#FFCC33", "#FF3300", "#990000", "#0066FF"))
g
image.png
从上图我们可以很直观的看出 库里和詹姆斯相比于哈登和威少命中率更加稳定
每行代码的作用我会录制一期视频进行介绍,就不在这里用文字记录了,大家可以关注我的B站账号 小明的数据分析笔记本 观看视频内容。