dplyr包summarize的使用

2020-09-14 16:55:44 浏览数 (2)

创建数据框

代码语言:javascript复制
dat<-mtcars

datdat

对数据分组

代码语言:javascript复制
dat1<-group_by(dat,cyl,gear)
summarize(dat1)
代码语言:javascript复制
# A tibble: 8 x 2
# Groups:   cyl [3]
    cyl  gear
  <dbl> <dbl>
1     4     3
2     4     4
3     4     5
4     6     3
5     6     4
6     6     5
7     8     3
8     8     5

cyl有4,6,8三种取值,而gear有3,4,5三种取值,应该一共有9组,但我们这里只有8组,原因是cyl=8,gear=4的没有,默认不填补缺失值就会被 drop 掉

计算一些统计量

代码语言:javascript复制
summarise(dat1, Q1 = quantile(disp, 0.25), ME = median(disp), Q3 = quantile(disp, 0.75))
代码语言:javascript复制
    cyl  gear    Q1    ME    Q3
  <dbl> <dbl> <dbl> <dbl> <dbl>
1     4     3 120.  120.   120.
2     4     4  78.0  93.5  126.
3     4     5 101.  108.   114 
4     6     3 233.  242.   250.
5     6     4 160   164.   168.
6     6     5 145   145    145 
7     8     3 297.  355    410 
8     8     5 314.  326    338.

0 人点赞