1. 数据排序
在R中对数据框中的数据排序,我们通常使用order()函数,该函数默认是升序,但是在要排序的变量前加上减号(-)就相当于降序排列了。
代码语言:javascript复制# 以mtcars数据为例对数据进行排序
attach(mtcars) # 固定数据集
# 按变量mpg排序
newdata <- mtcars[order(mpg),]
# 按变量mpg和cyl排序
newdata <- mtcars[order(mpg, cyl),]
#按变量mpg(升序)和cyl(降序)排序
newdata <- mtcars[order(mpg, -cyl),]
detach(mtcars) # 解固定数据集
2. 数据合并
2.1 添加列
将数据水平合并时我们通常使用merge()函数,合并时你可以指定一个或者多个关键字段(变量)。当然我们也可以使用cbind()函数,cbind()的使用前提是两数据框的行数相同,并且位置已经匹配完成。
# 按照ID对数据进行合并
total <- merge(dataframeA,dataframeB,by="ID")
# 按照ID和Country对数据框进行合并
total <-merge(dataframeA,dataframeB,by=c("ID","Country"))
2.2 添加行
将数据垂直合并时,我们常常使用rbind()函数,使用该函数时要求两数据框的列数相同,并且变量的顺序已经匹配好了。
# 对数据按行合并
total <- rbind(data frameA, data frameB)
3. 数据分类汇总
在R中对数据进行分类汇总是一件比较容易的事情:
代码语言:javascript复制# 对mtcars数据集的变量cyl和vs进行分类汇总并计算各组数值型变量的均值
attach(mtcars) # 固定数据集
aggdata <-aggregate(mtcars, by=list(cyl,vs),
FUN=mean, na.rm=TRUE) # 分类汇总
print(aggdata) # 输出结果
detach(mtcars) # 解固定数据集
这里aggregate()函数的FUN=参数是用来指定对各组变量进行的操作,是一个函数(R内置函数或自定义函数),na.rm=是用来指定是否移除缺失值的参数。
关于数据的排序、合并与分类汇总就先讲到这里,有兴趣的朋友可以自行深入探索。
至此,R语言入门的所有内容均已介绍完毕,在后面的内容我会相继带大家入门Python编程以及进阶R语言。