基础知识 | R语言数据分析之表格处理

2020-08-06 14:59:21 浏览数 (1)

R语言处理数据

在R中很多内置函数,用于数据框的基本操作,比如转换、分组、排序、拼接等,常见的函数有rbind(),cbind(),dplyr(),tidyr(),reshape2,tidyverse(),base()等,其中,base()是R语言内置包,无需安装。数据处理是ggplot2绘图的基础,同时也是R语言中花费时间较多的工作之一,提高数据处理的效率能够很快的得到可靠美观的图片。

01

表格拼接

#构建数据框

#给数据框df18添加行或纵向添加表格

>dr1<-rbind(df18,df20)

#给数据框df18添加列或横向添加表格

>dc1<-cbind(df18,df19)

运行结果如下:

02

表格融合

有时候,表格之间没有很好的保持一致,仅仅依靠rbind() 和cbind()函数直接拼接无法实现,当两个表之间有共同的列时,能够进行表格的融合,可以采用merge()函数。merge()函数,合并数据框中的x和y的列名的向量,如果有些数据框y列名中没有数据,也会默认为是匹配x列名的数据。

#构建数据框

>dm1<-merge(df1,df2,by="x",all=TRUE)#by是合并x和y共享列名中的向量,默认为两个表之间有共享的键列。如果y没有键列,则默认为x的键。all=TRUE是x=TRUE,y=TRUE的简写

>dm2<-merge(df1,df3,by.x="x",by.y="f")#by.x与by.y是分别指左边数据框的匹配列,右边数据框的匹配列

>dm3<-merge(df1,df4,by=c("x","y"),all=TRUE)

03

表格分组

#构建数据

#df5的变量名称country,GDP2019,GDP2018储存的向量应为数值,不能含有中文,否则melt运行失败。

#df_m按照year分组

#同时按照year和country两个变量分组操作

#只有根据country分组求year和value的均值

04

表格排序

#将df_m数据框进行排序

0 人点赞