R语言处理数据
在R中很多内置函数,用于数据框的基本操作,比如转换、分组、排序、拼接等,常见的函数有rbind(),cbind(),dplyr(),tidyr(),reshape2,tidyverse(),base()等,其中,base()是R语言内置包,无需安装。数据处理是ggplot2绘图的基础,同时也是R语言中花费时间较多的工作之一,提高数据处理的效率能够很快的得到可靠美观的图片。
01
表格拼接
#构建数据框
#给数据框df18添加行或纵向添加表格
>dr1<-rbind(df18,df20)
#给数据框df18添加列或横向添加表格
>dc1<-cbind(df18,df19)
运行结果如下:
02
表格融合
有时候,表格之间没有很好的保持一致,仅仅依靠rbind() 和cbind()函数直接拼接无法实现,当两个表之间有共同的列时,能够进行表格的融合,可以采用merge()函数。merge()函数,合并数据框中的x和y的列名的向量,如果有些数据框y列名中没有数据,也会默认为是匹配x列名的数据。
#构建数据框
>dm1<-merge(df1,df2,by="x",all=TRUE)#by是合并x和y共享列名中的向量,默认为两个表之间有共享的键列。如果y没有键列,则默认为x的键。all=TRUE是x=TRUE,y=TRUE的简写
>dm2<-merge(df1,df3,by.x="x",by.y="f")#by.x与by.y是分别指左边数据框的匹配列,右边数据框的匹配列
>dm3<-merge(df1,df4,by=c("x","y"),all=TRUE)
03
表格分组
#构建数据
#df5的变量名称country,GDP2019,GDP2018储存的向量应为数值,不能含有中文,否则melt运行失败。
#df_m按照year分组
#同时按照year和country两个变量分组操作
#只有根据country分组求year和value的均值
04
表格排序
#将df_m数据框进行排序