安装和加载R包
代码语言:txt复制options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
dplyr五个基础函数
1. mutate()
新增列
2. select()
按列筛选
3. filter()
筛选行
4. arrange()
按某1列或某几列对整个表格进行排序
5. summarise()
汇总
dplyr两个实用技能
1. 管道操作 %>% (cmd/ctr shift M)
2. count统计某列的unique值
dplyr处理关系数据
1.內连inner_join,取交集
代码语言:txt复制inner_join(test1, test2, by = "x")
2.左连left_join
代码语言:txt复制left_join(test1, test2, by = 'x')
3.全连full_join
代码语言:txt复制full_join( test1, test2, by = 'x')
4.半连接:返回能够与y表匹配的x表所有记录semi_join
代码语言:txt复制semi_join(x = test1, y = test2, by = 'x')
5.反连接:返回无法与y表匹配的x表的所记录anti_join
6.简单连接:bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
生信星球