生信星球 day 6

2023-10-26 09:55:03 浏览数 (2)

安装和加载R包

代码语言:txt复制
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
install.packages("dplyr")
library(dplyr)

dplyr五个基础函数

1. mutate()

新增列

2. select()

按列筛选

3. filter()

筛选行

4. arrange()

按某1列或某几列对整个表格进行排序

5. summarise()

汇总

dplyr两个实用技能

1. 管道操作 %>% (cmd/ctr shift M)

2. count统计某列的unique值

dplyr处理关系数据

1.內连inner_join,取交集

代码语言:txt复制
inner_join(test1, test2, by = "x")

2.左连left_join

代码语言:txt复制
left_join(test1, test2, by = 'x')

3.全连full_join

代码语言:txt复制
full_join( test1, test2, by = 'x')

4.半连接:返回能够与y表匹配的x表所有记录semi_join

代码语言:txt复制
semi_join(x = test1, y = test2, by = 'x')

5.反连接:返回无法与y表匹配的x表的所记录anti_join

6.简单连接:bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数

生信星球

0 人点赞