R包学习 dplyr举例
安装加载
设置镜像
R包网站在国外,所以在国内安装加载需要设置镜像。(此步省略)
options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/")) options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
安装
R包在CRAN网站
install.packages()
R包在Biocductor
BioManager::install()
加载
library()
dplyr 的基本函数mutate() 新增列select() 按列筛选filter() 筛选行arrange() 按列排序arrange (test, Sepal.Length)
默认从小到大排序
arrange (test, desc(Sepal.Length))
从大到小排序
summarise() 汇总
实用技能
管道操作 %inin% (快捷键 cmd/ctrl shift M)
count 统计某列unique值
dplyr 处理关系数据 (连接两个表格)
innerr_join 取交集
left_join
full_join
semi_join 半连接,返回与y表匹配的所有记录
anti_join, 返回无法与y表匹配的所有记录
简单合并,bind_rows() 需要两个表格列数相同,bind_cols()需要两个表格行数相同
写在最后,要学会查看函数的帮助文档。 ? 函数名字
即可。还要学会搜R包介绍。