Day6-学习R包
参考文献:生信星球
今天第六天,我爱学习,坚持学习感觉真好(暗示)
1.新的知识/概念:
R包(R package)
R包是什么?
R程序包是多个函数的集合,具有详细的说明和例子。
包含R函数,数据,帮助文档,描述文件等。
按照一定的规则,存放到网站。
为什么要安装R包?
特定的分析功能,需要用相应的程序包实现。
例如:作图包ggplot2
使用到哪个包就去安装和加载,知道要用的函数以及简单使用规律,查看帮助文档入门,统计学学到一定的程度,不要默认值,去指定值,这个过程可以调试。
目的不是学会某个具体的R包,而是找所有R包使用的规律。
R包都在哪里
通常来源三个网站
来源:知乎 ahsu
安装加载三部曲
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
dplyr五个基础函数
1.mutate(),新增列
mutate(test, new = Sepal.Length * Sepal.Width)
2.select(),按列筛选
(1)按列号筛选
select(test,1)
(2)按列名筛选
select(test, Petal.Length, Petal.Width)
vars <- c("Petal.Length", "Petal.Width")
select(test, one_of(vars))
3.filter()筛选行
filter(test, Species == "setosa")
4.arrange(),按某1列或某几列对整个表格进行排序
arrange(test, Sepal.Length)#默认从小到大排序
arrange(test, desc(Sepal.Length))#用desc从大到小
5.summarise():汇总
对数据进行汇总操作,结合group_by使用实用性强
summarise(test, mean(Sepal.Length), sd(Sepal.Length))
来源:csdn 铭记yu心