Day6-i 生信星球学习
安装&加载R包&使用
镜像设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
中科大源
安装
install.packages(“R包名称”)
BiocManager::install(“R包名称”)
加载
library()和require()
eg: dplyr
install.packages("dplyr")
library(dplyr)
test <- iris[c(1:2,51:52,101:102),]
mutate(test, new = Sepal.Length * Sepal.Width)
##新增列
select(test,1)
按列号筛选
select(test, Petal.Length, Petal.Width)
按列名筛选
filter(test, Species == "setosa")
filter(test, Species == "setosa"&Sepal.Length > 5
)
筛选行
按某1列或某几列对整个表格进行排序
arrange(test, Sepal.Length)
从小到大
arrange(test, desc(Sepal.Length))
从大到小
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
平均值和标准差计算
管道操作 %>% (cmd/ctr shift M)
count统计某列的unique值:count(test,Species)
內连inner_join,取交集:inner_join(test1, test2, by = "x")
左连left_join:left_join(test1, test2, by = 'x')
全连full_join:full_join( test1, test2, by = 'x')
简单合并:bind_rows()
两个表格列数相同,bind_cols()
两个数据框有相同的行数
练习 理解,熟能生巧!