1.1
#初级统计
max(x) #最大值
min(x) #最小值
mean(x) #均值
median(x) #中位数
var(x) #方差
sd(x) #标准差
sum(x) #总和
length(x) #长度
unique(x) #去重复
duplicated(x) #对应元素是否重复
table(x) #重复值统计
sort(x)
#e.g
x <- c(1,3,5,1);x 1 1 3 5 1 sort(x)#默认升序排列 1 1 1 3 5 sort(x,decreasing = F) 1 1 1 3 5 sort(x,decreasing = T)#降序 = T 1 5 3 1 1
####paste与paste0
paste(rep("student",time = 7),seq(from = 2,to = 15,by = 2)) #1 "student 2" "student 4" "student 6" "student 8" "student 10" #"student12" "student 14" paste0(rep("student",time = 7),seq(from = 2,to = 15,by = 2)) #1 "student2" "student4" "student6" "student8" #5 "student10" "student12" "student14"
#paste0就是默认没有间隔的paste,paste0与paste(,sep = ""),paste(,sep="")可以自定义需要组合的字符间的间隔符号
#在使用R语言处理了向量是,会发生自动补齐
x <- c (1,2,3);y <- c(1,2,3,4,5) x == y T T T F F
#上述代码中发生循环补齐,将y中的4,5从头与x对比
#所以我们可以使用循环补齐逻辑来简化代码
a <- paste0(c("A","B","C"),1:5) a "A1" "B2" "C3" "A4" "B5"
###读取工作目录下文件夹中的文档需要指定文件夹名字
read.table("../")#读取当前工作目录上级目录中的文档 read.table("y/xxx")#读取工作目录中y文件夹下的xxx文档
##逻辑的区别
x <- seq(1,7,by = 1) y <- seq(1,9,by = 2) x;y 1 2 3 4 5 6 7
1 3 5 7 9
x==y TRUE FALSE FALSE FALSE FALSE FALSE
FALSE
x%in%y TRUE FALSE TRUE FALSE TRUE FALSE
TRUE
##原因:x == y是查询x的对应位置是否与y相等;x %in% 是x的每个元素在y中是否存在
#使用factor时默认对照在前,分组在后。如果有特殊需要,在levels = 中调整顺序