R语言入门

2023-07-04 00:36:23 浏览数 (1)

1.1

#初级统计

max(x) #最大值

min(x) #最小值

mean(x) #均值

median(x) #中位数

var(x) #方差

sd(x) #标准差

sum(x) #总和

length(x) #长度

unique(x) #去重复

duplicated(x) #对应元素是否重复

table(x) #重复值统计

sort(x)

#e.g

x <- c(1,3,5,1);x 1 1 3 5 1 sort(x)#默认升序排列 1 1 1 3 5 sort(x,decreasing = F) 1 1 1 3 5 sort(x,decreasing = T)#降序 = T 1 5 3 1 1

####paste与paste0

paste(rep("student",time = 7),seq(from = 2,to = 15,by = 2)) #1 "student 2" "student 4" "student 6" "student 8" "student 10" #"student12" "student 14" paste0(rep("student",time = 7),seq(from = 2,to = 15,by = 2)) #1 "student2" "student4" "student6" "student8" #5 "student10" "student12" "student14"

#paste0就是默认没有间隔的paste,paste0与paste(,sep = ""),paste(,sep="")可以自定义需要组合的字符间的间隔符号

#在使用R语言处理了向量是,会发生自动补齐

x <- c (1,2,3);y <- c(1,2,3,4,5) x == y T T T F F

#上述代码中发生循环补齐,将y中的4,5从头与x对比

#所以我们可以使用循环补齐逻辑来简化代码

a <- paste0(c("A","B","C"),1:5) a "A1" "B2" "C3" "A4" "B5"

###读取工作目录下文件夹中的文档需要指定文件夹名字

read.table("../")#读取当前工作目录上级目录中的文档 read.table("y/xxx")#读取工作目录中y文件夹下的xxx文档

##逻辑的区别

x <- seq(1,7,by = 1) y <- seq(1,9,by = 2) x;y 1 2 3 4 5 6 7

1 3 5 7 9

x==y TRUE FALSE FALSE FALSE FALSE FALSE

FALSE

x%in%y TRUE FALSE TRUE FALSE TRUE FALSE

TRUE

##原因:x == y是查询x的对应位置是否与y相等;x %in% 是x的每个元素在y中是否存在

#使用factor时默认对照在前,分组在后。如果有特殊需要,在levels = 中调整顺序

0 人点赞