R语言-基础+向量

2023-02-03 17:33:09 浏览数 (3)

一、r语言基础

>生信技能树>生信技能树

二、数据类型

数据类型:数值型(numeric),字符型(character,必须加" "or' '),逻辑型(TRUE FALSE NA存在但未知)

null 不存在

判断数据类型的函数class()

unexpected: 代码错误的关键词

1)逻辑型数据

比较运算的结果是逻辑值

< <= >= == !=

逻辑运算:与& 或| 非!

2)数据类型的判断与转换

is族函数判断

>生信技能树>生信技能树

as族函数实现数据类型转换

>生信技能树>生信技能树

3)数据类型转换的优先顺序

字符型 > 数值型 > 逻辑型

三、数据结构

数据框约等于表格 每一列只能有一种数据类型

数据框单独一列是向量,视为一个整体

向量里只有一种数据类型,但是可以有重复值

向量<数据框<矩阵<列表

1.向量的生成

代码语言:javascript复制
#(1)用 c() 结合到一起
c(2,5,6,2,9) 
c("a","f","md","b")
#(2)连续的数字用冒号“:” 
1:5
#(3)有重复的用rep(),有规律的序列用seq(),随机数用rnorm()
rep("x",times=3)  
rep('a','b','c',each = 3)
seq(from=3,to=21,by=3)
rnorm(n=3)
#(4)通过组合,产生更为复杂的向量。
paste0(rep("x",times=3),1:3)

补充:paste和paste0的区别,paste默认sep=空格,paste无sep

代码语言:javascript复制
paste(c("a", "b","c"),1:3)##默认空格符
## [1] "a 1" "b 2" "c 3"
paste(c("a", "b","c"),1:3,sep=" ")
## [1] "a 1" "b 2" "c 3"
paste(c("a", "b","c"),1:3,sep="")
## [1] "a1" "b2" "c3"
#如果两个向量长度不同
paste(c("a", "b","c"),1:5)##超出范围后继续从前向后连接
## [1] "a 1" "b 2" "c 3" "a 4" "b 5"
#paste0的表现
paste0(c("a", "b","c"),1:3)#默认元素连接为sep=""
## [1] "a1" "b2" "c3"

https://www.jianshu.com/p/44e3de9b7a81

2.对单个向量进行的操作

代码语言:javascript复制
#(1)赋值给一个变量名
x = c(1,3,5,1) #随意的写法
x <- c(1,3,5,1) #规范的赋值符号 Alt 减号

#赋值 输出一起实现
x <- c(1,3,5,1);x  #写在一行必须用';'
(x <- c(1,3,5,1))  

>生信技能树>生信技能树
代码语言:javascript复制
#(2)简单数学计算
x 1
log(x)
sqrt(x)

#(3)根据某条件进行判断,生成逻辑型向量
x>3
x==3
代码语言:javascript复制
#(4)初级统计
max(x) #最大值
min(x) #最小值
mean(x) #均值
median(x) #中位数
var(x) #方差
sd(x) #标准差
sum(x) #总和

length(x) #长度
unique(x) #去重复,从左往右第一次出现不叫重复,此后出现叫重复
duplicated(x) #对应元素是否重复,从左往右第一次出现不叫重复,此后出现叫重复
!duplicated(x) #无重复TRUE,重复FALSE
table(x) #重复值统计 
sort(x)
sort(x,decreasing = F) #F为默认值
sort(x,decreasing = T)

3.对两个向量的操作

代码语言:javascript复制
x = c(1,3,5,1)
y = c(3,2,5,6)
#(1)比较运算,生成等长的逻辑向量
x == y 
y == x
#(2)数学计算
x   y
#(3)连接
paste(x,y,sep=",")

#当两个向量长度不一致
x = c(1,3,5,6,2)
y = c(3,2,5)
x == y #最后结果和最长的那个有关;循环补齐
#利用循环补齐简化代码
paste0(rep("x",3),1:3)
paste0("x",1:3)

#(4)交集、并集、差集
intersect(x,y) #交集
union(x,y) #并集
setdiff(x,y) #仅在x中有的结果
setdiff(y,x) #仅在y中有的结果

重点:%in%

代码语言:javascript复制
x %in% y #x的每个元素在y中存在吗
y %in% x #y的每个元素在x中存在吗

>生信技能树>生信技能树

4.向量筛选(取子集) []: 将TRUE对应的值挑选出来,FALSE丢弃

代码语言:javascript复制
x <- 8:12
#根据逻辑值取子集
x[x==10]
x[x<12]
x[x %in% c(9,13)]
#根据位置取子集
x[4]
x[2:4]
x[c(1,5)]
x[-4]
x[-(2:4)] #-表示删掉元素

- 表示删掉元素,与python区分

总结:

按照逻辑值:中括号里是与x等长且一一对应的逻辑值向量

按照位置:中括号里是由x的下标组成的向量

按条件挑选某个向量中两种类型的子集

x为向量 y为条件

x[x%in%y]

5.修改向量中的某个/某些元素:取子集 赋值

代码语言:javascript复制
#改一个元素
x[4] <- 40
x
#改多个元素
x[c(1,5)] <- c(80,20)
x

变量的修改需要赋值操作

6.简单向量作图

代码语言:javascript复制
k1 = rnorm(12);k1
k2 = rep(c("a","b","c","d"),each = 3);k2 #each和times不同,
plot(k1)
boxplot(k1~k2)  #k1纵坐标,k2横坐标

补充练习题

代码语言:javascript复制
#生成10个随机数: rnorm(n=10,mean=0,sd=18),用向量取子集的方法,取出其中小于-2的值
rnorm(n=10,mean=0,sd=18)
z=rnorm(n=10,mean=0,sd=18)
z[z<(-2)] #不打括号<-为赋值,给出的结果与期望不符
z[z< -2] #空格隔开

运行顺序:有嵌套先里后外,无嵌套从左到右

1 人点赞