一、R语言的数据类型
- 向量(vector)
- 矩阵(Matrix)
- 数组(Array)
- 数据框(Data frame)
- List
向量是由元素组成的,元素可以是数字或者字符串。
二、向量
1、概念
2、赋值
使用时,一般都会直接给变量定义,也就是“赋值”。
重复对一个变量赋值,后面一个会覆盖前面一个。
代码语言:cpp复制x<- c(1,2,3) #将x定义为由元素1,2,3组成的向量(常用)
x<- 1:10 #从1-10之间所有的整数x
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数
x<- rep(1:3,times=2) #1-3 重复2次x
3、从向量中提取元素
(1)根据元素位置
代码语言:cpp复制x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
(2)根据值
代码语言:cpp复制x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
三、数据框
1、注意先把数据集放在工作目录下
2、读取
代码语言:cpp复制read.table(file = "×××.txt")
a<-read.table(file = "×××.txt")
#上述括号中可添加以下代码
header= T #设置表格列名
sep = "" #设置分列(通常会根据制表符分列,不须设置)
3、查看
代码语言:cpp复制colnames(a) #查看列名
rownames(a) #查看行名,默认值的行名就是行号,1.2.3.4...
dim(a)#几行几列
4、导出
代码语言:cpp复制write.table(a,file = "yu.txt",sep = ",",quote=F)
#分隔符改为逗号,字符串不加双引号(默认格式带由双引号)
5、变量的保存与重新加载
代码语言:cpp复制save.image(file="bioinfoplanet.RData") #保存当前所有变量
save(a,file="test.RData") #保存其中一个变量
load("test.RData") #再次使用RData时的加
6、提取元素
代码语言:cpp复制#注意上面讲数据赋值给a,故提取时变量名为a
- a[x,y]#第x行第y列
- a[x,]#第x行
- a[,y]#第y列
- a[y] #也是第y列
- a[a:b]#第a列到第b列
- a[c(a,b)]#第a列和第b列
- a$列名#也可以提取列(优秀写法,支持Tab自动补全哦,不过只能提取一列)
四、
代码语言:cpp复制save(a,file="test.RData")
报错object a not found
1、未赋值成功
2、由最后开始选中包含赋值a的代码,ctrl enter运行