Day5-i 生信星球学习-数据结构
新手笔记:
(1)R的规范赋值符号是<-
,也可以用=
代替
(2)在Console 控制台输入命令,相当于Linux的命令行
(3)R的代码都是带括号的,括号必须是英文。
(4)显示工作路径:getwd()
(5)向量是由元素组成的,元素可以是数字或者字符串。
(6)表格在R语言中称为数据框
(7)别只复制代码,要理解其中的命令、函数的意思。函数或者命令不会用时,除了百度/谷歌搜索以外,用这个命令查看帮助:?read.table
,调出对应的帮助文档,翻到example部分研究一下。
(8)数据类型
向量(vector) 矩阵(Matrix) 数组(Array) 数据框(Data frame)List
向量
标量和向量的区分
元素:指的是数字或者字符串(用chr表示)等,根据它可以区分两个词:
标量:一个元素组成的变量
向量:多个元素组成的变量
代码语言:english复制x<- c(1,2,3) #将x定义为由元素1,2,3组成的向量。
x<- 1:10 #从1-10之间所有的整数
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数
x<- rep(1:3,times=2) #1-3 重复2次
x
从向量中提取元素
根据元素位置
代码语言:english复制#这里的x是签名赋值的变量名,根据需要进行修改
x[4] #x第4个元素
x[-4]#除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
根据值
代码语言:english复制x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
数据框
读取本地数据
代码语言:english复制read.table(file = "mon.txt",sep = "t",header = T)
a<-read.table(file = "mon.txt",sep = "t",header = T)
sep
是函数的形式参数,多数情况下, seq 参数用来指定字符的分隔符号,read.txt函数默认参数sep='t';
csv文件,sep = ","
tsv 文件 sep = "t"
header=TRUE
代表读入数据时将第一行作为列名
查看行名和列名、行数和列数
colnames(a)
#查看列名
rownames(a)
#查看行名,默认值的行名就是行号,1.2.3.4...
dim(a)
#几行几列
数据框的导出
代码语言:english复制write.table(a,file = "yu.txt",sep = ",",quote=F)#分隔符改为逗号,字符串不加双引号(默认格式带由双引号)
变量的保存与重新加载
代码语言:english复制#这次没有处理完的数据下次想接着--保存和重新加载。保存的格式是RData
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(a,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令
提取元素
代码语言:english复制- a[x,y]#第x行第y列
- a[x,]#第x行
- a[,y]#第y列
- a[y] #也是第y列
- a[a:b]#第a列到第b列
- a[c(a,b)]#第a列和第b列
- a$列名#提取列(Tab自动补全,只能提取一列)
直接使用数据框中的变量
代码语言:english复制plot(iris$Sepal.Length,iris$Sepal.Width)
iris是R语言的内置数据,plot作图
XXX.R文件即为脚本文件