Day5-i 生信星球学习-数据结构

2024-02-23 14:54:34 浏览数 (1)

Day5-i 生信星球学习-数据结构

新手笔记:

(1)R的规范赋值符号是<-,也可以用=代替

(2)在Console 控制台输入命令,相当于Linux的命令行

(3)R的代码都是带括号的,括号必须是英文。

(4)显示工作路径:getwd()

(5)向量是由元素组成的,元素可以是数字或者字符串。

(6)表格在R语言中称为数据框

(7)别只复制代码,要理解其中的命令、函数的意思。函数或者命令不会用时,除了百度/谷歌搜索以外,用这个命令查看帮助:?read.table,调出对应的帮助文档,翻到example部分研究一下。

(8)数据类型

向量(vector) 矩阵(Matrix) 数组(Array) 数据框(Data frame)List

向量

标量和向量的区分

元素:指的是数字或者字符串(用chr表示)等,根据它可以区分两个词

标量:一个元素组成的变量

向量:多个元素组成的变量

代码语言:english复制
x<- c(1,2,3) #将x定义为由元素1,2,3组成的向量。
x<- 1:10 #从1-10之间所有的整数
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数
x<- rep(1:3,times=2) #1-3 重复2次
x

从向量中提取元素

根据元素位置

代码语言:english复制
#这里的x是签名赋值的变量名,根据需要进行修改
x[4] #x第4个元素
x[-4]#除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素

根据值

代码语言:english复制
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素

数据框

读取本地数据

代码语言:english复制
read.table(file = "mon.txt",sep = "t",header = T)
a<-read.table(file = "mon.txt",sep = "t",header = T)

sep是函数的形式参数,多数情况下, seq 参数用来指定字符的分隔符号,read.txt函数默认参数sep='t';

csv文件,sep = ","

tsv 文件 sep = "t"

header=TRUE代表读入数据时将第一行作为列名

查看行名和列名、行数和列数

colnames(a)#查看列名

rownames(a)#查看行名,默认值的行名就是行号,1.2.3.4...

dim(a)#几行几列

数据框的导出

代码语言:english复制
write.table(a,file = "yu.txt",sep = ",",quote=F)#分隔符改为逗号,字符串不加双引号(默认格式带由双引号) 

变量的保存与重新加载

代码语言:english复制
#这次没有处理完的数据下次想接着--保存和重新加载。保存的格式是RData
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(a,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令

提取元素

代码语言:english复制
- a[x,y]#第x行第y列
- a[x,]#第x行
- a[,y]#第y列
- a[y] #也是第y列
- a[a:b]#第a列到第b列
- a[c(a,b)]#第a列和第b列
- a$列名#提取列(Tab自动补全,只能提取一列)

直接使用数据框中的变量

代码语言:english复制
plot(iris$Sepal.Length,iris$Sepal.Width)

iris是R语言的内置数据,plot作图

XXX.R文件即为脚本文件

0 人点赞