须知
- R里的赋值符合是<-
- R中的代码都要带括号,英文括号!!!
- R里的表格叫数据框
- 代码的含义可以用
?read.table
命令查看帮助 - R里显示工作路径使用
getwd
- 数据类型中,向量是由数字或者字符串组成的。数据框是表格。这两种重要。
向量
向量和标量的区分
- 标量是一个元素组成的变量
eg: 一个数字:1/一个字符串:"hello"(字符串必须加双引号)
- 向量是多个元素组成的变量,元素是有序排列的
eg: 数字:A(1,2,3)/字符串:A("hi","hello","ha")
- 在R里常会直接给变量赋值
eg:x<-c(1,2,3) 将x定义为由1,2,3组成的向量。
seq(from,to,length),
该函数的意思是生成一组数字,从from开始,到to结束,每两个数间的间隔是length,如seq(2,10,2),会生成一组数:2 4 6 8 10
从向量中提取元素
- 根据元素的位置提取
x[4]
x中的第四个
x[-4]
x中除了第四个元素以外的所有元素
x[2:4]
x中的第2到4个元素
x[c(1,5)]
x中第1和第5个元素
- 根据值提取
x[x==10]
x中等于10的元素
·xx%in%c(1,2,5)` x中存在于向量c(1,2,5)中的元素
数据框
读取本地数据
- 文件一定要放在工作目录里
read.table(file="huahua.txt",sep="t",header=T)
该命令读取文档,sep命令意为识别行,header命令为把第一行设置为表头
设置行名和列名
colnames(x)
查看表格x列名
colnames(x)[1]<-"bioplanet
给表格x的第一列命名为bioplanet
rownames(x)
查看表格x行名
x<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)
row.names的意思是修改第一列为行名
导出数据框
write.table(X,file = "yu.txt",sep = ",",quote=F)
分隔符t改为逗号,字符串不加双引号(默认格式带双引号)
变量的保存与重新加载
- 这次没处理完的数据想再处理 ,保存为RData格式
save.image(file="bioinfoplanet.RData")
保存当前所有变量save(X,file="test.RData")
保存其中一个变量load("test.RData")
再次使用RData时的加载命令
提取元素
x[x,y]
第x行第y列
x[x,]
第x行
x[,y]``x[y]
第y行
x$列名
提取某列
x[a:b]
提取a到b行
x[c(a,b)]
第a列和第b列