DAY3
基础知识
在Console控制台输入命令,相当于Linux的命令行
R的代码都带括号
getwd()显示工作路径
向量由元素组成
元素包括数字和字符串(chr)
在R语言中,表格=数据框
?read.table——查看命令的帮助文档
数据类型:向量(vector);数据框(Data Frame);矩阵(Matrix);数组(Array);List。
向量
标量和向量的区分
元素:指数字或字符串
字符串需要加引号,如“huahua”
标量:一个元素组成的变量
向量:多个元素组成的变量;一个向量是一排有序排列的元素。
如c(1,2,3);c(“doudou”,“huahua”)
赋值
x<-c(1,2,3) 将x元素定义为由元素1,2,3组成的向量
x<-1:10 将x元素定义为从1到10之间的所有整数
x<-seq(1,10,by=0.5) 将x元素定义为1到10之间每隔0.5取一个数
x-rep(1:3,times=2) 将x元素定义为1到3,重复2次
赋值以最后一次为准
从向量中提取元素
根据元素位置(x是刚刚赋值的变量名)
x[4] 第4个元素
x[-4] 除第4个以外的剩余元素
x[2:4] 第2到第4个元素
x[-(2:4)] 除第2到第4个元素
x[c(1,5)] 第1个和第5个元素
根据值
x[x==10] 等于10的元素
x[x<0]
x[x%in%c(1,2,5)] 存在于向量c(1,2,5)中的元素
数据框
读取本地数据
read.table函数——read.table("file",header= ,sep="" )
sep表示分隔符,
csv文件——sep=“,”(逗号)
txt文件——“t”(制表符)
其他文件——“ ”(空格)
header:逻辑值
header=TRUE,则假定文件有标题行,第一行是每列的名称
header=FALSE,则不是上述情况
file:导入R中的数据的文件的路径(要放在工作目录下!(否则要加路径)
设置行名和列名
x<-read.table("doudou.txt",header=T,sep=",")后,x被赋值为了表格
colnames(x)#查看列名
rownames(x)#查看行名
x<-read.csv(file="doudou.txt",sep=",",header=T,row.names=1)#row.names的意思是修改第一列为行名
数据框的导出
write.table函数——write.table(x, file="", sep=","quote=F)
quote:一个逻辑值或数字向量。
quote=TRUE,任何字符或元素将用双引号包围
quote=FALSE,没有引号
变量的保存和重新加载
save.image(file="bioinfoplanet.RData")——保存当前所有变量
save(X,file=“test.RData")——保存其中一个变量
load("test.RData")——再次使用的加载命令
提取元素
X[x,y]——第x行,第x列
X[x, ]——第x行
X[, y]——第y列
X[y ]——第y列
X[a:b]——第a列到第b列
X[c(a,b)]——第a列和第b列
X$列名
直接使用数据框中的变量