day3

2023-09-07 00:18:26 浏览数 (4)

DAY3

基础知识

在Console控制台输入命令,相当于Linux的命令行

R的代码都带括号

getwd()显示工作路径

向量由元素组成

元素包括数字和字符串(chr)

在R语言中,表格=数据框

?read.table——查看命令的帮助文档

数据类型:向量(vector);数据框(Data Frame);矩阵(Matrix);数组(Array);List。

向量

标量和向量的区分

元素:指数字或字符串

字符串需要加引号,如“huahua”

标量:一个元素组成的变量

向量:多个元素组成的变量;一个向量是一排有序排列的元素。

如c(1,2,3);c(“doudou”,“huahua”)

赋值

x<-c(1,2,3) 将x元素定义为由元素1,2,3组成的向量

x<-1:10 将x元素定义为从1到10之间的所有整数

x<-seq(1,10,by=0.5) 将x元素定义为1到10之间每隔0.5取一个数

x-rep(1:3,times=2) 将x元素定义为1到3,重复2次

赋值以最后一次为准

从向量中提取元素

根据元素位置(x是刚刚赋值的变量名)

x[4] 第4个元素

x[-4] 除第4个以外的剩余元素

x[2:4] 第2到第4个元素

x[-(2:4)] 除第2到第4个元素

x[c(1,5)] 第1个和第5个元素

根据值

x[x==10] 等于10的元素

x[x<0]

x[x%in%c(1,2,5)] 存在于向量c(1,2,5)中的元素

数据框

读取本地数据

read.table函数——read.table("file",header= ,sep="" )

sep表示分隔符,

csv文件——sep=“,”(逗号)

txt文件——“t”(制表符)

其他文件——“ ”(空格)

header:逻辑值

header=TRUE,则假定文件有标题行,第一行是每列的名称

header=FALSE,则不是上述情况

file:导入R中的数据的文件的路径(要放在工作目录下!(否则要加路径)

设置行名和列名

x<-read.table("doudou.txt",header=T,sep=",")后,x被赋值为了表格

colnames(x)#查看列名

rownames(x)#查看行名

x<-read.csv(file="doudou.txt",sep=",",header=T,row.names=1)#row.names的意思是修改第一列为行名

数据框的导出

write.table函数——write.table(x, file="", sep=","quote=F)

quote:一个逻辑值或数字向量。

quote=TRUE,任何字符或元素将用双引号包围

quote=FALSE,没有引号

变量的保存和重新加载

save.image(file="bioinfoplanet.RData")——保存当前所有变量

save(X,file=“test.RData")——保存其中一个变量

load("test.RData")——再次使用的加载命令

提取元素

X[x,y]——第x行,第x列

X[x, ]——第x行

X[, y]——第y列

X[y ]——第y列

X[a:b]——第a列到第b列

X[c(a,b)]——第a列和第b列

X$列名

直接使用数据框中的变量

0 人点赞