生信入门day5分野—数据结构

2023-09-22 21:25:14 浏览数 (1)

须知

  • R里的赋值符合是<-
  • R中的代码都要带括号,英文括号!!!
  • R里的表格叫数据框
  • 代码的含义可以用?read.table命令查看帮助
  • R里显示工作路径使用getwd
  • 数据类型中,向量是由数字或者字符串组成的。数据框是表格。这两种重要。

向量

向量和标量的区分

  • 标量是一个元素组成的变量

eg: 一个数字:1/一个字符串:"hello"(字符串必须加双引号)

  • 向量是多个元素组成的变量,元素是有序排列的

eg: 数字:A(1,2,3)/字符串:A("hi","hello","ha")

  • 在R里常会直接给变量赋值

eg:x<-c(1,2,3) 将x定义为由1,2,3组成的向量。

seq(from,to,length),

该函数的意思是生成一组数字,从from开始,到to结束,每两个数间的间隔是length,如seq(2,10,2),会生成一组数:2 4 6 8 10

从向量中提取元素

  • 根据元素的位置提取

x[4]x中的第四个

x[-4]x中除了第四个元素以外的所有元素

x[2:4]x中的第2到4个元素

x[c(1,5)]x中第1和第5个元素

  • 根据值提取

x[x==10]x中等于10的元素

·xx%in%c(1,2,5)` x中存在于向量c(1,2,5)中的元素

数据框

读取本地数据

  • 文件一定要放在工作目录里

read.table(file="huahua.txt",sep="t",header=T)该命令读取文档,sep命令意为识别行,header命令为把第一行设置为表头

设置行名和列名

colnames(x)查看表格x列名

colnames(x)[1]<-"bioplanet给表格x的第一列命名为bioplanet

rownames(x)查看表格x行名

x<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)row.names的意思是修改第一列为行名

导出数据框

write.table(X,file = "yu.txt",sep = ",",quote=F)

分隔符t改为逗号,字符串不加双引号(默认格式带双引号)

变量的保存与重新加载

  • 这次没处理完的数据想再处理 ,保存为RData格式
  • save.image(file="bioinfoplanet.RData")保存当前所有变量
  • save(X,file="test.RData")保存其中一个变量
  • load("test.RData")再次使用RData时的加载命令

提取元素

x[x,y]第x行第y列

x[x,]第x行

x[,y]``x[y]第y行

x$列名提取某列

x[a:b]提取a到b行

x[c(a,b)]第a列和第b列

0 人点赞