Day3-R数据结构(初级)

2024-05-10 15:02:00 浏览数 (2)

基础知识

R赋值是<-,也可以用=代替

R的括号必须是英文的

表格在R语言中称为数据框

元素指的是数字或者字符串,可以区分为标量和向量

数据类型

  • 向量(vector)
  • 矩阵(Matrix)
  • 数组(Array)
  • 数据框(Data frame)
  • 列表 (List)

向量

代码语言:R复制
#赋值
x=c(1,2,3)
x=1:10
x=seq(1,10,by=0.5) #1-10之间每隔0.5取一个数
x=rep(1:3,times=2)


#索引
x[4]
x[-4]#排除法,除了第4个元素之外剩余的元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)]#第1个和第5个元素

x[x==10]
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
输出结果输出结果

数据框

1.数据读取

读取数据常见的read.table函数和read.csv函数

区别在于默认情况下前者读取空格作为分隔符,后者读取逗号作为分隔符;前者不把第一行作为标题行,而后者会读作标题行,如下图所示

?read.table?read.table

所以读取同个文件时的差异出现:

read.table函数和read.csv函数read.table函数和read.csv函数

2.查看行名列名;行数列数

代码语言:R复制
colnames(df)
rownames(df)
dim(df)

3.导出数据框

代码语言:R复制
wrtie.table(df,file = "csv.txt",sep=",",quote=F) #分隔符改为逗号,字符串不加双引号

4. 变量的保存和重新加载

代码语言:R复制
save.image(file="bioinfoplanet.Rdata") #保存当前所有变量
save(a,file="a.Rdata") #保存起其中一个a变量
load("a.Rdata")

5. 数据框的索引

代码语言:R复制
df[x,y]
df[x,]
df[,y]
df[a:b]#第a列到第b列
df[a:b,]#第a行到第b行
df[c(a,b)]#第a列和第b列

6.使用数据框变量

代码语言:txt复制
## Default S3 method:
plot(x, y = NULL, # x和y坐标
     type = "p", # 图的类型
     xlim = NULL, ylim = NULL, # x、y的坐标轴范围
     log = "", # 对"x"、"y"或"xy" 取对数
     main = NULL, # 图的主标题
     sub = NULL, # 副标题
     xlab = NULL, ylab = NULL, # x、y轴标注
     ann = par("ann"), # 逻辑值,是否使用默认的x、y轴标注注释
     axes = TRUE, # 逻辑值,是否显示坐标轴, "xaxt" 或 "yaxt" 选择不显示对应坐标轴
     frame.plot = axes, # 是否显示图边框
     panel.first = NULL, # 表达式,在坐标轴设定后,在绘图之前添加图形,对于添加网格比较有用
     panel.last = NULL, # 同上,相反
     asp = NA, # y/x 的比例
     xgap.axis = NA, # x轴标签显示的距离
     ygap.axis = NA,# y轴标签显示的距离
     bty = 'o' # 图边框类型
     ... # 其它参数,见 par函数
     )

注意绘图时采用的变量是连续变量还是离散变量

问题示例

save(a,file="test.RData")这句代码如果报错object a not found,为什么?怎么解决

0 人点赞