基础知识
R赋值是<-,也可以用=代替
R的括号必须是英文的
表格在R语言中称为数据框
元素指的是数字或者字符串,可以区分为标量和向量
数据类型
- 向量(vector)
- 矩阵(Matrix)
- 数组(Array)
- 数据框(Data frame)
- 列表 (List)
向量
代码语言:R复制#赋值
x=c(1,2,3)
x=1:10
x=seq(1,10,by=0.5) #1-10之间每隔0.5取一个数
x=rep(1:3,times=2)
#索引
x[4]
x[-4]#排除法,除了第4个元素之外剩余的元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)]#第1个和第5个元素
x[x==10]
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
数据框
1.数据读取
读取数据常见的read.table函数和read.csv函数
区别在于默认情况下前者读取空格作为分隔符,后者读取逗号作为分隔符;前者不把第一行作为标题行,而后者会读作标题行,如下图所示
所以读取同个文件时的差异出现:
2.查看行名列名;行数列数
代码语言:R复制colnames(df)
rownames(df)
dim(df)
3.导出数据框
代码语言:R复制wrtie.table(df,file = "csv.txt",sep=",",quote=F) #分隔符改为逗号,字符串不加双引号
4. 变量的保存和重新加载
代码语言:R复制save.image(file="bioinfoplanet.Rdata") #保存当前所有变量
save(a,file="a.Rdata") #保存起其中一个a变量
load("a.Rdata")
5. 数据框的索引
代码语言:R复制df[x,y]
df[x,]
df[,y]
df[a:b]#第a列到第b列
df[a:b,]#第a行到第b行
df[c(a,b)]#第a列和第b列
6.使用数据框变量
代码语言:txt复制## Default S3 method:
plot(x, y = NULL, # x和y坐标
type = "p", # 图的类型
xlim = NULL, ylim = NULL, # x、y的坐标轴范围
log = "", # 对"x"、"y"或"xy" 取对数
main = NULL, # 图的主标题
sub = NULL, # 副标题
xlab = NULL, ylab = NULL, # x、y轴标注
ann = par("ann"), # 逻辑值,是否使用默认的x、y轴标注注释
axes = TRUE, # 逻辑值,是否显示坐标轴, "xaxt" 或 "yaxt" 选择不显示对应坐标轴
frame.plot = axes, # 是否显示图边框
panel.first = NULL, # 表达式,在坐标轴设定后,在绘图之前添加图形,对于添加网格比较有用
panel.last = NULL, # 同上,相反
asp = NA, # y/x 的比例
xgap.axis = NA, # x轴标签显示的距离
ygap.axis = NA,# y轴标签显示的距离
bty = 'o' # 图边框类型
... # 其它参数,见 par函数
)
注意绘图时采用的变量是连续变量还是离散变量
问题示例
save(a,file="test.RData")这句代码如果报错object a not found,为什么?怎么解决