简单复习上一节内容
1认识csv格式
- csv格式是以分割符(逗号,空格,制表符t)分开内容的纯文本文件,EXCLE打开csv文件是识别分隔符,把内容装进格子里,R语言打开csv文件,是把纯文本文件装进一个数据框,在R语言中,对数据框进行操作,相应的改动不会被同步到csv文件中
- 如果想要对原本的文件进行修改,把修改后的内容重新写为csv文件 write.csv(x,file="x.csv")
- 一个文件的本质是由生成它的函数决定,并不是由后缀决定,后缀只是起到提示作用 本节课的函数总结:
read.csv("x.csv")
读取csv文件read.table("x.txt")
读取txt文件write.csv(x,file="x.csv")
导出csv文件write.table(x,file="x.txt")
导出txt文件
2R语言特有的文件格式 R.data
保存的是变量,不是表格文件,支持保存多个文件
save(x,file="x.R.data") 保存Rdata
load("x.Rdata")加载 R.data
3默认参数不适用读取文件所导致的隐形错误
(1)读取txt文件,没有正确识别列名
修改办法 read.table("x.txt",**header=T**)
增加默认参数
(2)读取csv文件时,没有正确识别行名,并且更改列名中的不规范符号(例如将其他符号更改为句号)
修改办法 read.csv("x.csv",rownames=1,check.names=F)
(3)数据框不允许重复的行名 如果读取失败需要先去重复,在来设置行名
(4)有时数据中有一些缺失值,文件读取失败
解决办法:read.table("x.txt",header=T,fill=T)
把缺失值用NA来代替,但R语言读取TXT文件时,会把所有的空格识别为一个分隔符,直接把后一列数据识别为前一行数据,然后把后一列数据用NA来补充。这样会导致数据紊乱,所以外面需要多检查自己数据。这个错误可以用一些函数来避免掉
read.delim("x.txt")
data.table::fread("x.txt",data.table=F)