20231220-简单文件格式读取

2023-12-21 14:22:37 浏览数 (1)

简单复习上一节内容

1认识csv格式

  1. csv格式是以分割符(逗号,空格,制表符t)分开内容的纯文本文件,EXCLE打开csv文件是识别分隔符,把内容装进格子里,R语言打开csv文件,是把纯文本文件装进一个数据框,在R语言中,对数据框进行操作,相应的改动不会被同步到csv文件中
  2. 如果想要对原本的文件进行修改,把修改后的内容重新写为csv文件 write.csv(x,file="x.csv")
  3. 一个文件的本质是由生成它的函数决定,并不是由后缀决定,后缀只是起到提示作用 本节课的函数总结:
  4. read.csv("x.csv")读取csv文件 read.table("x.txt")读取txt文件 write.csv(x,file="x.csv") 导出csv文件 write.table(x,file="x.txt")导出txt文件

2R语言特有的文件格式 R.data

保存的是变量,不是表格文件,支持保存多个文件

save(x,file="x.R.data") 保存Rdata

load("x.Rdata")加载 R.data

3默认参数不适用读取文件所导致的隐形错误

(1)读取txt文件,没有正确识别列名

修改办法 read.table("x.txt",**header=T**)增加默认参数

(2)读取csv文件时,没有正确识别行名,并且更改列名中的不规范符号(例如将其他符号更改为句号)

修改办法 read.csv("x.csv",rownames=1,check.names=F)

(3)数据框不允许重复的行名 如果读取失败需要先去重复,在来设置行名

(4)有时数据中有一些缺失值,文件读取失败

解决办法:read.table("x.txt",header=T,fill=T) 把缺失值用NA来代替,但R语言读取TXT文件时,会把所有的空格识别为一个分隔符,直接把后一列数据识别为前一行数据,然后把后一列数据用NA来补充。这样会导致数据紊乱,所以外面需要多检查自己数据。这个错误可以用一些函数来避免掉

  • read.delim("x.txt") data.table::fread("x.txt",data.table=F)

0 人点赞