错误一:‘gbk’ codec can’t decode byte 0x98 in position 2: illegal multibyte sequence
报错代码:
代码语言:javascript复制data_path=r"G:test.csv"
f = open(data_path)
res = pd.read_csv(f)
f.close()
错误解读: Unicode的解码Decode错误(Error),以gbk编码的方式去解码(该字符串变成Unicode),但是此处通过gbk的方式,却无法解码(can’t decode )。“illegal multibyte sequence”意思是非法的多字节序列,即没法(解码)了。 此种错误,可能是要处理的字符串本身不是gbk编码,但是却以gbk编码去解码 。比如,字符串本身是utf-8的,但是却用gbk去解码utf-8的字符串,所以结果不用说,则必然出错。
.解决办法:rb读取
data_path=r"G:test.csv"
f = open(data_path,'rb')
res = pd.read_csv(f)
f.close()
错误二:Initializing from file failed
报错代码:pd.read_csv(r"G:文件名.csv")
错误解读:文件初始化失败;即:文件路径或者文件名中存在中文,pd.read_csv()需要通过open的方式打开再进行读取
代码语言:javascript复制data_path=r"G:test.csv"
f = open(data_path)
res = pd.read_csv(f)
f.close()
错误三:UnicodeDecodeError:
‘gbk’ codec can’t decode byte 0xd7 in position 99413: illegal multibyte sequence
问题解读:gbk”编解码器无法解码位置99413中的字节0xd7:非法的多字节序列,通常是比较大的文件会出现一些无关紧要的字码解码不出来
解决办法:
代码语言:javascript复制data_path=dir_path_order '\' wj_name #获取数据路径
f=open(data_path,encoding='gbk',errors='ignore')#部分文件有字节编码错误,errors 忽略
data=pd.read_csv(f)
f.close
错误四:部分带公式的Excel读不出来
解决办法:请移步之前文章,链接如下:
1、https://blog.csdn.net/qq_35866846/article/details/102672342 2、https://blog.csdn.net/qq_35866846/article/details/102775288