大家好,又见面了,我是你们的朋友全栈君。
报错信息
用Python做数据处理时,报如下错误:
代码语言:javascript复制pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 28, saw 4
错误原因
首先我们先看一下报错:
pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 28, saw 4
翻译过来是:
pandas.errors.parserror:标记数据时出错。C错误:第28行中需要3个字段,见4
错误产生是因为数据集格式错误。
解决方案
我们需要修改一下数据格式或者在读入时做一些设置,以下两种方法可行:
1、修改读入代码
在读入代码后面加入如下参数:
代码语言:javascript复制error_bad_lines=False #加入参数
2、修改文件格式
我产生错误的原因是偷懒直接修改的后缀名,正确做法是将文件打开另存在数据集要求的格式。例如我需要csv文件,现有是xlsx文件,需要打开另存在csv文件,不能直接修改后缀名。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/147400.html原文链接:https://javaforall.cn