大家好,又见面了,我是你们的朋友全栈君。
原码
代码语言:javascript复制#保存爬取结果(微博评论)
result.to_csv('egg_comment.csv',encoding='gbk')
报错
代码语言:javascript复制UnicodeEncodeError: 'gbk' codec can't encode character 'U0001f914' in posit
原因 网上很多内容都是采用utf8编码的,gbk无法编码字符’U0001f914’,所以’utf8’格式的数据被转成’gbk’,会因为无法编码unicode的某些字符而出错。 解决
代码语言:javascript复制result.to_csv('egg_comment.csv',encoding='gb18030')
更多常见编码
编码 | 语言 |
---|---|
utf8 | 所有语言 |
gbk | 简体中文 |
gb2312 | 简体中文 |
gb18030 | 简体中文 |
big5 | 繁体中文 |
big5hkscs | 繁体中文 |
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/234089.html原文链接:https://javaforall.cn