UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘U0001f914’ in posit[通俗易懂]

2022-11-17 16:15:40 浏览数 (1)

大家好,又见面了,我是你们的朋友全栈君。

原码

代码语言:javascript复制
#保存爬取结果(微博评论)
result.to_csv('egg_comment.csv',encoding='gbk')

报错

代码语言:javascript复制
UnicodeEncodeError: 'gbk' codec can't encode character 'U0001f914' in posit

原因 网上很多内容都是采用utf8编码的,gbk无法编码字符’U0001f914’,所以’utf8’格式的数据被转成’gbk’,会因为无法编码unicode的某些字符而出错。 解决

代码语言:javascript复制
result.to_csv('egg_comment.csv',encoding='gb18030')

更多常见编码

编码

语言

utf8

所有语言

gbk

简体中文

gb2312

简体中文

gb18030

简体中文

big5

繁体中文

big5hkscs

繁体中文

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/234089.html原文链接:https://javaforall.cn

0 人点赞