查看字符编码,需要用到chardet模块
一、查看网页编码
代码语言:javascript复制#coding=utf-8
import urllib.request
import chardet
url = 'http://www.baidu.com'
a = urllib.request.urlopen(url)
encode = chardet.detect(a.read())
print(encode['encoding'])
二、查看文件内容编码
代码语言:javascript复制#假设存在一个a.txt的文件
f = open('a.txt', 'rb')
print(chardet.detect(f.read(100)))
三、查看某个字符串编码
代码语言:javascript复制import chardet
s = '张三'
print(chardet.detect(str.encode(s)))
输出信息:{'encoding': 'utf-8', 'confidence': 0.7525, 'language': ''}
Tips:
代码语言:javascript复制chardet.detect 在查看字符串传的编码时,必须要把字符串encode后,才能查看当前字符串编码格式