Python 3 查看字符编码方法

2020-05-04 21:30:31 浏览数 (1)

查看字符编码,需要用到chardet模块

一、查看网页编码

代码语言:javascript复制
#coding=utf-8
import urllib.request
import chardet
url = 'http://www.baidu.com'
a = urllib.request.urlopen(url)
encode = chardet.detect(a.read())
print(encode['encoding'])

二、查看文件内容编码

代码语言:javascript复制
#假设存在一个a.txt的文件
f = open('a.txt', 'rb')
print(chardet.detect(f.read(100)))

三、查看某个字符串编码

代码语言:javascript复制
import chardet
s = '张三'
print(chardet.detect(str.encode(s)))
输出信息:{'encoding': 'utf-8', 'confidence': 0.7525, 'language': ''}

Tips:

代码语言:javascript复制
chardet.detect 在查看字符串传的编码时,必须要把字符串encode后,才能查看当前字符串编码格式

0 人点赞