Python字符编码(上)

2021-06-18 18:08:30 浏览数 (1)

一.文档

  1. #字符
  2. import unicodeata
  3. lookup()——接受不区分大小写的标准名称,返回一个 Unicode 字符
  4. name()——接受一个 Unicode 字符,返回大写形式的名称
  5. unicodeata.name('A')
  6. snowman.encode('utf-8') #指定字符编码
  7. #验证ASCII
  8. def unicode_test(value):
  9. import unicodedata
  10.     name = unicodedata.name(value)
  11.     value2 = unicodedata.lookup(name)
  12. print('value="%s", name="%s", value2="%s"' % (value, name, value2))
  13. unicode_test('A')
  14. unicode_test('u2603') #雪人
  15. unicodedata.name('u00e9') #用编码值查询字符名称
  16. unicodedata.lookup('LATIN SMALL LETTER E WITH ACUTE') #根据字符查询编码值,要去掉逗号,后变前
  17. 但当需要与外界进行数据交互时则
  18. 1.将字符串编码为字节
  19. 2.将字节解码为字符串

二.编码方式

  1. #变成utf-8编码方式
  2. name.encode('utf-8')
  3. name.encode('utf-8','ignore') #去掉无法解析的字符
  4. replace #无法解析的换成?
  5. backslashreplace #创建一个和 unicode-escape 类似的 Unicode 字符串
  6. xmlcharrefreplace #于创建网页中使用的字符实体串
  7. #编码和解码
  8. place = 'cafu00e9'
  9. type(place)
  10. place_bytes = place.encode('utf-8') #以格式编码
  11. type(place_bytes)
  12. place2 = place_bytes.decode('utf-8') #转换为unicode字符

0 人点赞