Unicode 与 UTF-8 编码的转换

2022-11-30 21:50:26 浏览数 (1)

Unicdoe【真正的完整码表】对照表(二)汉字Unicode表_hherima的博客-CSDN博客_unicode中文对照表注意:下面这两段是代理区。即第1——16平面的间接表示,四个字节的汉字就在这里表示D800-DBFF:High-half zone of UTF-16 DC00-DFFF:Low-half zone of UTF-16 本篇中包含了所有常用汉字27973个,剩余汉字使用代理区标识欢迎查看字符编码相关博客专栏比如:由iPhone emoji问题牵出的UTF-16编码,UTF-8编码探究

https://blog.csdn.net/hherima/article/details/9045861从以上链接中查询到汉字 “”的码值为 7700

汉字“明” 的7700 的二进制为

0111 0111 0000 0000

转换为十进制是 30464

所以码值范围在第三行。

填充值如下:

1110 0111 1001 1100 1000 0000

填充后对应的十六进制为:

E79C80

接下来我们把这个字符在16进制编辑器中保存在Txt文件中

 保存完Txt 文件,再打开

 以上就是Unicode 与 UTF-8 转换的方式。

0 人点赞