计算机无法识别ANSI编码文件里的中文导致乱码「建议收藏」

2022-10-01 17:10:50 浏览数 (1)

大家好,又见面了,我是你们的朋友全栈君。

问题现象 最近远程协助一个用户的电脑(TeamView竟然连接不上,只好用QQ远程啦),原来ANSI编码的ini文件里的中文是正常的;用着用着,某一天就乱码了,无法识别ANSI编码文件里的中文。创建ANSI编码的ini配置文件,输入中文后保存会提示“…该文件有Unicode格式的字符,当文件保存为ANSI编码的文本时,该字符将丢失…”的问题。 原因 Unicode和ANSI是两种不同的字符编码方式。Unicode(统一码、万国码、单一码)使用全16位元字元集来表示字符,而ANSI编码通常使用 0x80~0xFF 范围的 2 个字节(8位)来表示 1 个字符。对于字符来说ANSI以单字节存放英文字符,以双字节存放中文等字符,而Unicode下,英文和中文的字符都以双字节存放。有些Unicode字符无法用ANSI编码来表示,因此文件中含有Unicode格式的字符保存为ANSI编码的文本时,该Unicode字符将丢失或被错误表示。这样文本保存以后,再次打开将会发现里面少了一些内容或是会出现乱码。 系统设置 打开控制面板(Control Panel),打开 时钟、语言和区域 (Clock, Language and Region),点击 区域 (Region),选择格式(Format) 选项卡查看,格式 为中文(简体,中国)。选择管理(Administrative) 选项卡,他的的系统区域设置也已经是 中文(简体,中国)了。 没有必要点击“更改系统区域设置 (Change system locale…) ”按钮,更改重启。 不过在cmd.exe输入chcp命令查询到当前系统的活动代码页为437,竟然不是936。 (437 是美国英语的代码页,936是中文的代码页)。 解决办法 chcp 是 “change code page”(更改代码页)的缩写,可以输入:chcp /?命令查看当前的活动代码编号。 更改代码页最好直接找到C:WINDOWSsystem32cmd.exe这个运行,而不是运行快捷方式。 输入:chcp 936 按回车键执行,更改代码页。可以显示中文了。 再输入:chcp 437 按回车键执行,原有的中文又会变成问号。 最后建议 程序默认的编码为系统编码,windows一般是ANSI编码。Windows 自带的记事本(Notepad.exe)会默认采用 ANSI 编码来处理文本文件,这也是由于大部分的文本文件都是用各国自己的编码标准写成的。这个ANSI 编码的具体编码方式,也会因上面所讲述的设置变化而有所改变。若想要摆脱不同的 ANSI 编码所产生的困扰(如在中文的系统上写的TXT文档要在日文的系统上打开经常会出现乱码),可以在保存文本文件时 选择采用 UTF-8 (单字节8位的Unicode编码)。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/192960.html原文链接:https://javaforall.cn

0 人点赞