大家好,又见面了,我是你们的朋友全栈君。
常见的编码
- GBK、GB2312:表示国标编码,GDB包含简体中文和繁体中文,而DB2312只包含简体中文,也就是说,这两种编码都是描述中文的编码
- UNICODE编码:Java提供的16进制编码,可以描述世界上任意的文字信息,但是有个问题,若现在所有的字母都使用16进制编码,那么这个编码太庞大了,会造成网络传输的负担
- ISO8859-1:国际通用编码,但是所有的编码都需要进行转换
- UTF编码:相当于结合了UNOICODE、ISO8859-1,也就是需要用到16进制文字使用UNICODE,而若只是字母就使用ISO8859-1,常用的就是UTF- 8
乱码产生分析
若本地系统所用的编码和程序所用的编码不同,强制转换就会出现乱码
代码语言:javascript复制public class analyzeMessyCode {
public static void main(String[] args) throws IOException {
FileOutputStream fileOut = new FileOutputStream
(new File("C:\Users\Administrator\Downloads\file1.txt"));
fileOut.write("hello world".getBytes("ISO8859-1"));
fileOut.close();
}
}
乱码产生的原因:编码和解码不统一产生的问题
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/139718.html原文链接:https://javaforall.cn