Java进阶-IO(2)

2024-03-04 14:47:44 浏览数 (2)

话接上回,继续java IO部分的学习。上一次说完了字节流的读写数据,这次介绍一下字符流的读写数据。

一、字符流及其读/写数据

1、字符流
1.1 概述

1)背景

由于字节流操作中文不是特别方便,所以java就提供了字符流。

字符流=字节流 编码表(即字符流的底层还是字节流)

2)问题:用字节流复制文本文件,文本文件中也有中文,但是不会出现编码问题的原因?如何识别是中文?

最终底层操作会自动进行字节拼接成中文。 识别中文:汉字在存储时无论选择哪种编码存储,第一个字节都是负数。

3)一个汉字存储(不同编码占用字节数不同)

代码语言:javascript复制
- 采用GBK编码,占用2个字节
- UTF-8编码,占用3个字节

注:getBytes()方法:得到字符对应的字节数组,如:
String s="abc";
byte[] bys=s.getBytes();
System.out.println(Arrays.toString(bys));  //Arrays工具类的toString方法,打印结果为[97,98,99]
1.2 字符编码(简单了解)

1)概述

代码语言:javascript复制
ISO8859-1:属于单字节编码,最多只能表示 0~255 的字符范围。
GBK/GB2312:中文的国标编码,用来表示汉字,属于双字节编码。GBK 可以表示简体中文和繁体中文,而 GB2312 只能表示简体中文(GBK 兼容 GB2312)
Unicode:是一种编码规范,是为解决全球字符通用编码而设计的。UTF-8 和 UTF-16 是这种规范的一种实现,该编码不兼容 ISO8859-1 编码。Java 内部采用此编码。
UTF:UTF 编码兼容了 ISO8859-1 编码,同时也可以用来表示所有的语言字符,但 UTF 编码是不定长编码,每一个字符的长度为 1~6 个字节不等(一般在中文网页中使用此编码,可以节省空间)

2)字符串中的编码解码

注:按哪种编码存储(编码),就必须按该种编码解析(解码),否则会乱码

编码(按某种规则,将字符存储到计算机中)

代码语言:javascript复制
byte[] getBytes():使用平台默认字符集将该String编码为一系列字节,并将结果存储到新的字节数组中。
byte[] getBytes(String charsetName):通过指定的字符集将该String编码为一系列字节,并将结果存储到新的字节数组中

解码(将储存在计算机中的二进制数按照某种规则解析显示)

代码语言:javascript复制
String(byte[] bytes):通过使用平台的默认字符集解码指定的字节数组来构造新的String
String(bytes,String charsetName):通过指定的字符集解码指定的字节数组来构造新的String

3)字符流中的编码解码

字符流抽象基类(父类)

代码语言:javascript复制
Reader:字符输入流的抽象类
Writer:字符输出流的抽象类

字符流中与编码解码相关的两个类

转换流:将字节流转换为字符流

代码语言:javascript复制
InputStreamReader(常用构造方法:2个)
- InputStreamReader(InputStream in) // 默认字符集
- InputStreamReader(InputStream in,String charsetName) // 指定字符集

OutputStreamWriter(常用构造方法:2个)
- OutputStreamWriter(OutputStream out)
- OutputStreamWriter(OutputStream out,String charsetName)

示例1(字符串中的编码解码)

代码语言:javascript复制
import java.io.UnsupportedEncodingException;
import java.util.Arrays; // 导入Arrays操作类

public class StringDemo {
    public static void main(String[] args) throws UnsupportedEncodingException {
        String s="中国"; // 创建一个字符串对象
        /*
        编码
        1.byte[] getBytes()
        2.byte[] getBytes(String charsetName)
         */
        byte[] bys = s.getBytes(); // getBytes()方法返回一个字节数组,ctrl alt v快捷键:生成左边
        System.out.println(Arrays.toString(bys)); // [-28, -72, -83, -27, -101, -67],一个汉字占3字节,说明是UTF-8编码
        byte[] bys1 = s.getBytes("UTF-8"); // [-28, -72, -83, -27, -101, -67]
        System.out.println(Arrays.toString(bys1)); // 调用Arrays工具类中的toString()方法,返回对象的字符串显示
        byte[] bys2 = s.getBytes("GBK");
        System.out.println(Arrays.toString(bys2)); // [-42, -48, -71, -6], GBK编码,一个汉字占2个字节

        /*
        解码
        1.String(byte[] bytes)
        2.String(bytes,String charsetName)
         */
        String ss= new String(bys);
        String ss1=new String(bys,"UTF-8");
        String ss2=new String(bys,"GBK"); // bys用UTF-8编码,却用GBK解码,所以输出会乱码
        String ss3=new String(bys2,"GBK"); // bys2用GBK编码,也用GBK解码,故不会乱码
        System.out.println(ss); // 中国
        System.out.println(ss1); // 中国
        System.out.println(ss2); // 涓  浗
        System.out.println(ss3); // 中国
        // 重要结论:按哪种编码存储(编码),就必须按该种编码解析(解码),否则会乱码
    }
}

运行结果

代码语言:javascript复制
[-28, -72, -83, -27, -101, -67]
[-28, -72, -83, -27, -101, -67]
[-42, -48, -71, -6]
中国
中国
涓  浗
中国

示例2(字符流中的编码解码)

代码语言:javascript复制
import java.io.*;

public class ConversionStreamDemo {
    public static void main(String[] args) throws IOException {
//        OutputStreamWriter(OutputStream out) 默认字符编码
//        OutputStreamWriter(OutputStream out,String charsetName) 指定字符编码

//        FileOutputStream fos=new FileOutputStream("C:\Users\ASUS\Desktop\project1\src\osw.txt");
//        OutputStreamWriter osw=new OutputStreamWriter(fos);
        // 操作1:写数据
        // 创建对象,默认字符编码
        //OutputStreamWriter osw=new OutputStreamWriter(new FileOutputStream("C:\Users\ASUS\Desktop\project1\src\osw.txt")); // 平台默认为UTF-8编码
        // 创建对象,第二种构造方法
        OutputStreamWriter osw=new OutputStreamWriter(new FileOutputStream("C:\Users\ASUS\Desktop\project1\src\osw.txt"),"GBK");
        osw.write("中国"); // 写入数据
        // 释放资源
        osw.close();

        // 操作2:读数据
        // 创建对象(两种构造方法)
        //InputStreamReader isr=new InputStreamReader(new FileInputStream("C:\Users\ASUS\Desktop\project1\src\osw.txt")); //以GBK编码,UTF-8解码,会出现乱码
        InputStreamReader isr=new InputStreamReader(new FileInputStream("C:\Users\ASUS\Desktop\project1\src\osw.txt"),"GBK"); //以GBK编码,GBK解码,不乱码
        // 一次读取一个字符数据
        int ch;
        while ((ch= isr.read())!=-1){ // 未到文件末尾,还有数据
            System.out.print((char) ch); // 强转为字符类型,注意不要加ln
        }
        // 释放资源
        isr.close();
    }
}

运行结果

代码语言:javascript复制
中国
1.3 字符流读数据

层级关系(父–>子):Reader(抽象类)---->InputStreamReader---->FileReader(都在java.io包下)

1)Reader类常用子类

代码语言:javascript复制
Reader 类是所有字符流输入类的父类,常用子类:(参考JDK帮助文档)
- CharArrayReader 类:将字符数组转换为字符输入流,从中读取字符。
- StringReader 类:将字符串转换为字符输入流,从中读取字符。
- BufferedReader 类:为其他字符输入流提供读缓冲区。
- PipedReader 类:连接到一个 PipedWriter。
- InputStreamReader 类:将字节输入流转换为字符输入流,可以指定字符编码。
    - 与 InputStream 类相同,在 Reader 类中也包含 close()、mark()、skip() 和 reset() 等方法,可参考 InputStream 类的方法

2)Reader类中的read()方法(重载–3个)

代码语言:javascript复制
int read()    从输入流中读取一个字符,并把它转换为 0~65535 的整数。如果返回 -1, 则表示已经到了输入流的末尾。
为了提高 I/O 操作的效率,通常使用以下两种 read()方法
int read(char[] cbuf)    从输入流中读取若干个字符,并把它们保存到参数 cbuf 指定的字符数组中。 该方法返回读取的字符数,如果返回 -1,则表示已经到了输入流的末尾
int read(char[] cbuf,int off,int len)    从输入流中读取若干个字符,并把它们保存到参数 cbuf 指定的字符数组中。其中,off 指定在字符数组中开始保存数据的起始下标,len 指定读取的字符数。该方法返回实际读取的字符数,如果返回 -1,则表示已经到了输入流的末尾

示例

代码语言:javascript复制
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;

public class InputStreamReaderDemo {
    public static void main(String[] args) throws IOException {
        // 创建一个默认字符集的InputStreamReader对象
        InputStreamReader isr=new InputStreamReader(new FileInputStream("D:\Ultimate JavaCode\src\test6\文本复制案例.txt"));
        // 读数据
//        方法1
//        int ch;
//        while ((ch= isr.read())!=-1){ // 是否读到文件末尾,即判断文件数据是否全部读完
//            System.out.print((char) ch); // 强转为字符类型输出显示在控制台上
//        }
//        方法2
        char[] chs=new char[1024]; // 大小为1024的整数倍
        int len;
        while ((len=isr.read(chs))!=-1){ // read(byte[] b)方法
            System.out.print(new String(chs,0,len)); // 转化为字符串对象输出显示在控制台
        }
        // 释放资源
        isr.close();
    }
}

3)字符文件输入流

FileReader类(构造方法–2个重载)

代码语言:javascript复制
FileReader(File file):在给定要读取数据的文件的情况下创建一个新的 FileReader 对象。其中,file 表示要从中读取数据的文件。
FileReader(String fileName):在给定从中读取数据的文件名的情况下创建一个新 FileReader 对象。其中,fileName 表示要从中读取数据的文件的名称,表示的是一个文件的完整路径。

注:在创建 FileReader 对象时若引发 FileNotFoundException 异常,需要使用 try catch 语句捕获该异常。

示例(使用字符流复制java文件)

用转换流InputStreamReader和OutputStreamWriter实现字符流复制java文件

转换流作用:将字节流转换为字符流

代码语言:javascript复制
import java.io.*;

// 实现字符流复制java文件
public class FileReaderDemo {
    public static void main(String[] args) throws IOException {
        InputStreamReader isr=new InputStreamReader(new FileInputStream("D:\Ultimate JavaCode\ConversionStreamDemo.java"));
        OutputStreamWriter isw=new OutputStreamWriter(new FileOutputStream("D:\Ultimate JavaCode\Copy.java"));
        // 1.一次读取一个字符数据
//        int ch;
//        while ((ch=isr.read())!=-1){ // 读数据
//            isw.write(ch); // 复制文件
//        }
        // 2.一次读取一个字符数组数据
        char[] chs=new char[1024]; // 1024的整数倍
        int len;
        while((len=isr.read(chs))!=-1){
            isw.write(chs,0,len);
        }
        // 释放资源
        isw.close();
        isr.close();
    }
}

由于转换流创建对象代码较冗长,可以使用其子类FileReader和FileWriter实现

但若要想解决编码问题,一定要用转换流,因为其在创建时可以指定编码类型

代码语言:javascript复制
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
// FileReader和FileWriter类分别为InputStreamReader和OutputStreamWriter的子类(继承),因此可以调用其方法
public class FileReaderDemo1 {
    public static void main(String[] args) throws IOException {
        // 根据数据源创建字符输入流对象
        FileReader fr=new FileReader("D:\Ultimate JavaCode\ConversionStreamDemo.java");
        // 根据目的地创建字符输出流对象
        FileWriter fw=new FileWriter("D:\Ultimate JavaCode\Copy1.java");
        // 1.一次读取一个字符数据
//        int ch;
//        while ((ch=fr.read())!=-1){ // 读数据
//            fw.write(ch); // 写入复制
//        }

        // 2.一次读取一个字符数组
        char[] chs=new char[1024]; // 1024的整数倍
        int len;
        while((len=fr.read(chs))!=-1){
            fw.write(chs,0,len);
        }
        // 释放资源
        fw.close();
        fr.close();
    }
}

4)字符缓冲区输入流

BufferedReader 类

主要用于辅助其他字符输入流,它带有缓冲区,可以先将一批数据读到内存缓冲区。接下来的读操作就可以直接从缓冲区中获取数据,而不需要每次都从数据源读取数据并进行字符编码转换,可提高数据的读取效率。

构造方法(重载–2个)

代码语言:javascript复制
BufferedReader(Reader in):创建一个 BufferedReader 来修饰参数 in 指定的字符输入流
BufferedReader(Reader in,int size):创建一个 BufferedReader 来修饰参数 in 指定的字符输入流,参数 size 则用于指定缓冲区的大小,单位为字符。

示例(字符缓冲流)

代码语言:javascript复制
import java.io.*;

public class BufferedStreamDemo {
    public static void main(String[] args) throws IOException {
        // 创建字符缓冲输出流对象
//        BufferedWriter bw=new BufferedWriter(new FileWriter("D:\Ultimate JavaCode\src\test6\bw.txt"));
//        // 写数据
//        bw.write("hellon"); // 添加换行符换行
//        bw.write("javaeen");
//        // 释放资源
//        bw.close();

        // 创建字符缓冲输入流对象
        BufferedReader br=new BufferedReader(new FileReader("D:\Ultimate JavaCode\src\test6\bw.txt"));
        // 一次读取一个字符数据
//        int ch;
//        while((ch=br.read())!=-1){
//            System.out.print((char) ch); // 强转为字符类型输出显示在控制台上
//        }

        // 一次读取一个字符数组
        char[] chs=new char[1024];
        int len;
        while((len=br.read(chs))!=-1){
            System.out.println(new String(chs,0,len)); // 转换为字符串类型输出显示在控制台上
        }
        // 释放资源
        br.close();
    }
}

运行结果

代码语言:javascript复制
hello
javaee
1.4 字符流写数据

层级关系(父–>子):Writer(抽象类)---->OutputStreamWriter---->FileWriter(都在java.io包下)

1)Writer类常用子类

代码语言:javascript复制
Writer 类是所有字符输出流的父类,常用子类:
- CharArrayWriter 类:向内存缓冲区的字符数组写数据。
- StringWriter 类:向内存缓冲区的字符串(StringBuffer)写数据。
- BufferedWriter 类:为其他字符输出流提供写缓冲区。
- PipedWriter 类:连接到一个 PipedReader。
- OutputStreamWriter 类:将字节输出流转换为字符输出流,可以指定字符编码。
    - 与 OutputStream 类相同,Writer 类也包含 close()、flush() 等方法,可参考 OutputStream 类的方法

2)FileWriter类(用于写入字符文件,重载–4个)

代码语言:javascript复制
FileWriter(File file):在指定 File 对象的情况下构造一个 FileWriter 对象。
FileWriter(File file,boolean append):在指定 File 对象的情况下构造一个 FileWriter 对象,如果 append 的值为 true,则将字节写入文件末尾,而不是写入文件开始处。
FileWriter(String fileName):在指定文件名的情况下构造一个 FileWriter 对象。其中,fileName 表示要写入字符的文件名,表示的是完整路径。
FileWriter(String fileName,boolean append):在指定文件名以及要写入文件的位置的情况下构造 FileWriter 对象。其中,append 是一个 boolean 值,如果为 true,则将数据写入文件末尾,而不是文件开始处

3)字符缓冲输出流

BufferedWriter 类

主要用于辅助其他字符输出流,同样带有缓冲区,可以先将一批数据写入缓冲区,当缓冲区满了后再将缓冲区的数据一次性写到字符输出流,其目的是为了提高数据的写效率。

构造方法(重载–2个)

代码语言:javascript复制
BufferedWriter(Writer out):创建一个 BufferedWriter 来修饰参数 out 指定的字符输出流,默认大小。
BufferedWriter(Writer out,int size):创建一个 BufferedWriter 来修饰参数 out 指定的字符输出流,参数 size 则用于指定缓冲区的大小,单位为字符。
- BufferedWriter 类的使用与 FileWriter 类相同,不再重述。

5)字符流写数据的五种方式

代码语言:javascript复制
write(int c)  写一个字符
write(char[] cbuf)  写入一个字符数组
write(char[] cbuf,int off,int len)  写入字符数组的一部分
write(String str)  写一个字符串
write(String str,int off,int len)  写一个字符串的一部

注:关于flush()和 close()方法

代码语言:javascript复制
flush():刷新流,还能继续写数据
close():关闭流之前先刷新流,一旦关闭后不能再写数据

示例(字符流写数据)

代码语言:javascript复制
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
// OutputStreamWrite类:将字节输出流转换为字符输出流,可以指定字符编码。
public class OutputStreamWriteDemo {
    public static void main(String[] args) throws IOException {
        // 创建OutputStreamWriter对象(使用默认字符编码)
        OutputStreamWriter osw=new OutputStreamWriter(new FileOutputStream("D:\Ultimate JavaCode\src\test6\osw_2_12"));
        /* 写入数据(5种方式,重载)
        write(int c)  写一个字符
        write(char[] cbuf)  写入一个字符数组
        write(char[] cbuf,int off,int len)  写入字符数组的一部分
        write(String str)  写一个字符串
        write(String str,int off,int len)  写一个字符串的一部
         */

//        osw.write(97);
//        // 字符流写数据不能直接写到文件中,因为最终要通过字节流FileOutputStream来写,还存储在缓冲区里面
//        osw.flush(); // 刷新流,将数据从缓冲区刷新入文件,还能继续写数据
//        osw.write(98);
//        osw.flush();
//        osw.write(99);
//        osw.close(); // 关闭流之前先刷新流,一旦关闭后不能再写数据。整个结果:abc

//        char[] chs={'a','b','c','d','e'};
//        osw.write(chs); // abcde
//        osw.write(chs,0,chs.length); // abcde
//        osw.write(chs,1,3); // bcd

//        osw.write("abcdef"); // abcdef
        osw.write("abcdef",1,3); // bcd
        // 释放资源
        osw.close();
    }
}

0 人点赞