美文网首页程序员
详解字节流和字符流

详解字节流和字符流

作者: 洞见星河 | 来源:发表于2020-06-08 22:38 被阅读0次

    一、明确字符和字节的概念

    字节:1 byte = 8 bit
    字符:1 char = 2 byte = 16 bit(java默认)

    在计算机硬件层面,1 bit 是数据最小的单位。但是在大多数情况下,1 bit 存储的信息太少,我们通常把 1 字节作为数据最小的基本单位。

    而字符实际上也是对字节的一种包装,那为什么还需要引入字符?
    对于西方世界,使用英语等语种的国家来说,1字节有 256个符号编码,对于26个英文字母加上常用的标点符号已经够用了。这就是常用的ASCII 码。
    但是对于东方国家,中文,日文等文字,数量太多,1个字节根本没有办法表示所有的字符,所以引入了Unicode —— 统一编码,而这种编码的常规字符集就是使用2个字节,所以引入了字符的概念。

    但是,从根本而言,一切都是字节流,字符流也是字节流的一种形式。

    二、关于 java中字节流和字符流

    2.1 字节流,字符流概念

    Java中,读取数据时,字节流的数据存储单位是字节,会使用字节类型数组 byte[] 来保存数据,可以操作字节,字节数组。
    而 字符流的存储单位是字符,使用字符类数组 char[] 来保存数据,可以操作字符,字符数组或字符串。

    2.2 java中的字节流,字符流相关API

    Java 的I/O库有两个分支:

    • 面向字节流的InputSteam和OutputStream
    • 面向字符的Reader 和 wirter
    InputStream

    ByteArrayInputStream:把内存中的一个缓冲区作为 InputStream 使用 .
    StringBufferInputStream: 把一个 String 对象作为 InputStream .
    FileInputStream:把一个文件作为 InputStream ,实现对文件的读取操作
    PipedInputStream :实现了 pipe 的概念,主要在线程中使用 . 管道输入流是指一个通讯管道的接收端。
    一个线程通过管道输出流发送数据,而另一个线程通过管道输入流读取数据,这样可实现两个线程间的通讯。
    SequenceInputStream :把多个 InputStream 合并为一个 InputStream . “序列输入流”类允许应用程序把几个输入流连续地合并起来,
    并且使它们像单个输入流一样出现。每个输入流依次被读取,直到到达该流的末尾。

    OutputStream

    ByteArrayOutputStream : 把信息存入内存中的一个缓冲区中 . 该类实现一个以字节数组形式写入数据的输出流。
    FileOutputStream: 文件输出流是向 File 或 FileDescriptor 输出数据的一个输出流。
    PipedOutputStream: 管道输出流是指一个通讯管道的发送端。 一个线程通过管道输出流发送数据,
    而另一个线程通过管道输入流读取数据,这样可实现两个线程间的通讯。

    Reader

    CharArrayReader :与 ByteArrayInputStream 对应此类实现一个可用作字符输入流的字符缓冲区
    StringReader : 与 StringBufferInputStream 对应其源为一个字符串的字符流。
    FileReader : 与 FileInputStream 对应
    PipedReader :与 PipedInputStream 对应

    Writer

    CharArrayWrite : 与 ByteArrayOutputStream 对应
    StringWrite :无与之对应的以字节为导向的 stream
    FileWrite : 与 FileOutputStream 对应
    PipedWrite :与 PipedOutputStream 对应

    2.3 字符流,字节流API的使用

    字节流示例

    //字节流写文件
    public static void writeFile(){
        String str = "采用数据流方式(字节流)写文件!";
        try{
            BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("D://hello.txt",true));
            //需要转化为字节
            byte[] data = str.getBytes();
            bos.write(data);
            bos.close();
        }catch (FileNotFoundException e){
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
    //字节流读文件
    public static void readFile(){
        try {
            BufferedInputStream bis = new BufferedInputStream(new FileInputStream("D://hello.txt"));
            byte[] data = new byte[1024];
            int n = -1;
            while((n=bis.read(data,0,data.length))!=-1){
                String str = new String(data,0,n,"UTF-8");
                System.out.println(str);
            }
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    

    字符流示例

    //字符流写文件
    public static void writeFile(){
        File file = new File("D:\\hello.txt");
        String str = " hello, everybody! welcome to the study of Java!";
        try{
            FileWriter fw = new FileWriter(file);
            BufferedWriter bw = new BufferedWriter(fw);
            bw.write(str);
            bw.close();
            fw.close();
        }catch(IOException e){
            e.printStackTrace();
        }
    }
    //字符流读文件
    public static void readerFile(){
        File file = new File("D:\\hello.txt");
        try{
            BufferedReader br = new BufferedReader(new FileReader(file));
    
            String str = null;
            while( (str = br.readLine()) != null){
                System.out.println(str);
            }
            br.close();
        }catch(FileNotFoundException e){
            e.printStackTrace();
        }catch(IOException e){
            e.printStackTrace();
        }
    }
    

    三、字节流和字符流的区别

    字节流和字符流的区别:

    • 字节流在操作文件时,本身不会用到缓冲区(内存),是对文件本身直接操作的;而字符流在操作时是使用到缓冲区的。
    • 字节流在操作文件时,即使不关闭资源(close)文件也能输出;字符流如果不是用close方法的话,则不会输出任何内容,说明字符流使用了缓冲区。且可以使用flush方法强制进行刷新缓冲区,此时在不close情况下也能输出内容。
    • Reader类的read()方法返回类型是int,占两个字节,如果到达流的末尾,则返回-1;inputStream的read()方法虽然也返回int,打算面向字节流,占一个字节。因此对于超过一个字节的只能使用字符流来读取,如汉字。
    • 处理方式不同;字节流:处理字节和字节数组成的二进制对象。
      字符流:处理字符,字符数或字符串。

    注:缓冲区是什么??
    缓冲区可以理解为一段特殊的内存。
    在某些情况下,如果程序频繁操作一个资源,则性能会很低,为了提升性能,可以将这部分数据暂时读入内存的一块区域,之后就可以直接从内存中读取数据,提升速度和性能。

    四、使用场景判断

    4.1 数据格式

    • 二进制格式(不能确定是纯文本):字节流,InputStream、OutputStream及其子类。
    • 纯文本格式(含中英文或其他编码方式):字符流,Reader,Writer及其子类。

    4.2 数据来源

    • 文件:字节流 FileInputStream,FileOutputStream;字符流 FileReader,FileWriter
    • byte[]: 字节流 ByteArrayInputStream, ByteArrayOutputStream char[]:字符流
    • CharArrayReader, CharArrayWriter String: 字节
    • StringBufferInputStream, StringBufferOuputStream ;字符流 StringReader,StringWriter
    • 网络数据流:字节流 InputStream, OutputStream;字符流 Reader, Writer

    4.3 是否需要格式化输出

    需要格式化输出的:PrintStream, PrintWriter

    4.4 是否需要缓冲

    需要缓冲:字节流 BufferedInputStream, BufferedOutputStream;字符流 BufferedReader, BufferedWriter

    4.5 输入还是输出

    • 输入:Reader, InputStream 类型的子类
    • 输出:Writer, OutputStream 类型的子类

    4.6 是否有流转化

    • 字节到字符:InputStreamReader
    • 字符到字节:OutputStreamWriter

    4.7 特殊需要

    • 对象输入输出:ObjectInputStream, ObjectOutputStream
    • 进程间通信:PipedInputStream, PipedOutputStream, PipedReader, PipedWriter
    • 合并输入: SequenceInputStream

    相关文章

      网友评论

        本文标题:详解字节流和字符流

        本文链接:https://www.haomeiwen.com/subject/fxodtktx.html