Java文件流相关

作者: zackyG | 来源:发表于2019-03-04 23:11 被阅读2次

    Java里面,将IO流体系按操作方式分类,可分为字节流和字符流。相关类结构图如下:


    字节流和字符流.png

    字节流相关的基类是InputStream/OutputStream,其操作方式处理的最基本的数据单元是字节。字符流相关的基类是Reader和Writer,其操作方式处理的最基本的数据单元是Unicode编码的字符。

    字节流

    字节流通常用来二进制数据,所以适用的场景很多,比如网络数据传输,磁盘文件读写等等。
    Java中最基本的两个字节流类是InputStream和OutputStream,它们分别代表了一组基本的输入字节流和输出字节流。InputStream类与OutputStream类均为抽象类,我们在实际使用中通常使用Java类库中提供的它们的一系列子类。我们以InputStream为例,介绍下Java的字节流。
    InputStream类中定义了一个抽象方法read(),其子类通过实现该方法,处理从字节流读取字节的相关逻辑

    public abstract int read() throws IOException;
    

    read方法的功能是从字节流中读取一个字节,如果到了末尾则返回-1,否则就返回读取到的字节。调用这个方法需要注意的是,它会一直阻塞线程直到返回读取到的字节或者-1。另外,字节流默认情况下,是不支持缓存的。这意味着每次调用read()都会请求操作系统去读取一个字节,如果是文件读取,就会涉及到磁盘访问,因此效率会比较低。可能有人注意到InputStream类中还有另一个read(byte[])方法,其实它内部的实现也只是循环调用read()方法,本质上还是一样。基于这样的局限,就需要用到BufferedInputStream。它可以利用缓冲区来减少系统IO操作的次数,提高读写性能,缓冲区默认大小为8M。
    以下是字节流的简单用法

    File file = new File("H:/sourceCode/workspace4java/test.txt");
    FileInputStream inputStream = new FileInputStream(file);
                int n = -1;
                byte[] bytes = new byte[(int)file.length()];
                int len = inputStream.read(bytes);
                System.out.println("文件字节长度为"+len);
                System.out.println(new String(bytes));
                inputStream.close();
    
                FileInputStream inputStream2 = new FileInputStream(file);
                BufferedInputStream bufferedInputStream = new BufferedInputStream(inputStream2,4*1024);
                byte[] bytes2 = new byte[(int)file.length()];
                int len2 = bufferedInputStream.read(bytes2);
                System.out.println("文件字节长度为"+len2);
                System.out.println(new String(bytes2));
                inputStream2.close();
                bufferedInputStream.close();
    

    字符流

    字符流通常用来处理文本数据。因为字符流操作的最基本的单元是Unicode码。Unicode码的范围是0x0000~0xFFFF,在这个范围内的每一个数字都与一个字符相对应,Java的String类型默认就是将字符以Unicode编码的形式存在内存中的。但在实际开发中,我们会发现,在某些系统或者存储文件中,字符并不都是以Unicode编码形式存储的。编码方式不同,会导致相同的字符会有不同的二进制表示。
    所以实际上,字符流的工作机制是这样的:

    • 输入流:将要读取的字节序列按指定的编码方式转换成相应的字符序列(实际上是Unicode码序列),然后存入内存。
    • 输出流:将要传输的字符序列(实际上是Unicode码序列)按指定的编码方式转换成响应的字节流,然后输出。
      由于字符流在输出前,都要完成字符序列到字节序列之间的转换过程,所以它会用到内存缓存区来存放转换得到的字节序列。
      以下是字符流的简单用法:
    File file = new File("H:/sourceCode/workspace4java/test.txt");
    FileWriter writer = new FileWriter(file);
                writer.write("这是一个输出字符流");
                writer.close();
                FileReader reader = new FileReader(file);
                StringBuffer sb = new StringBuffer();
                int temp2 = -1;
                while((temp2 = reader.read())!=-1){
                    //read方法一次只读取一个字符
                    sb.append((char)temp2);
                }
                System.out.println(sb);
                reader.close();
    
                FileReader reader2 = new FileReader(file);
                BufferedReader bufferedReader = new BufferedReader(reader2);
                StringBuffer sb2 = new StringBuffer();
                String str = null;
                while((str = bufferedReader.readLine())!=null){
                    sb2.append(str);
                }
                System.out.println(sb2);
                reader2.close();
                bufferedReader.close();
    
    FileWriter和BufferedWriter的区别
    //例1
    FileWriter file = new FileWriter("foo.txt");
    file.write("foobar");
    file.close();
    FileWriter file = new FileWriter("foo.txt");BufferedWriter bf = new BufferedWriter(file);
    bf.write("foobar");
    bf.close();
    //例2
    for(int i = 0; i < 100; i++) {
        writer.write("foorbar");
        writer.write(NEW_LINE);}
    writer.close();
    
    • 写入单一数据(调用一次write方法)到文件时,FileWriter和BufferedWriter都是一次性写入到磁盘,也就是指有一次磁盘访问操作。而不是一个字符一个字符的写入。
    • 写入多条数据(如代码中的例2),每一次执行write方法,FileWriter都会请求系统进行磁盘操作。而BufferedWriter则会根据其配置的缓存区大小,默认是8M,如果多次执行write方法累积的数据没有超过8M, 则只会调用一次磁盘操作写入。

    字节流和字符流的区别

    • 字节流操作的最基本的数据单元是字节,字符流操作的最基本的数据单元是字符。
    • 字节流默认不使用缓冲区,字符输出流则会使用缓冲区存放转换的字节序列
    • 字节流通常用于处理二进制数据,实际上可以处理任意类型的数据(图片,音视频,文本等),但它不支持直接读写Unicode码。字符流通常用来处理文本数据,它支持直接读写Unicode码。

    随机访问文件

    在实际开发中,文件的多线程下载和断点续传是经常会遇到的使用场景,这其中就涉及到从文件中的指定位置读写数据,这就需要用到Java中的RandomAccessFile类,随机访问文件。
    一般的文件IO流,访问文件都是按照文件内容的顺序从头开始读写。RandomAccessFile类可以让我们从文件中的任何位置读写数据。
    可以以4中模式创建RandomAccessFile对象:

    模式 含义
    "r" 文件以只读模式打开。
    "rw" 该文件以读写模式打开。 如果文件不存在,则创建该文件。
    "rws" 该文件以读写模式打开。 对文件的内容及其元数据的任何修改立即被写入存储设备。
    "rwd" 该文件以读写模式打开。 对文件内容的任何修改立即被写入存储设备。
    //在构造方法中传入文件名称和访问模式
    RandomAccessFile  raf = new RandomAccessFile("randomtest.txt", "rw");
    

    RandomAccessFile常用的一些方法

    • 使用readUTF()和writeUTF()方法处理字符串。
    • 使用readInt()和writeInt()方法处理整数。
    • 通过getFilePointer()方法获取文件指针的位置,初始化时为0。
    • 通过seek()方法,将文件指针设置到指定的位置。
    • length() 返回文件当前的长度,我们也可以通过setLength()方法来扩展或者截断文件。
      以下是RandomAccessFile类的简单用法
    RandomAccessFile raf = new RandomAccessFile("H:/sourceCode/workspace4java/test.txt","rw");
                raf.writeUTF("随机访问文件输出UTF-8");
                raf.seek(0);
                String str = raf.readUTF();
                System.out.println(str);
    
                raf.seek(8);
                byte[] bytes = new byte[12];
                raf.read(bytes);
                String s = new String(bytes);
                System.out.println(s);
    
                raf.seek(0);
                raf.writeUTF("访问文件RandomAccessFile");
    
                raf.seek(0);
                byte[] bytes2 = new byte[14];
                raf.read(bytes2);
                String s2 = new String(bytes2);
                System.out.println(s2);
    
                raf.seek(2);
                byte[] bytes3 = new byte[12];
                raf.read(bytes3);
                String s3 = new String(bytes3);
                System.out.println(s3);
                raf.close();
    

    打印结果

    随机访问文件输出UTF-8
    访问文件
     访问文件
    访问文件

    值得注意的是,通过writeUTF方法写入数据,会默认在字符串开头多家两个字节。所以才会有上面的运行结果:从文件指针为0的位置,开始读取会读出开头的两个字节,而真实的数据内容从第三个字节的位置开始。

    文章参考
    https://stackoverflow.com/questions/21980090/javas-randomaccessfile-eofexception
    https://www.ibm.com/developerworks/cn/java/j-lo-serial/index.html
    http://www.importnew.com/23963.html
    https://www.jianshu.com/p/509c78602ed2
    https://stackoverflow.com/questions/12350248/java-difference-between-filewriter-and-bufferedwriter

    相关文章

      网友评论

        本文标题:Java文件流相关

        本文链接:https://www.haomeiwen.com/subject/zhomuqtx.html