美文网首页程序员
java有几种文件拷贝方式?哪一种最高效?

java有几种文件拷贝方式?哪一种最高效?

作者: 小强的进阶之路 | 来源:发表于2018-06-04 13:32 被阅读24次

    java有几种文件拷贝方式?哪一种最高效?

    java有多重比较典型的文件拷贝实现方式:
    1、利用java.io.类库,直接为源文件构建一个FileInputStream读取,然后再为目标文件构建一个FileOutputStream,完成写入工作

    public static void copyFileByStream(File source, File dest) throws
            IOException {
        try (InputStream is = new FileInputStream(source);
             OutputStream os = new FileOutputStream(dest);){
            byte[] buffer = new byte[1024];
            int length;
            while ((length = is.read(buffer)) > 0) {
                os.write(buffer, 0, length);
            }
        }
     }
    

    2、利用java.nio类库提供的transferTo或transferFrom方式实现

    public static void copyFileByChannel(File source, File dest) throws
            IOException {
        try (FileChannel sourceChannel = new FileInputStream(source)
                .getChannel();
             FileChannel targetChannel = new FileOutputStream(dest).getChannel
                     ();){
            for (long count = sourceChannel.size() ;count>0 ;) {
                long transferred = sourceChannel.transferTo(
                        sourceChannel.position(), count, targetChannel);            sourceChannel.position(sourceChannel.position() + transferred);
                count -= transferred;
            }
        }
     }
    

    java标准类库本身提供了几种Files.copy的实现
    对于copy的效率,这个其实与操作系统和配置等情况相关,总体来说,NIO transferTo/From的方式可能更快,因为他更能利用现代操作系统底层机制,避免不要拷贝和上下文切换。

    拷贝实现机制分析

    操作系统包含用户态空间和内核态空间,操作系统内核、硬件驱动运行在内核态空间,具有较高的特权;而用户空间,则是给普通应用和服务使用。
    当使用输入输出流进行读写时,实际上进行了多次上下文切换,比如应用读取数据时,先在内核态将数据从磁盘读取到内核缓存,在切换到用户态将数据从内核缓存读取到用户缓存。


    IO

    所以,这种方式会带来一定的额外开销,可能会降低 IO 效率。
    而基于NIO transferTo的实现方式,在Linux和Unix上,则会使用零拷贝技术,数据传输并不需要用户态参与,省去上下文切换的开销和不必要的内存拷贝,进而可能提高应用拷贝性能。注意,transferTo 不仅仅是可以用在文件拷贝中,与其类似的,例如读取磁盘文件,然后进行 Socket 发送,同样可以享受这种机制带来的性能和扩展性提高。


    NIO

    NIO Buffer

    buffer是NIO操作数据的基本工具,java为每种数据类型都提供了相应的buffer实现(布尔除外)


    基本数据类型buffer

    Buffer 有几个基本属性:

    • capcity:它反映这个buffer到底多大,也就是数据长度
    • postion:要操作的数据起始位置
    • limit:相当于操作的限额,在读取或者写入时,limit 的意义很明显是不一样的。比如,读取操作时,很可能将 limit 设置到所容纳数据的上限;而在写入时,则会设置容量或容量以下的可写限度。
    • mark,记录上一次postion的位置,默认是0

    相关文章

      网友评论

        本文标题:java有几种文件拷贝方式?哪一种最高效?

        本文链接:https://www.haomeiwen.com/subject/gxoesftx.html