美文网首页
tomcat真正做到零拷贝文件下载的使用方式及原理解析

tomcat真正做到零拷贝文件下载的使用方式及原理解析

作者: 江江的大猪 | 来源:发表于2023-09-12 20:54 被阅读0次

前言

  • 本文所说的零拷贝指的是操作系统层面的零拷贝,不是应用层自身对数据复制优化的零拷贝
  • 本文对零拷贝在操作系统层面上的原理不做说明,解释零拷贝原理的文章已经有很多
  • netty常说的零拷贝有两种,一方面是应用层ByteBuf的数据复制优化,一方面是FileRegion,只有FileRegion才是操作系统层面的零拷贝
  • 零拷贝需要操作系统的系统调用支持,linux中是mmap和sendfile两种系统调用,java中对应的是FileChannel.map()和FileChannel.transferTo(),如果操作系统不支持,在java中调用这两个方法也不是真正的零拷贝
  • java零拷贝的基本只存在于文件上传、文件下载、网络代理这三种应用场景,本文仅讨论文件下载,其他两种情况可以举一反三
  • 文件下载依赖FileChannel.transferTo()实现真正的零拷贝
  • 目前能查到的java tomcat工程中零拷贝的应用示例基本都是错的,比如https://www.springcloud.io/post/2022-03/zero-copy/https://springboot.io/t/topic/2147

使用tomcat普通文件下载的正确姿势(性能差,容易oom)

    @PostMapping("download")
    public ResponseEntity<byte[]> download() throws IOException {
        String filePath = "xxx";
        String fileName = "xxx";
        Path file = Paths.get(filePath);
        byte[] bytes = FileUtils.readFileToByteArray(file.toFile());
        String contentType = Files.probeContentType(file);
        if (contentType == null) {
            contentType = MediaType.APPLICATION_OCTET_STREAM_VALUE;
        }
        HttpHeaders headers = new HttpHeaders();
        headers.setContentType(MediaType.parseMediaType(contentType));
        headers.setContentDisposition(ContentDisposition.attachment().filename(fileName, Charsets.UTF_8).build());
        return ResponseEntity.ok().headers(headers).body(bytes);
    }

使用tomcat实现零拷贝文件下载的正确姿势

    @PostMapping("zeroCopyDownload")
    public void zeroCopyDownload(HttpServletRequest request, HttpServletResponse response) throws IOException {
        String filePath = "xxx";
        String fileName = "xxx";
        if (!Boolean.parseBoolean(request.getAttribute(Constants.SENDFILE_SUPPORTED_ATTR).toString())) {
            throw new MyException("unsupported");
        }
        Path file = Paths.get(filePath);
        String contentType = Files.probeContentType(file);
        if (contentType == null) {
            contentType = MediaType.APPLICATION_OCTET_STREAM_VALUE;
        }
        response.setContentType(contentType);
        response.setContentLengthLong(file.toFile().length());
        response.setHeader(HttpHeaders.CONTENT_DISPOSITION, ContentDisposition.attachment().filename(fileName, Charsets.UTF_8).build().toString());
        // 通过start/end可以实现零拷贝分片下载
        // 请求域attribute参数详见 https://tomcat.apache.org/tomcat-10.1-doc/api/org/apache/coyote/Constants.html
        request.setAttribute(Constants.SENDFILE_FILENAME_ATTR, filePath);
        request.setAttribute(Constants.SENDFILE_FILE_START_ATTR, 0L);
        request.setAttribute(Constants.SENDFILE_FILE_END_ATTR, file.toFile().length());
    }

    // tomcat源码Http11Processor.prepareSendfile如下,使用上面设置的attribute构建sendfileData
    private void prepareSendfile(OutputFilter[] outputFilters) {
        String fileName = (String) request.getAttribute(org.apache.coyote.Constants.SENDFILE_FILENAME_ATTR);
        if (fileName == null) {
            sendfileData = null;
        } else {
            // No entity body sent here
            outputBuffer.addActiveFilter(outputFilters[Constants.VOID_FILTER]);
            contentDelimitation = true;
            long pos = ((Long) request.getAttribute(org.apache.coyote.Constants.SENDFILE_FILE_START_ATTR)).longValue();
            long end = ((Long) request.getAttribute(org.apache.coyote.Constants.SENDFILE_FILE_END_ATTR)).longValue();
            sendfileData = socketWrapper.createSendfileData(fileName, pos, end - pos);
        }
    }

    // tomcat源码NioEndpoint.processSendfile简略版如下,调用transferTo将sendfileData传输到SocketChannel中
    public SendfileState processSendfile(SelectionKey sk, NioEndpoint.NioSocketWrapper socketWrapper, boolean calledByProcessor) {
        NioEndpoint.SendfileData sd = socketWrapper.getSendfileData();
        NioChannel sc = socketWrapper.getSocket();
        // TLS/SSL channel is slightly different,https因为一定要把数据读取到应用侧校验,所以无法使用零拷贝
        WritableByteChannel wc = ((sc instanceof SecureNioChannel) ? sc : sc.getIOChannel());
        long written = sd.fchannel.transferTo(sd.pos, sd.length, wc);
        if (written > 0) {
            sd.pos += written;
            sd.length -= written;
            socketWrapper.updateLastWrite();
        }
    }

使用tomcat文件下载的常见错误做法

Channels.newChannel()创建出来的是WritableByteChannelImpl对象,零拷贝传输并不支持该类型

    @PostMapping("download")
    public void download(HttpServletResponse response) throws IOException {
        String filePath = "xxx";
        String fileName = "xxx";
        Path file = Paths.get(filePath);
        String contentType = Files.probeContentType(file);
        if (contentType == null) {
            contentType = MediaType.APPLICATION_OCTET_STREAM_VALUE;
        }
        try (FileChannel fileChannel = FileChannel.open(file)) {
            WritableByteChannel outChannel = Channels.newChannel(response.getOutputStream());
            long size = fileChannel.size();
            response.setContentType(contentType);
            response.setContentLengthLong(size);
            response.setHeader(HttpHeaders.CONTENT_DISPOSITION, ContentDisposition.attachment().filename(fileName, Charsets.UTF_8).build().toString());
            for (long position = 0; position < size; ) {
                position = position + fileChannel.transferTo(position, size - position, outChannel);
            }
        }
    }

FileChannel.transferTo的实现解析(sun.nio.ch.FileChannelImpl中实现)

就不详细看代码了,只看主体逻辑,这里也能解释为什么说上面那种调用fileChannel.transferTo的方法并不是零拷贝,因为目标channel是WritableByteChannelImpl,最终只会调用到transferToArbitraryChannel

transferTo方法中会依次尝试调用下面三个方法
// 仅支持目标channel是FileChannel和SelChImpl(SocketChannel、ServerSocketChannel)
// 最终调用native方法transferTo0,不同操作系统实现不一样
transferToDirectly();
// 仅支持目标channel是FileChannel
// 调用FileChannel的map方法最终调用native方法map0获得MappedByteBuffer,然后写入
transferToTrustedChannel();
// 最普通的做法,现在应用侧读取文件内容再写入,
transferToArbitraryChannel();

transferTo0的native实现解析(以jdk8为例)

可以看到linux和mac是支持的(也无法保证每个版本都支持),window不支持。这也体现了即使使用了正确的目标channel类型,可以最终调用到transferTo0的native方法也无法保证一定是零拷贝,还要看运行的操作系统是否支持

// *nux实现https://github.com/openjdk/jdk/blob/jdk8-b120/jdk/src/solaris/native/sun/nio/ch/FileChannelImpl.c
Java_sun_nio_ch_FileChannelImpl_transferTo0(JNIEnv *env, jobject this,
                                            jint srcFD,
                                            jlong position, jlong count,
                                            jint dstFD)
{
#if defined(__linux__)
    // 省略
    jlong n = sendfile64(dstFD, srcFD, &offset, (size_t)count);
#elif defined (__solaris__)
    // 省略
    result = sendfilev64(dstFD, &sfv, 1, &numBytes);
#elif defined(__APPLE__)
    // 省略
    result = sendfile(srcFD, dstFD, position, &numBytes, NULL, 0);
#else
    return IOS_UNSUPPORTED_CASE;
#endif
// windows实现https://github.com/openjdk/jdk/blob/jdk8-b120/jdk/src/windows/native/sun/nio/ch/FileChannelImpl.c
Java_sun_nio_ch_FileChannelImpl_transferTo0(JNIEnv *env, jobject this,
                                            jint srcFD,
                                            jlong position, jlong count,
                                            jint dstFD)
{
    return IOS_UNSUPPORTED;
}

总结

  • 只有使用正确的目标channel(FileChannel/SelChImpl的实现类),运行在支持的操作系统上,我们的java代码才可以真正的零拷贝实现文件下载
  • 并不建议使用tomcat来做真正的文件服务(当然如果文件较小,请求量不大也可以用),开发者无法控制文件的读取写入,完全被tomcat托管了。真正的文件服务还是推荐用netty自己开发,可以保证文件读取写入的完全可控 ,用好netty的FileRegion
  • 大多数开发者仅仅是在操作系统层面了解零拷贝的原理,实际应用中因为不了解jvm对系统调用的包装,会想当然的误以为只要调用了FileChannel的transferTo方法就一定是零拷贝。https://www.springcloud.io/post/2022-03/zero-copy/https://springboot.io/t/topic/2147 这两个文章可能误导了非常多人

相关文章

  • 零拷贝原理-中断和DMA

    为何要懂零拷贝原理?因为rocketmq存储核心使用的就是零拷贝原理。 io读写的方式中断DMA 中断方式中断方式...

  • NSURLSession

    使用步骤: Task: 下载文件: 代理的方式: 大文件下载: 文件暂停和恢复: 断点下载原理: 如果下载中途失败...

  • SSH框架面试题集锦

    Hibernate工作原理及为什么要使用Hibernate? 工作原理: 1.读取并解析配置文件 2.读取并解析映...

  • tomcat

    搭建Tomcat源码项目 下载tomcat源代码 下载地址 编写一个pom.xml 文件,给Tomcat使用。

  • ViewModel 使用及原理解析

    ViewModel 使用及原理解析

  • Java面试题(SSH框架面试题集锦)

    1, Hibernate工作原理及为什么要使用Hibernate? 工作原理: 1.读取并解析配置文件 2.读取并...

  • jenkins war 包部署

    1、将war文件拷贝到tomcat目录/webapps/ 下。 2、将必要的jar文件拷贝到tomcat目录/li...

  • 10 android网络编程

    HTTP请求方式:HttpURLConnection XML数据解析 JSON数据解析 文件上传 文件下载 调用 ...

  • 报表项目bug修复记录

    文件流解析(blob) 问题: 下载的表格文件打不开, 使用/ueff方式强制打开后也是乱码解决: 在axios的...

  • 文件快速拷贝-reflink

    REFLINK是实现文件快速拷贝的基础。 最初实现文件快速拷贝的方式是使用hardlinks。但是这样的方式存在很...

网友评论

      本文标题:tomcat真正做到零拷贝文件下载的使用方式及原理解析

      本文链接:https://www.haomeiwen.com/subject/oxkuvdtx.html