美文网首页
java 获取 word docx 总页数

java 获取 word docx 总页数

作者: feiai | 来源:发表于2019-10-23 20:08 被阅读0次

    对于docx文件获取总页数试了很多种方式,大多数都不能准确获取对应的页数,记录一下自己是怎么解决这个问题的

    /**

    * xdocreport 模板 docx

    * 描述:获取DOCX的总页数 - 嵌入图片和文字样式 - 导致页数不准确

    * 1:docx4j - 失败 (失真)31 -> 27

    * 2:虚拟打印机 - Spire.Doc for Java (windows 31 -> 31)(centos抛出环境运行异常)

    * https://jingyan.baidu.com/article/4f7d571224dae91a201927d1.html

    * 3:open office (失真) 31 -> 27

    * https://www.cnblogs.com/bb1008/p/10019576.html

    * 4:centos cups-pdf虚拟打印机 (失败,31 -> 1)

    * lp -d Cups-PDF /root/桌面/sss.docx

    * pdf 目录位置:/var/spool/cups-pdf/$USER

    * vi /etc/cups/cups-pdf.conf #{

    * Out ${HOME}/urd/pdf

    * 5:libreoffice (失败 is not assignable to 内存溢出)

    * cd D:\Program Files\LibreOffice4\program

    * soffice --accept="socket,host=127.0.0.1,port=8100;urp;" --nofirststartwizard

    * 6:aspose jar (失真 31 -> 27)

    * 7:xdocreport.converter.docx.xwpf (成功, 31 -> 31 虽然样式乱了,总页数未受到样式和图片的影响,未产生页数不一致的情况)

    * 总结:获取 docx 的页数 需采用 xdocreport.converter.docx.xwpf 方式获取

    * -- 上传类型什么就下载什么类型,若是 docx 需要转换给 客户,建议使用 spire doc 走 windows + PDF Architect 虚拟打印机方式

    * #}

    * @version : Ver 1.0

    * @date : 14/06/2018 16:25

    */

    public static int getDocxPageCount(String filePath, String outPath) {

    try {

    InputStream in =new FileInputStream(new File(filePath));

            XWPFDocument document =new XWPFDocument(in);

            PdfOptions options = PdfOptions.create();

            OutputStream out =new FileOutputStream(new File(outPath));

            PdfConverter.getInstance().convert(document, out, options);

            return getPDFPageCount(outPath);

        }catch (Exception e) {

    LOGGER.error(e.getMessage(), e);

            throw new GeneralException("docx read error!");

        }

    }

    相关文章

      网友评论

          本文标题:java 获取 word docx 总页数

          本文链接:https://www.haomeiwen.com/subject/hxqlvctx.html