对于docx文件获取总页数试了很多种方式,大多数都不能准确获取对应的页数,记录一下自己是怎么解决这个问题的
/**
* xdocreport 模板 docx
* 描述:获取DOCX的总页数 - 嵌入图片和文字样式 - 导致页数不准确
* 1:docx4j - 失败 (失真)31 -> 27
* 2:虚拟打印机 - Spire.Doc for Java (windows 31 -> 31)(centos抛出环境运行异常)
* https://jingyan.baidu.com/article/4f7d571224dae91a201927d1.html
* 3:open office (失真) 31 -> 27
* https://www.cnblogs.com/bb1008/p/10019576.html
* 4:centos cups-pdf虚拟打印机 (失败,31 -> 1)
* lp -d Cups-PDF /root/桌面/sss.docx
* pdf 目录位置:/var/spool/cups-pdf/$USER
* vi /etc/cups/cups-pdf.conf #{
* Out ${HOME}/urd/pdf
* 5:libreoffice (失败 is not assignable to 内存溢出)
* cd D:\Program Files\LibreOffice4\program
* soffice --accept="socket,host=127.0.0.1,port=8100;urp;" --nofirststartwizard
* 6:aspose jar (失真 31 -> 27)
* 7:xdocreport.converter.docx.xwpf (成功, 31 -> 31 虽然样式乱了,总页数未受到样式和图片的影响,未产生页数不一致的情况)
* 总结:获取 docx 的页数 需采用 xdocreport.converter.docx.xwpf 方式获取
* -- 上传类型什么就下载什么类型,若是 docx 需要转换给 客户,建议使用 spire doc 走 windows + PDF Architect 虚拟打印机方式
* #}
* @version : Ver 1.0
* @date : 14/06/2018 16:25
*/
public static int getDocxPageCount(String filePath, String outPath) {
try {
InputStream in =new FileInputStream(new File(filePath));
XWPFDocument document =new XWPFDocument(in);
PdfOptions options = PdfOptions.create();
OutputStream out =new FileOutputStream(new File(outPath));
PdfConverter.getInstance().convert(document, out, options);
return getPDFPageCount(outPath);
}catch (Exception e) {
LOGGER.error(e.getMessage(), e);
throw new GeneralException("docx read error!");
}
}
网友评论