Java面对office转pdf这种需求,大多采用POI、pdfbox等工具进行转换,转换精度和效率取决于相关工具的支持程度,难免有些样式不符、错位等现象,如果需要完全一致的office转pdf的体验,还是得依赖office软件,目前OpenOffice和Libreoffice均提供了对应的命令行工具来实现office文件转pdf。本文介绍Libreoffice转pdf的方法及java调用Libreoffice命令行的方法。
一、安装Libreoffice
windows:直接下载Libreoffice
下载 LibreOffice | LibreOffice 简体中文官方网站 - 自由免费的办公套件
centos:使用yum安装:
yum install -y libreoffice
alpine:使用apk安装:
apk add libreoffice
其他操作系统可以参考官方安装说明或自行搜索安装方法。
注意,windows在安装完成之后,找到libreoffice安装目录,将对应目录加入PATH参数,一般安装位置在C:\Program Files\LibreOffice\program
,添加入PATH和JDK添加PATH一样的操作:
安装/配置完成后,在命令行中输入soffice --help
,确认该命令行可以使用:
二、Libreoffice转换Office到PDF的命令
soffice --invisible --convert-to pdf --outdir "输出文件夹" "PDF文件所在位置"
例如:
soffice --invisible --convert-to pdf --outdir "/home/pdfconvertor/result/" "/home/pdfconvertor/pdf/1.docx"
执行后,会在输出文件夹下生成与源文件名同名的pdf文件(文件后缀会改为pdf),如上面的例子,输出文件为/home/pdfconvertor/result/1.pdf
三、Java调用命令行转换为PDF
添加Commons-exec依赖:
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-exec</artifactId>
<version>${commons-exec.version}</version>
</dependency>
进行转换:
public static File convert(File officeFile) throws Exception {
DefaultExecutor exec = new DefaultExecutor();
File tempFolder = new File(System.getProperty("java.io.tmpdir"), "office2pdf-" + UUID.randomUUID());
// 同步等待
Semaphore semaphore = new Semaphore(1);
semaphore.acquire();
ExecuteResultHandler erh = new ExecuteResultHandler() {
@Override
public void onProcessComplete(int i) {
semaphore.release();
//转换完成逻辑
}
@Override
public void onProcessFailed(ExecuteException e) {
semaphore.release();
//转换失败逻辑
e.printStackTrace();
}
};
String command = "soffice --invisible --convert-to pdf --outdir \"" + tempFolder.getAbsolutePath() + "\" \"" + officeFile.getAbsolutePath() + "\"";
System.out.println("执行office文件转换任务,命令为" + command);
exec.execute(CommandLine.parse(command), erh);
// 等待执行完成
semaphore.acquire();
File file = new File(tempFolder.getAbsolutePath() + File.separator + officeFile.getName().substring(0, officeFile.getName().indexOf(".")) + ".pdf");
if (!file.exists()) {
// 转换失败逻辑
}
return file;
}
四、字体相关问题
因Libreoffice转换会依赖本地字体,因此如果部署在服务器上使用时,没有对应的字体会造成字体异常,此时需要在服务器上安装对应的字体。
centos上解决方法如下:
拷贝常用的字体文件到linux的字体文件夹/usr/share/fonts
刷新字体缓存fc-cache -fv
随后重启应用即可。
网友评论