说来话长,接到一个需求,要把word里的内容直接复制到富文本中,样式还要几乎和word中一样,这可愁坏了。尝试了很多扩展均被劝退了。
phpword按理来说office 非常可用,但是还要给PHP安装zip扩展,安完后有时还报错,读不出word内容,后来发现它对 doc和docx格式的解析有点问题。
qcloudsms_php 其实是一很好用的扩展,但不知为什么在转文件时会有奇怪的报错,不过我最后解决问题的办法也来自于此,在看了他的源码后有重大发现
正文来了:libreoffice
就是这个工具完全免费,win、linux、mac 都可以安装,能过命令行的方式在多种文件格式中任意转换。
Mac下安装 Libreoffice
Mac 下,可直接从官网下载 Mac 下的软件包进行一键安装。或者用 brew 命令一键安装:
[sudo] brew install libreoffice
检测是否安装成功
在终端执行如下命令,查看版本号,能查到版本号,即表示安装成功。
soffice --version
Ubuntu安装命令
[sudo] apt install libreoffice
apt-get install libreoffice-writer
如果转换后文件存在乱码:
- 查看字符编码是否支持,比如 gbk 或者 utf-8 等
- 是否缺少相应的中文字体库。如 ubuntu 下,可以使用如下的方式进行安装:
[sudo] apt install ttf-wqy-zenhei
[sudo] apt install fonts-wqy-microhei
cnetos安装命令
yum install -y libreoffice
Windows下安装Libreoffice
- 双击下载下来的 Libreoffice 程序,全部使用默认安装的方式进行安装,直接点击“下一步”安装完成。
- 将Libreoffice 加入到 Windows系统环境 Path 变量。
- 默认Windows的安装路径是:
C:\Program Files\LibreOffice
加入到系统环境变量中的 Path 变量值:
C:\Program Files\LibreOffice\program
转换命令-其它文档命令
先进入到要转换的文件目录(路径可以自己变换)下面是在mac下执行
word 转 html
soffice --headless --convert-to html ./转换后存储路径 ./被转换文件.doc
html 转 word
soffice --invisible --headless --convert-to docx:"Office Open XML Text" ./被转换文件.html
soffice --headless --invisible --convert-to pdf:writer_pdf_Export D:\logs\xxx.docx --outdir D:\logs
soffice --headless --invisible --convert-to “html:XHTML Writer File:UTF8” D:\logs\xxx.docx --outdir D:\logs
soffice --headless --invisible --convert-to “html:XHTML Writer File:UTF8” D:\logs\xxx.docx --convert-images-to “jpg” --outdir D:\logs
soffice --headless --invisible --convert-to html:impress_html_Export D:\logs\xxx.docx --convert-images-to “jpg” --outdir D:\logs
soffice --headless --invisible --convert-to html D:\logs\xxx.xlsx --outdir D:\logs
soffice --headless --invisible --convert-to pdf:writer_pdf_Export D:\logs\xxx.xlsx --outdir D:\logs
soffice --headless --invisible --convert-to “html:XHTML Writer File:UTF8” D:\logs\xxx-v1.pdf --outdir D:\logs
soffice --headless --invisible --convert-to html D:\logs\test111.xlsx --outdir D:\logs
soffice --headless --invisible --convert-to pdf:writer_pdf_Export D:\logs\测试ppt1.ppt --outdir D:\logs
soffice --headless --invisible --convert-to html “D:\logs\第7章xxx.ppt” --outdir D:\logs
最后的倔强
- 引入三个包
$ composer require h4cc/wkhtmltopdf-amd64
$ composer require h4cc/wkhtmltoimage-amd64
$ composer require barryvdh/laravel-snappy
- 安装包成功后,在config/app.php文件中配置service providers和aliaces
'providers' => [
....
Barryvdh\Snappy\ServiceProvider::class,
],
'aliases' => [
....
'PDF' => Barryvdh\Snappy\Facades\SnappyPdf::class,
'SnappyImage' => Barryvdh\Snappy\Facades\SnappyImage::class,
]
- 在config目录生成snappy.php配置文件
$ php artisan vendor:publish --provider="Barryvdh\Snappy\ServiceProvider"
- 配置如下:
<?php
return [
'pdf' => [
'enabled' => true,
'binary' => "/usr/local/bin/wkhtmltopdf",
// 'binary' => base_path('vendor/h4cc/wkhtmltopdf-amd64/bin/wkhtmltopdf-amd64'),
'timeout' => false,
'options' => [],
'env' => [],
],
'image' => [
'enabled' => true,
'binary' => "/usr/local/bin/wkhtmltoimage",
// 'binary' => base_path('vendor/h4cc/wkhtmltoimage-amd64/bin/wkhtmltoimage-amd64'),
'timeout' => false,
'options' => [],
'env' => [],
],
];
把vendor目录下的命令移动到usr/local/bin下
- mac 电脑特殊一些,去这里下载 macOS 并安装
cp vendor/h4cc/wkhtmltoimage-amd64/bin/wkhtmltoimage-amd64 /usr/local/bin/
cp vendor/h4cc/wkhtmltopdf-amd64/bin/wkhtmltopdf-amd64 /usr/local/bin/
- 完成后执行以下命令尝试运行是否正常
$ wkhtmltopdf -V
laravel 中使用
$header = "<meta http-equiv='Content-Type' content='text/html; charset=utf-8'/>";
$html = file_get_contents(storage_path('app/public/qwe.html'));
$pdf = App::make('snappy.pdf.wrapper');
$pdf->loadHTML($header . $html)->setPaper('a4');
$options = [
'footer-font-size' => 8,
'footer-right' => '[page]',
'footer-spacing' => 5,
'page-size' => 'A4',
'minimum-font-size' => 24,
'margin-top' => 24,
'margin-bottom' => 24,
'margin-left' => 12,
'margin-right' => 12,
'disable-smart-shrinking' => false,
'disable-internal-links' => false,
];
$pdf->setOptions($options)->save(storage_path('app/public/qwe.pdf'));
wkhtmltopdf 有很多参数设置参考
wkhtmltopdf [OPTIONS]... <input file> [More input files] <output file>
常规选项
--allow <path> 允许加载从指定的文件夹中的文件或文件(可重复)
--book* 设置一会打印一本书的时候,通常设置的选项
--collate 打印多份副本时整理
--cookie <name> <value> 设置一个额外的cookie(可重复)
--cookie-jar <path> 读取和写入的Cookie,并在提供的cookie jar文件
--copies <number> 复印打印成pdf文件数(默认为1)
--cover* <url> 使用HTML文件作为封面。它会带页眉和页脚的TOC之前插入
--custom-header <name> <value> 设置一个附加的HTTP头(可重复)
--debug-javascript 显示的javascript调试输出
--default-header* 添加一个缺省的头部,与页面的左边的名称,页面数到右边,例如: --header-left '[webpage]' --header-right '[page]/[toPage]' --header-line
--disable-external-links* 禁止生成链接到远程网页
--disable-internal-links* 禁止使用本地链接
--disable-javascript 禁止让网页执行JavaScript
--disable-pdf-compression* 禁止在PDF对象使用无损压缩
--disable-smart-shrinking* 禁止使用WebKit的智能战略收缩,使像素/ DPI比没有不变
--disallow-local-file-access 禁止允许转换的本地文件读取其他本地文件,除非explecitily允许用 --allow
--dpi <dpi> 显式更改DPI(这对基于X11的系统没有任何影响)
--enable-plugins 启用已安装的插件(如Flash
--encoding <encoding> 设置默认的文字编码
--extended-help 显示更广泛的帮助,详细介绍了不常见的命令开关
--forms* 打开HTML表单字段转换为PDF表单域
--grayscale PDF格式将在灰阶产生
--help Display help
--htmldoc 输出程序HTML帮助
--ignore-load-errors 忽略claimes加载过程中已经遇到了一个错误页面
--lowquality 产生低品质的PDF/ PS。有用缩小结果文档的空间
--manpage 输出程序手册页
--margin-bottom <unitreal> 设置页面下边距 (default 10mm)
--margin-left <unitreal> 将左边页边距 (default 10mm)
--margin-right <unitreal> 设置页面右边距 (default 10mm)
--margin-top <unitreal> 设置页面上边距 (default 10mm)
--minimum-font-size <int> 最小字体大小 (default 5)
--no-background 不打印背景
--orientation <orientation> 设置方向为横向或纵向
--page-height <unitreal> 页面高度 (default unit millimeter)
--page-offset* <offset> 设置起始页码 (default 1)
--page-size <size> 设置纸张大小: A4, Letter, etc.
--page-width <unitreal> 页面宽度 (default unit millimeter)
--password <password> HTTP验证密码
--post <name> <value> Add an additional post field (repeatable)
--post-file <name> <path> Post an aditional file (repeatable)
--print-media-type* 使用的打印介质类型,而不是屏幕
--proxy <proxy> 使用代理
--quiet Be less verbose
--read-args-from-stdin 读取标准输入的命令行参数
--readme 输出程序自述
--redirect-delay <msec> 等待几毫秒为JS-重定向(default 200)
--replace* <name> <value> 替换名称,值的页眉和页脚(可重复)
--stop-slow-scripts 停止运行缓慢的JavaScripts
--title <text> 生成的PDF文件的标题(第一个文档的标题使用,如果没有指定)
--toc* 插入的内容的表中的文件的开头
--use-xserver* 使用X服务器(一些插件和其他的东西没有X11可能无法正常工作)
--user-style-sheet <url> 指定用户的样式表,加载在每一页中
--username <username> HTTP认证的用户名
--version 输出版本信息退出
--zoom <float> 使用这个缩放因子 (default 1)
页眉和页脚选项
--header-center* <text> (设置在中心位置的页眉内容)
--header-font-name* <name> (default Arial) (设置页眉的字体名称)
--header-font-size* <size> (设置页眉的字体大小)
--header-html* <url> (添加一个HTML页眉,后面是网址)
--header-left* <text> (左对齐的页眉文本)
--header-line* (显示一条线在页眉下)
--header-right* <text> (右对齐页眉文本)
--header-spacing* <real> (设置页眉和内容的距离,默认0)
--footer-center* <text> (设置在中心位置的页脚内容)
--footer-font-name* <name> (设置页脚的字体名称)
--footer-font-size* <size> (设置页脚的字体大小default 11)
--footer-html* <url> (添加一个HTML页脚,后面是网址)
--footer-left* <text> (左对齐的页脚文本)
--footer-line* 显示一条线在页脚内容上)
--footer-right* <text> (右对齐页脚文本)
--footer-spacing* <real> (设置页脚和内容的距离)
./wkhtmltopdf --footer-right '[page]/[topage]' http://www.baidu.com baidu.pdf
./wkhtmltopdf --header-center '报表' --header-line --margin-top 2cm --header-line http://192.168.212.139/oma/ oma.pdf
表内容选项中
--toc-depth* <level> Set the depth of the toc (default 3)
--toc-disable-back-links* Do not link from section header to toc
--toc-disable-links* Do not link from toc to sections
--toc-font-name* <name> Set the font used for the toc (default Arial)
--toc-header-font-name* <name> The font of the toc header (if unset use --toc-font-name)
--toc-header-font-size* <size> The font size of the toc header (default 15)
--toc-header-text* <text> The header text of the toc (default Table Of Contents)
--toc-l1-font-size* <size> Set the font size on level 1 of the toc (default 12)
--toc-l1-indentation* <num> Set indentation on level 1 of the toc (default 0)
--toc-l2-font-size* <size> Set the font size on level 2 of the toc (default 10)
--toc-l2-indentation* <num> Set indentation on level 2 of the toc (default 20)
--toc-l3-font-size* <size> Set the font size on level 3 of the toc (default 8)
--toc-l3-indentation* <num> Set indentation on level 3 of the toc (default 40)
--toc-l4-font-size* <size> Set the font size on level 4 of the toc (default 6)
--toc-l4-indentation* <num> Set indentation on level 4 of the toc (default 60)
--toc-l5-font-size* <size> Set the font size on level 5 of the toc (default 4)
--toc-l5-indentation* <num> Set indentation on level 5 of the toc (default 80)
--toc-l6-font-size* <size> Set the font size on level 6 of the toc (default 2)
--toc-l6-indentation* <num> Set indentation on level 6 of the toc (default 100)
--toc-l7-font-size* <size> Set the font size on level 7 of the toc (default 0)
--toc-l7-indentation* <num> Set indentation on level 7 of the toc (default 120)
--toc-no-dots* Do not use dots, in the toc
轮廓选项
--dump-outline <file> 转储目录到一个文件
--outline 显示目录(文章中h1,h2来定)
--outline-depth <level> 设置目录的深度(默认为4)
页脚和页眉
* [page] 由当前正在打印的页的数目代替
* [frompage] 由要打印的第一页的数量取代
* [topage] 由最后一页要打印的数量取代
* [webpage] 通过正在打印的页面的URL替换
* [section] 由当前节的名称替换
* [subsection] 由当前小节的名称替换
* [date] 由当前日期系统的本地格式取代
* [time] 由当前时间,系统的本地格式取代
./wkhtmltopdf --footer-right '[page]/[topage]' http://www.baidu.com baidu.pdf
./wkhtmltopdf --header-center '报表' --outline --header-line --margin-top 2cm --header-line http://www.hao123.com/ hao123.pdf
./wkhtmltopdf --header-left '[webpage]' --footer-center '测试([page]/[toPage])' http://www.baidu.com baidu.pdf
网友评论