使用PDFParser解析PDF中的文字

使用PDFParser解析PDF中的文字

作者: 提莫小小队长 | 来源:发表于2018-05-22 14:43 被阅读0次

使用PDFParser解析PDF中的文字
开源PDF开发工具PDFbox & Itext
如何编辑PDF文件
python 解析PDF--相关组件
PDFBox
Android PDF阅读器插件
2017.6.20
《解析深度学习语音识别实践.pdf》PDF高清完整版-免费下载
怎么修改PDF文件的文字内容
《Web渗透技术及实战案例解析.pdf》PDF高清完整版-免费下

官方文档（文档很清晰，建议直接看官方文档）
https://www.pdfparser.org/documentation

安装

composer require smalot/pdfparser

安装完成之后，在入口文件引入自动加载文件

include 'vendor/autoload.php';  //根据自己入口文件的路径合理配置

使用方法

<?php
 
// Include Composer autoloader if not already done.
include 'vendor/autoload.php';
 
// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('document.pdf');
 
$text = $pdf->getText();
echo $text;
 
?>

如何获取指定页的内容

$parser = new \Smalot\PdfParser\Parser();       
// 调用解析方法，参数为pdf文件路径，返回结果为Document类对象
$document = $parser->parseFile('238.PDF');
// 获取所有的页
$pages = $document->getPages();
//$pages[0]->getText();  //提取第一页的内容，想提取多页，可以按照下面的方法，用$key来控制要获取的页数
// 逐页提取文本
foreach($pages as $key=>$page){
    if($key === 0){
        //提取第一页的内容
        echo $pages[$key]->getText();  
    }
}

相关文章

使用PDFParser解析PDF中的文字
官方文档（文档很清晰，建议直接看官方文档）https://www.pdfparser.org/documentat...
开源PDF开发工具PDFbox & Itext
1、前言 PDFbox 和 Itext都能读取、解析pdf文件，并且修改。使用建议：在读取和解析PDF的时候使...
如何编辑PDF文件
使用旋风PDF编辑器，您可以编辑更改以前创建的PDF文档中的文本。可以对PDF文字进行增删改查，移动文字位置，修改...
python 解析PDF--相关组件
使用pdfplumber框架解析pdf，具备提取表格的功能 PDF详细资料https://smallpdf.com...
PDFBox
解析PDF中的表格从现有的PDF文档中提取文本提取文本是PDFBox的主要功能之一。可以使用PDFTextS...
Android PDF阅读器插件
万能pdf解析库，支持pdf流式，版式的解析．前言：googlesdk提供了pdf解析的类PdfDocument...
2017.6.20
python 解析 md 文件 -> html文件 python画图表->PDF，使用 reportlab 提供的...
《解析深度学习语音识别实践.pdf》PDF高清完整版-免费下载
《解析深度学习语音识别实践.pdf》PDF高清完整版-免费下载《解析深度学习语音识别实践.pdf》PDF高清...
怎么修改PDF文件的文字内容
怎么修改PDF文件中的文字内容呢？现在很多的PDF文件中的文字需要进行修改，但是找不到修改PDF文件的软件，想要修...
《Web渗透技术及实战案例解析.pdf》PDF高清完整版-免费下
《Web渗透技术及实战案例解析.pdf》PDF高清完整版-免费下载《Web渗透技术及实战案例解析.pdf》PDF...

网友评论

本文标题：使用PDFParser解析PDF中的文字

本文链接：https://www.haomeiwen.com/subject/riwhjftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|使用PDFParser解析PDF中的文字|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！