美文网首页
java 解析pdf 表格

java 解析pdf 表格

作者: 唐植超 | 来源:发表于2020-05-21 17:05 被阅读0次

不啰嗦太多,直接上步骤

  1. pom引入 参见:https://github.com/rostrovsky/pdf-table
<dependency>
  <groupId>com.github.rostrovsky</groupId>
  <artifactId>pdf-table</artifactId>
  <version>1.0.0</version>
</dependency>
  1. 示例代码
         String file = "D:/test.pdf";
        //加载pdf文件
        PDDocument pdfDoc = PDDocument.load(new File(file)); 
        //创建表格解析器
        PdfTableReader reader = new PdfTableReader();
        //根据传入的文档和开始结束页码来解析表格 ,一个表格分页了,会变成多个表格对象
        List<ParsedTablePage > tablePages = reader.parsePdfTablePages(pdfDoc, 16,18);
        //循环表格
        for(ParsedTablePage tablePage : tablePages) {
            //循环行
            List<ParsedTablePage.ParsedTableRow> rows = tablePage.getRows();
            for (ParsedTablePage.ParsedTableRow row : rows) {
               //循环每列数据
                System.out.println(row.getCells());
            }
        }

3.运行结果,报错

Exception in thread "main" java.lang.UnsatisfiedLinkError: no opencv_java342 in java.library.path
    at java.lang.ClassLoader.loadLibrary(ClassLoader.java:1867)
    at java.lang.Runtime.loadLibrary0(Runtime.java:870)
    at java.lang.System.loadLibrary(System.java:1122)
    at pdftable.PdfTableReader.<clinit>(PdfTableReader.java:32)

4.下载 opencv ,地址:https://github.com/opencv/opencv/releases 根据不同的情况下载不同的版本, 本人测试环境是windows 64位 下载的exe,下载的版本号是根据报错信息提示的版本号: 342 = opencv 3.4.2

  1. 安装,然后到安装目录 opencv/build/java/x64,复制 dll 放到 C:/windows/system32 目录下

  2. 重新启动程序,运行成功

7.如果再报 3 的错误,试试在代码前面加上

System.loadLibrary("opencv_java342");

本例子有问题可以联系我,qq群: 481434622

相关文章

网友评论

      本文标题:java 解析pdf 表格

      本文链接:https://www.haomeiwen.com/subject/lkktahtx.html