美文网首页
java 解析pdf 表格

java 解析pdf 表格

作者: 唐植超 | 来源:发表于2020-05-21 17:05 被阅读0次

    不啰嗦太多,直接上步骤

    1. pom引入 参见:https://github.com/rostrovsky/pdf-table
    <dependency>
      <groupId>com.github.rostrovsky</groupId>
      <artifactId>pdf-table</artifactId>
      <version>1.0.0</version>
    </dependency>
    
    1. 示例代码
             String file = "D:/test.pdf";
            //加载pdf文件
            PDDocument pdfDoc = PDDocument.load(new File(file)); 
            //创建表格解析器
            PdfTableReader reader = new PdfTableReader();
            //根据传入的文档和开始结束页码来解析表格 ,一个表格分页了,会变成多个表格对象
            List<ParsedTablePage > tablePages = reader.parsePdfTablePages(pdfDoc, 16,18);
            //循环表格
            for(ParsedTablePage tablePage : tablePages) {
                //循环行
                List<ParsedTablePage.ParsedTableRow> rows = tablePage.getRows();
                for (ParsedTablePage.ParsedTableRow row : rows) {
                   //循环每列数据
                    System.out.println(row.getCells());
                }
            }
    

    3.运行结果,报错

    Exception in thread "main" java.lang.UnsatisfiedLinkError: no opencv_java342 in java.library.path
        at java.lang.ClassLoader.loadLibrary(ClassLoader.java:1867)
        at java.lang.Runtime.loadLibrary0(Runtime.java:870)
        at java.lang.System.loadLibrary(System.java:1122)
        at pdftable.PdfTableReader.<clinit>(PdfTableReader.java:32)
    

    4.下载 opencv ,地址:https://github.com/opencv/opencv/releases 根据不同的情况下载不同的版本, 本人测试环境是windows 64位 下载的exe,下载的版本号是根据报错信息提示的版本号: 342 = opencv 3.4.2

    1. 安装,然后到安装目录 opencv/build/java/x64,复制 dll 放到 C:/windows/system32 目录下

    2. 重新启动程序,运行成功

    7.如果再报 3 的错误,试试在代码前面加上

    System.loadLibrary("opencv_java342");
    

    本例子有问题可以联系我,qq群: 481434622

    相关文章

      网友评论

          本文标题:java 解析pdf 表格

          本文链接:https://www.haomeiwen.com/subject/lkktahtx.html