随笔

作者: 小鸡在路上 | 来源:发表于2019-01-10 21:09 被阅读0次

对于获取pdf关键字的坐标位置

package com.sign;

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.util.ArrayList;
import java.util.List;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;
import org.apache.pdfbox.text.TextPosition;

public class BoxKeyPosition extends PDFTextStripper {

    private char[] key;
    private byte[] src;
    private List<float[]> list = new ArrayList<float[]>();
    private List<float[]> pagelist = new ArrayList<float[]>();

    public BoxKeyPosition(String keyWords, byte[] src) throws IOException {
        super();
        super.setSortByPosition(true);
        this.src = src;

        char[] key = new char[keyWords.length()];
        for (int i = 0; i < keyWords.length(); i++) {
            key[i] = keyWords.charAt(i);
        }
        this.key = key;
    }

    public char[] getKey() {
        return key;
    }

    public void setKey(char[] key) {
        this.key = key;
    }

    public byte[] getSrc() {
        return src;
    }

    public void setSrc(byte[] src) {
        this.src = src;
    }

    public List<float[]> getPosition() throws IOException {
        try {
            document = PDDocument.load(src);
            int pages = document.getNumberOfPages();

            for (int i = 1; i <= pages; i++) {
                pagelist.clear();
                super.setSortByPosition(true);
                super.setStartPage(i);
                super.setEndPage(i);
                Writer dummy = new OutputStreamWriter(new ByteArrayOutputStream());
                super.writeText(document, dummy);
                for (float[] li : pagelist) {
                    li[2] = i;
                }
                list.addAll(pagelist);
            }
            return list;

        } finally {
            if (document != null) {
                document.close();
            }
        }

    }

    @Override
    protected void writeString(String string, List<TextPosition> textPositions) throws IOException {
        for (int i = 0; i < textPositions.size(); i++) {

            String str = textPositions.get(i).getUnicode();
            if (str.equals(key[0] + "")) {
                int count = 0;
                for (int j = 1; j < key.length; j++) {
                    String s = "";
                    try {
                        s = textPositions.get(i + j).getUnicode();
                    } catch (Exception e) {
                        s = "";
                    }
                    if (s.equals(key[j] + "")) {
                        count++;
                    }

                }
                if (count == key.length - 1) {
                    float[] idx = new float[3];
                    idx[0] = textPositions.get(i).getX()+key.length*textPositions.get(i).getWidth()/2;
                    idx[1] = textPositions.get(i).getY()-textPositions.get(i).getHeight();
                    //  idx[3] = textPositions.get(i).getUnicode();
                    pagelist.add(idx);
                }
            }

        }
    }
}
package com.sign;



import java.io.*;
import java.util.List;

/**
 * @ClassName SignPostionTest
 * @Description TODD
 * @Author MG01857
 * @Date 2018/12/15
 * @Version 1.0
 **/

public class SignPostionTest {
    private static byte[] toByteArray(InputStream in) throws IOException {

        ByteArrayOutputStream out = new ByteArrayOutputStream();
        byte[] buffer = new byte[1024 * 4];
        int n = 0;
        while ((n = in.read(buffer)) != -1) {
            out.write(buffer, 0, n);
        }
        return out.toByteArray();
    }
    public static void main(String[] args) throws Exception {
       /* SignPostion signPostion = new SignPostion();
        List<float[]> keyWords = signPostion.getKeyWords("C:\\Users\\MG01857\\Desktop\\AZ新合同生成\\埋点测试\\爱家分期服务合同(金融机构、消费者).pdf",
                null, "borrower ");
        System.out.println(keyWords);*/
        String filePath = "C:\\Users\\MG01857\\Desktop\\AZ新合同生成\\埋点测试\\爱家分期消费借款合同(小贷、消费者硬装整装)+-+副本.pdf";
        InputStream in = new FileInputStream(filePath);
        byte[] data = toByteArray(in);
        in.close();
        BoxKeyPosition boxKeyPosition = new BoxKeyPosition("publicSign",data);
        //List<float[]> position = boxKeyPosition.getPosition();
        List<float[]> position = boxKeyPosition.getPosition();
        for (float[] f : position){
            System.out.println(f.toString());
        }
    }
}

所用jar包

<dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>pdfbox</artifactId>
            <version>2.0.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>fontbox</artifactId>
            <version>2.0.1</version>
        </dependency>

相关文章

  • 点评不只是为了链接——007践行之旅(13)

    (太累了,回头更新) 周末随笔周末随笔周末随笔周末随笔周末随笔周末随笔周末随笔周末随笔周末随笔周末随笔周末随笔周末...

  • 这是一个随笔

    这是一个随笔 这是一个随笔 这是一个随笔 这是一个随笔 这是一个随笔 这是一个随笔 这是一个随笔 这是一个随笔 这...

  • 《黄泓圣杂文随笔》

    《黄泓圣杂文随笔》 #杂文#随笔#杂文随笔#原创#原创杂文#原创随笔#原创杂文随笔#黄泓圣杂文#黄泓圣随笔#黄泓圣...

  • 《黄泓圣杂文随笔》

    《黄泓圣杂文》 《黄泓圣杂文随笔》 《黄泓圣随笔》 《黄泓圣原创杂文随笔》 #原创#杂文#杂文随笔#随笔#原创杂文...

  • 《黄泓圣杂文随笔》

    《黄泓圣杂文》 《黄泓圣杂文随笔》 《黄泓圣随笔》 《黄泓圣原创杂文随笔》 #原创#杂文#杂文随笔#随笔#原创杂文...

  • 走近大丰港实验学校

    随笔组汇报 杨忠琴教育随笔让我改变 随笔收获多,只要有行动,就有收获。 沈莲汇报随笔,每天随笔撰写,收获颇深,每的...

  • 谈谈教育随笔(2)

    谈谈教育随笔(2) 什么是教育随笔?顾名思义,教育随笔就是谈教育思想、观点的随笔。教育随笔的特色在于一个“随”字-...

  • 《提升自己》连载17老钟随笔:新生理论

    老钟随笔,随笔,但不随便,却短小精悍!随笔文章,老钟纯原创,分享学习笔记,人生感悟,学员互动等内容为主。随笔文章,...

  • 2020-04-14

    随笔,随笔,随手记录的笔记~~~~ ``````````````````````````````````开门大吉`...

  • 序言

    落花随笔 主要记录的是 工作的随笔

网友评论

      本文标题:随笔

      本文链接:https://www.haomeiwen.com/subject/xsszrqtx.html