美文网首页
Python读取PDF文件

Python读取PDF文件

作者: 月夜星空下 | 来源:发表于2019-12-12 22:30 被阅读0次

pdf.py

from PyPDF2 import PdfFileReader
def getTextPDF(pdfFileName):
    pdf_file = open(pdfFileName,'rb')
    read_pdf = PdfFileReader(pdf_file)
    text = []
    for i in range(0,read_pdf.getNumPages()-1):
        text.append(read_pdf.getPage(i).extractText())
    return '\n'.join(text)

TestPDFs.py

import pdf
pdfFile = '/Users/lilong/Desktop/1.pdf'
# pdfFileEncrypted = 'sonnets.pdf'
print("PDF 1:\n",pdf.getTextPDF(pdfFile))

相关文章

网友评论

      本文标题:Python读取PDF文件

      本文链接:https://www.haomeiwen.com/subject/nmrxnctx.html