Python小工具之读取文件夹下pdf文件及获取pdf页数

Python小工具之读取文件夹下pdf文件及获取pdf页数

作者: mango115 | 来源:发表于2023-11-29 10:28 被阅读0次

JPG2PDF
Python ☞ day 10
读pdf及DBF文件
Python读取PDF文件
PDF编辑器哪个好，怎么裁剪PDF页面
Python使用Tabula提取PDF表格数据
Python批量读取文件（含子文件）
pdfdocx：Python中doc、pdf文档读取库
python读取pdf txt 文件
Python-读取pdf文件

#coding:utf-8
import os  
import pandas as pd  
from PyPDF2 import PdfReader  
  
# 指定要读取的文件夹路径  
folder_path = r'E:/临时文件/'
  
# 获取文件夹下的所有PDF文件  
pdf_files = [f for f in os.listdir(folder_path) if f.endswith('.pdf')]  
  
# 存储PDF文件的页码信息  
pdf_page_info = []  
  
# 遍历每个PDF文件  
# for file_name in pdf_files:  
#使用enumerate()函数来同时获取循环的次数和元素值，index来写编号
for index,file_name in enumerate(pdf_files): 
    file_path = os.path.join(folder_path, file_name)  
    with open(file_path, 'rb') as file:  
        # 创建PDF阅读器对象  
        reader = PdfReader(file)  
        # 获取PDF文件的页数  
        # num_pages = reader.getNumPages()  
        num_pages = len(reader.pages)  
        # 将文件名称、页码数量和备注添加到列表中  
        # pdf_page_info.append((os.path.splitext(file_name)[0], file_name, num_pages, ''))  
        pdf_page_info.append((index+1, file_name, num_pages, ''))  
  
# 创建Excel文件并输出数据  
df = pd.DataFrame(pdf_page_info, columns=['编号', '文件名称', '页码数量', '备注'])  
df.to_excel('output.xlsx', index=False)

相关文章

JPG2PDF
将JPG文件夹下的所有JPG文件转换为PDF保存在PDF文件夹下；
Python ☞ day 10
Python学习笔记之自动化办公与鼠标键盘模拟读写csv文件读csv文件写csv文件读取PDF文件读...
读pdf及DBF文件
读pdf 读DBF 使用pdfminer读取pdf文件
Python读取PDF文件
pdf.py TestPDFs.py
PDF编辑器哪个好，怎么裁剪PDF页面
现在我们会经常使用到PDF文件，PDF文件有很多页数，当我们只需要其中一部分的时候就需要裁剪PDF页面，PDF文件...
Python使用Tabula提取PDF表格数据
今天遇到一个批量读取pdf文件中表格数据的需求，样式大体是以下这样： python读取PDF无非就是三种方式（我所...
Python批量读取文件（含子文件）
本文介绍Python如何读取文件夹下所有文件的方法。主要用于合并多个文件的情况。一、仅读取当前文件夹下的所有文件...
pdfdocx：Python中doc、pdf文档读取库
最近运行课件代码，发现pdf文件读取部分的函数失效。这里找到读取pdf文件的可运行代码，为了方便后续学习使用，我已...
python读取pdf txt 文件
pdf 首先安装pdfminer3k pip install pdfminer3k提示这样就算安装完了 Succe...
Python-读取pdf文件
import sysimport importlibimportlib.reload(sys) from pdfm...

网友评论

本文标题：Python小工具之读取文件夹下pdf文件及获取pdf页数

本文链接：https://www.haomeiwen.com/subject/zoxfgdtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Python小工具之读取文件夹下pdf文件及获取pdf页数|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！