最近做anki牌组,需要把一个大的pdf每页拆成一张图片,参考下面几篇文章实现了python脚本
1、pip快速下载配置
参考:怎么解决pip下载慢,超时等问题
在自己的user目录(C:\Users\用户名)建一个pip文件夹,在pip文件夹下建一个pip.ini文件
在pip.ini文件里面加上这两句
[global]
index-url = http://mirrors.aliyun.com/pypi/simple/
[install]
trusted-host=mirrors.aliyun.com
2、pdf转图片脚本
参考python如何把pdf文件转换成图片格式?,修过编写如下:
import fitz
pdffile = "1.pdf"
output = "outfile.png"
doc = fitz.open(pdffile)
for i in range (0,435):
page = doc.loadPage(i) # PDF页数
pix = page.getPixmap()
pix.writePNG("output" + str(i+1) + ".png") #保存
这个脚本存在一个问题,我不知道fitz如何获取pdf总页数,因此按照我当前的pdf页数435,在代码里面写死了
另外文中的第一个方法使用pdf2image也试验过,不成功
3、执行出错
参考Python3.8.5 fitz raise 产生RuntimeError 异常
需要安装PyMuPDF
pip install PyMuPDF
网友评论