一、word转dpf
在windows下,可以利用python库win32com或comtypes来实现。
import os
import comtypes.client
def get_path():
# 获取当前运行路径
path = os.getcwd()
# 获取所有文件名的列表
filename_list = os.listdir(path)
# 获取所有word文件名列表
wordname_list = [filename for filename in filename_list \
if filename.endswith((".doc", ".docx"))]
for wordname in wordname_list:
# 分离word文件名称和后缀,转化为pdf名称
pdfname = os.path.splitext(wordname)[0] + '.pdf'
# 如果当前word文件对应的pdf文件存在,则不转化
if pdfname in filename_list:
continue
# 拼接 路径和文件名
wordpath = os.path.join(path, wordname)
pdfpath = os.path.join(path, pdfname)
#生成器
yield wordpath,pdfpath
def convert_word_to_pdf():
word = comtypes.client.CreateObject("Word.Application")
word.Visible = 0
for wordpath,pdfpath in get_path():
newpdf = word.Documents.Open(wordpath)
newpdf.SaveAs(pdfpath, FileFormat=17)
newpdf.Close()
# ppt转化为pdf
# ppt = comtypes.client.CreateObject("Powerpoint.Application")
# ppt.Visible = 1
# newpdf = ppt.Presentations.Open(in_file)
# newpdf.SaveAs(out_file, FileFormat=32)
# newpdf.Close()
if __name__ == "__main__":
convert_word_to_pdf()
linux 下则无相应的库,通过librefoffice来实现:
libreoffice --invisible --convert-to pdf *.doc
二、加水印
给pdf加文字水印。
from PyPDF2 import PdfFileReader, PdfFileWriter
from reportlab.lib.units import cm
from reportlab.pdfgen import canvas
def create_watermark(content):
"""水印信息"""
# 默认大小为21cm*29.7cm
file_name = "mark.pdf"
c = canvas.Canvas(file_name, pagesize=(30*cm, 30*cm))
# 移动坐标原点(坐标系左下为(0,0))
c.translate(10*cm, 5*cm)
# 设置字体
c.setFont("Helvetica", 80)
# 指定描边的颜色
c.setStrokeColorRGB(0, 1, 0)
# 指定填充颜色
c.setFillColorRGB(0, 1, 0)
# 画一个矩形
# c.rect(cm, cm, 7*cm, 17*cm, fill=1)
# 旋转45度,坐标系被旋转
c.rotate(30)
# 指定填充颜色
c.setFillColorRGB(0, 0, 0, 0.1)
# 设置透明度,1为不透明
# c.setFillAlpha(0.1)
# 画几个文本,注意坐标系旋转的影响
c.drawString(3*cm, 0*cm, content)
c.setFillAlpha(0.6)
# 关闭并保存pdf文件
c.save()
return file_name
def add_watermark(pdf_file_in, pdf_file_mark, pdf_file_out):
"""把水印添加到pdf中"""
pdf_output = PdfFileWriter()
input_stream = open(pdf_file_in, 'rb')
pdf_input = PdfFileReader(input_stream, strict=False)
# 获取PDF文件的页数
pageNum = pdf_input.getNumPages()
# 读入水印pdf文件
pdf_watermark = PdfFileReader(open(pdf_file_mark, 'rb'), strict=False)
# 给每一页打水印
for i in range(pageNum):
page = pdf_input.getPage(i)
page.mergePage(pdf_watermark.getPage(0))
page.compressContentStreams() # 压缩内容
pdf_output.addPage(page)
pdf_output.write(open(pdf_file_out, 'wb'))
if __name__ == '__main__':
pdf_file_in = '3.pdf'
pdf_file_out = 'watermark.pdf'
pdf_file_mark = create_watermark('wangfei')
add_watermark(pdf_file_in, pdf_file_mark, pdf_file_out)
网友评论