美文网首页
linux下word转pdf,加水印

linux下word转pdf,加水印

作者: 明月清风_5c62 | 来源:发表于2020-08-27 10:13 被阅读0次

    一、word转dpf

    在windows下,可以利用python库win32com或comtypes来实现。

    import os
    import comtypes.client
    def get_path():
    # 获取当前运行路径
        path = os.getcwd()
        # 获取所有文件名的列表
        filename_list = os.listdir(path)
        # 获取所有word文件名列表
        wordname_list = [filename for filename in filename_list \
                        if filename.endswith((".doc", ".docx"))]
        for wordname in wordname_list:
            # 分离word文件名称和后缀,转化为pdf名称
            pdfname = os.path.splitext(wordname)[0] + '.pdf'
            # 如果当前word文件对应的pdf文件存在,则不转化
            if pdfname in filename_list:
                continue
            # 拼接 路径和文件名
            wordpath = os.path.join(path, wordname)
            pdfpath = os.path.join(path, pdfname)
            #生成器
            yield wordpath,pdfpath
    def convert_word_to_pdf():
        word = comtypes.client.CreateObject("Word.Application")
        word.Visible = 0
        for wordpath,pdfpath in get_path():
            newpdf = word.Documents.Open(wordpath)
            newpdf.SaveAs(pdfpath, FileFormat=17)
            newpdf.Close()
        # ppt转化为pdf
        # ppt = comtypes.client.CreateObject("Powerpoint.Application")
        # ppt.Visible = 1
        # newpdf = ppt.Presentations.Open(in_file)
        # newpdf.SaveAs(out_file, FileFormat=32)
        # newpdf.Close()
    if __name__ == "__main__":
        convert_word_to_pdf()
    

    linux 下则无相应的库,通过librefoffice来实现:

    libreoffice --invisible --convert-to pdf *.doc
    

    二、加水印
    给pdf加文字水印。

    from PyPDF2 import PdfFileReader, PdfFileWriter
    from reportlab.lib.units import cm
    from reportlab.pdfgen import canvas
    
    
    def create_watermark(content):
        """水印信息"""
        # 默认大小为21cm*29.7cm
        file_name = "mark.pdf"
        c = canvas.Canvas(file_name, pagesize=(30*cm, 30*cm))
        # 移动坐标原点(坐标系左下为(0,0))
        c.translate(10*cm, 5*cm)
    
        # 设置字体
        c.setFont("Helvetica", 80)
        # 指定描边的颜色
        c.setStrokeColorRGB(0, 1, 0)
        # 指定填充颜色
        c.setFillColorRGB(0, 1, 0)
        # 画一个矩形
        # c.rect(cm, cm, 7*cm, 17*cm, fill=1)
        # 旋转45度,坐标系被旋转
        c.rotate(30)
        # 指定填充颜色
        c.setFillColorRGB(0, 0, 0, 0.1)
        # 设置透明度,1为不透明
        # c.setFillAlpha(0.1)
        # 画几个文本,注意坐标系旋转的影响
        c.drawString(3*cm, 0*cm, content)
        c.setFillAlpha(0.6)
        # 关闭并保存pdf文件
        c.save()
        return file_name
    
    
    def add_watermark(pdf_file_in, pdf_file_mark, pdf_file_out):
        """把水印添加到pdf中"""
        pdf_output = PdfFileWriter()
        input_stream = open(pdf_file_in, 'rb')
        pdf_input = PdfFileReader(input_stream, strict=False)
    
        # 获取PDF文件的页数
        pageNum = pdf_input.getNumPages()
    
        # 读入水印pdf文件
        pdf_watermark = PdfFileReader(open(pdf_file_mark, 'rb'), strict=False)
        # 给每一页打水印
        for i in range(pageNum):
            page = pdf_input.getPage(i)
            page.mergePage(pdf_watermark.getPage(0))
            page.compressContentStreams()  # 压缩内容
            pdf_output.addPage(page)
        pdf_output.write(open(pdf_file_out, 'wb'))
    
    if __name__ == '__main__':
        pdf_file_in = '3.pdf'
        pdf_file_out = 'watermark.pdf'
        pdf_file_mark = create_watermark('wangfei')
        add_watermark(pdf_file_in, pdf_file_mark, pdf_file_out)
    

    相关文章

      网友评论

          本文标题:linux下word转pdf,加水印

          本文链接:https://www.haomeiwen.com/subject/rqtcsktx.html