美文网首页
Python 读取 Word 文档操作

Python 读取 Word 文档操作

作者: 逍遥_yjz | 来源:发表于2022-11-21 17:13 被阅读0次

安装 python-docx库

pip install python-docx

使用

# coding:utf-8
import re
import docx
file_name = r"document.docx"
doc = docx.Document(file_name)

i = 0
for para in doc.paragraphs:
    i += 1
    print('---------- 第[%d]页 ------===----' % i)
    # print(para.text.strip())
    doc_content = para.text.strip()
    if len(doc_content) < 20:
        continue
    else:
        print(doc_content)
        doc_content = re.subn(' ', '', doc_content)[0]

**读取的结果不用担心跨页的情况,自动成句。

相关文章

网友评论

      本文标题:Python 读取 Word 文档操作

      本文链接:https://www.haomeiwen.com/subject/mwywxdtx.html