安装使用docx
pip install python-docx
下面是一个示例代码,
演示如何读取Word文档中的段落和表格
import docx
# 打开Word文档
doc = docx.Document("C:\\path\\to\\your\\document.docx")
# 遍历文档中的段落
for para in doc.paragraphs:
print(para.text)
# 遍历文档中的表格
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
在上面的代码中,我们首先使用docx.Document函数打开Word文档。然后,我们使用paragraphs属性遍历文档中的段落,并使用text属性获取每个段落的文本内容。接下来,我们使用tables属性遍历文档中的表格,并使用嵌套的循环遍历每个表格的行和单元格,并使用text属性获取每个单元格的文本内容。
网友评论