- Word 格式与 Python 函数库
- Excel 格式与 Python 函数库
Word 格式与 Python 函数库
Python 操作 Word 格式的库是 python-docx 库
安装与导入方法
pip install python-docx
...
import docx
Excel 格式与 Python 函数库
- xlsx 格式⼀般采⽤ openpyxl 进⾏读写
- 如果是 xls 格式,对 Word ⽂件读取时采⽤ xlrd 库,写⼊则需要使⽤ xlwt 库
批量处理
- Excel 批量合并
# 通过遍历取得将要合并的所有 Excel ⽂件
files = [x for x in p.iterdir() if PurePath(x).match('*.xlsx')]
Excel 批量拆分
- 批量拆分的关键是遍历所有的单元格
和遍历元组⼀样,可以采⽤ for…in 的结构遍历单元格
实现数据的批量格式转换
- 将 Word ⽂件转换为 Excel ⽂件 步骤:
- 遍历word文件中的“段落”
- 获取段落内存并保存到列表中
- 打开Excel 文件将列表中的每个元素写入到单位格中
4.关闭文件
- 将 Excel ⽂件转换为 Word ⽂件
Excel ⽂件有多张表,也⽐ Word ⽂件的宽度更宽,因此要提前确定转换前后的格式
扩展数据类型
命名元组
- namedtuple() 是命名元组的⼯⼚函数
命名元组使⽤前需要导⼊ collections 库
举例:
Point = namedtuple('Point', ['x', 'y'])
# 定义⼀个“点”,包含了 x 和 y 两个坐标
双端队列
- deque 对象是实现双向队列的对象
- 双向队列能够⽀持从左右两端实现元素的添加和移除
deque ⽐传统的列表多了 appendleft()、popleft() ⽅法
计数器
- 通过 Counter 对象,可实现计数器⼯具
计数器⼯具可以⽅便统计字典中元素的数量,也可以⽤来统计元素的出现次数
字典和列表⼦类化
- UserDict 类⽤于字典对象的⼆次开发
- UserList 类⽤于列表对象的⼆次开发
当你需要字典、列表的功能,⽽他们⼜不能完全满⾜需要时,可通过继承 UserDict 和 UserList 实现增强功能的字典和列表
网友评论