python：xlrd模块

作者: rr1990 | 来源:发表于2019-02-21 14:29 被阅读0次

python学习
xlrd模块应用
python xlrd读取和操作excel的常用方法
python之解析execl表格
2018-09-07
Python中xlrd和xlwt模块使用方法
excel 处理
Python xlrd 模块
python：xlrd模块
插上翅膀，让Excel飞起来——xlwings（一）

一、xlrd模块介绍

xlrd是读取excel表格数据；
支持 xlsx和xls 格式的excel表格；
三方模块安装方式：pip3 install xlrd；
模块导入方式： import xlrd

二、xlrd模块操作

1. 基本函数

1.1. 打开workbook获取Book对象

xlrd.open_workbook(filename[, logfile, file_contents, ...])：打开excel文件
filename：需操作的文件名（包括文件路径和文件名称）；

若filename不存在，则报错FileNotFoundError；
若filename存在，则返回值为xlrd.book.Book对象

1.2. 获取Book对象中所有sheet名称

BookObject.sheet_names()：获取所有sheet的名称，以列表方式显示

1.3. 获取Book对象中所有Sheet对象

BookObject.sheets()：获取所有sheet的对象，以列表形式显示
BookObject.sheet_by_index(sheetx)：通过sheet索引获取所需sheet对象
sheetx为索引值，索引从0开始计算；
若sheetx超出索引范围，则报错IndexError；
若sheetx在索引范围内，则返回值为xlrd.sheet.Sheet对象
BookObject.sheet_by_name(sheet_name)：通过sheet名称获取所需sheet对象
sheet_name为sheet名称；
若sheet_name不存在，则报错xlrd.biffh.XLRDError；
若sheet_name存在，则返回值为xlrd.sheet.Sheet对象

1.4. 判断Book对象中某个sheet是否导入

BookObject.sheet_loaded(sheet_name_or_index)：通过sheet名称或索引判断该sheet是否导入成功
返回值为bool类型，若返回值为True表示已导入；若返回值为False表示未导入

1.5. 对Sheet对象中的行操作

SheetObject.nrows：获取某sheet中的有效行数
SheetObject.row_values(rowx[, start_colx=0, end_colx=None])：获取sheet中第rowx+1行从start_colx列到end_colx列的数据，返回值为列表。
若rowx在索引范围内，以列表形式返回数据；
若rowx不在索引范围内，则报错IndexError
SheetObject.row(rowx)：获取sheet中第rowx+1行单元，返回值为列表；
列表每个值内容为：单元类型:单元数据
SheetObject.row_slice(rowx[, start_colx=0, end_colx=None])：以切片方式获取sheet中第rowx+1行从start_colx列到end_colx列的单元，返回值为列表；
列表每个值内容为：单元类型:单元数据
SheetObject.row_types(rowx[, start_colx=0, end_colx=None])：获取sheet中第rowx+1行从start_colx列到end_colx列的单元类型，返回值为array.array类型。
单元类型ctype：empty为0，string为1，number为2，date为3，boolean为4， error为5（左边为类型，右边为类型对应的值）；
SheetObject.row_len(rowx)：获取sheet中第rowx+1行的长度

rowx：行标，行数从0开始计算（0表示第一行）, 必填参数；
start_colx：起始列，表示从start_colx列开始取值，包括第start_colx的值；
end_colx：结束列，表示到end_colx列结束取值，不包括第end_colx的值；

start_colx默认为0，end_colx默认为None：表示取整行相关数据；

SheetObject.get_rows()：获取某一sheet所有行的生成器

1.6. 对Sheet对象中的列操作

SheetObject.ncols：获取某sheet中的有效列数
SheetObject.col_values(self, colx[, start_rowx=0, end_rowx=None])：获取sheet中第colx+1列从start_rowx行到end_rowx行的数据，返回值为列表。
SheetObject.col_slice(colx[, start_rowx=0, end_rowx=None])：以切片方式获取sheet中第colx+1列从start_rowx行到end_rowx行的数据，返回值为列表。
列表每个值内容为：单元类型:单元数据
SheetObject.col_types(colx[, start_rowx=0, end_rowx=None])：获取sheet中第colx+1列从start_rowx行到end_rowx行的单元类型，返回值为列表；

1.7. 对Sheet对象的单元格执行操作

ShellObeject.cell(rowx, colx)：获取sheet对象中第rowx+1行，第colx+1列的单元对象，返回值为'xlrd.sheet.Cell'类型，返回值的格式为“单元类型:单元值”。
ShellObject.cell_value(rowx, colx)：获取sheet对象中第rowx+1行，第colx+1列的单元数据，返回值为当前值的类型（如float、int、string...）；
ShellObject.cell_type(rowx, colx)：获取sheet对象中第rowx+1行，第colx+1列的单元数据类型值；
单元类型ctype：empty为0，string为1，number为2，date为3，boolean为4， error为5；

import xlrd

""" 打开excel表格"""
workbook = xlrd.open_workbook("测试.xlsx")
print(workbook)             # 结果：<xlrd.book.Book object at 0x000000000291B128>

""" 获取所有sheet名称"""
sheet_names = workbook.sheet_names()
print(sheet_names)          # 结果：['表1', 'Sheet2']

""" 获取所有或某个sheet对象"""
# 获取所有的sheet对象
sheets_object = workbook.sheets()
print(sheets_object)        # 结果：[<xlrd.sheet.Sheet object at 0x0000000002956710>, <xlrd.sheet.Sheet object at 0x0000000002956AC8>]
# 通过index获取第一个sheet对象
sheet1_object = workbook.sheet_by_index(0)
print(sheet1_object)        # 结果：<xlrd.sheet.Sheet object at 0x0000000002956710>
# 通过name获取第一个sheet对象
sheet1_object = workbook.sheet_by_name(sheet_name="表1")
print(sheet1_object)        # 结果：<xlrd.sheet.Sheet object at 0x0000000002956710>

""" 判断某个sheet是否已导入"""
# 通过index判断sheet1是否导入
sheet1_is_load = workbook.sheet_loaded(sheet_name_or_index=0)
print(sheet1_is_load)       # 结果：True
# 通过sheet名称判断sheet1是否导入
sheet1_is_load = workbook.sheet_loaded(sheet_name_or_index="表1")
print(sheet1_is_load)       # 结果：True

""" 对sheet对象中的行执行操作：如有效行数、某行从n1到n2列的数据、某行的单元和类型、某行的长度...... """
# 获取sheet1中的有效行数
nrows = sheet1_object.nrows
print(nrows)                # 结果：5
# 获取sheet1中第3行的数据
all_row_values = sheet1_object.row_values(rowx=2)
print(all_row_values)           # 结果：[3.0, 'b', 1, '']
row_values = sheet1_object.row_values(rowx=2, start_colx=1, end_colx=3)
print(row_values)               # 结果：['b', 1]
# 获取sheet1中第3行的单元对象
row_object = sheet1_object.row(rowx=2)
print(row_object)               # 结果：[number:3.0, text:'b', bool:1, empty:'']
# 获取sheet1中第3行的单元
row_slice = sheet1_object.row_slice(rowx=2)
print(row_slice)                # 结果：[number:3.0, text:'b', bool:1, empty:'']
# 获取sheet1中第3行的单元类型
row_types = sheet1_object.row_types(rowx=2)
print(row_types)                # 结果：array('B', [2, 1, 4, 0])
# 获取sheet1中第3行的长度
row_len = sheet1_object.row_len(rowx=2)
print(row_len)                  # 结果：4
# 获取sheet1所有行的生成器
rows_generator = sheet1_object.get_rows()
print(rows_generator)           # 结果：<generator object Sheet.get_rows.<locals>.<genexpr> at 0x00000000028D8BA0>

""" 对sheet对象中的列执行操作："""
# 获取sheet1中的有效列数
ncols = sheet1_object.ncols
print(ncols)                # 结果：4
# 获取sheet1中第colx+1列的数据
col_values = sheet1_object.col_values(colx=1)
print(col_values)           # 结果：['测试', 'a', 'b', 'c', 'd']
col_values1 = sheet1_object.col_values(1, 1, 3)
print(col_values1)          # 结果：['a', 'b']
# 获取sheet1中第2列的单元
col_slice = sheet1_object.col_slice(colx=1)
print(col_slice)            # 结果：[text:'测试', text:'a', text:'b', text:'c', text:'d']
# 获取sheet1中第2列的单元类型
col_types = sheet1_object.col_types(colx=1)
print(col_types)            # 结果：[1, 1, 1, 1, 1]

"""对sheet对象中的单元执行操作"""
# 获取sheet1中第rowx+1行，第colx+1列的单元对象
cell_info = sheet1_object.cell(rowx=1, colx=2)
print(cell_info)           # 结果: text:'m'
print(type(cell_info))     # 结果：<class 'xlrd.sheet.Cell'>
# 获取sheet1中第rowx+1行，第colx+1列的单元值
cell_value = sheet1_object.cell_value(rowx=1, colx=2)
print(cell_value)           # 结果: m
# 获取sheet1中第rowx+1行，第colx+1列的单元类型值
cell_type = sheet1_object.cell_type(rowx=1, colx=2)
print(cell_type)            # 结果：1

2. 读取单元格内容为日期/时间的方式

若单元格内容的类型为date，即ctype值为3时，则代表此单元格的数据为日期

xlrd.xldate_as_tuple(xldate, datemode)：若xldate数据为日期/时间，则将转化为适用于datetime的元组；
返回值为元组，格式为：(year, month, day, hour, minute, nearest_second)
xldate：sheet对象中单元格的数据
datemode：日期模式

""" 读取sheet对象中的日期 """
import datetime
workbook = xlrd.open_workbook("测试.xlsx")
sheet2_object = workbook.sheet_by_name("Sheet2")
# value_type = sheet2_object.cell(0, 1).ctype
value_type = sheet2_object.cell_type(0, 1)
print(value_type)  # 结果：3
if value_type == 3:
    print("单元格数据为日期")
    cell_value = sheet2_object.cell_value(0, 1)
    print(cell_value)  # 结果：43506.0
    date_tuple = xlrd.xldate_as_tuple(cell_value, workbook.datemode)
    print(date_tuple)  # 结果：(2019, 2, 10, 0, 0, 0)
    date_value = datetime.date(*date_tuple[:3])
    print(date_value)  # 结果：2019-02-10
    date_format = date_value.strftime('%Y/%m/%d')
    print(date_format)  # 结果：2019/02/10

3. 对合并单元格执行操作

（1）获取合并的单元格
若表格为xls格式的，打开workbook时需将formatting_info设置为True，然后再获取sheet中的合并单元格；
若表格有xlsx格式的，打开workbook时保持formatting_info为默认值False，然后再获取sheet中的合并单元格；

SheetObject.merged_cells：获取sheet中合并单元格的信息，返回值为列表；
若sheet对象中无合并单元格，则返回值为空列表；
列表中每个单元格信息的格式为：(row_start, row_end, col_start, col_end)
row_start表示合并单元格的起始行；
row_end表示合并单元格的结束行；
col_start表示合并单元格的起始列；
col_end表示合并单元格的结束列；
合并单元格的行取值范围为[row_start, row_end)，包括row_start，不包括row_end；
合并单元格的列取值范围为[col_start, col_end)，包括col_start，不包括col_end；
如：(1, 3, 4, 6)：表示从第1到2行合并，从第4到第5列合并；

（2）读取合并单元格的数据
读取合并单元格数据仅需merged_cells数据中的row_start和col_start这两个索引即可

SheetObject.cell_value(rowx=row_start, colx=col_start)：获取合并单元格的数据

""" 获取合并的单元格并读取单元格数据 """
# 获取xlsx格式的excel文件中的合并单元格
workbook = xlrd.open_workbook("测试.xlsx")
sheet2_object = workbook.sheet_by_name("Sheet2")
print(sheet2_object.merged_cells)   # 结果: [(1, 2, 0, 2), (3, 6, 0, 2)]
# 获取xls格式的excel文件中的合并单元格
workbook1 = xlrd.open_workbook("测试.xls", formatting_info=True)
sheet2_object1 = workbook1.sheet_by_name("Sheet2")
print(sheet2_object1.merged_cells)   # 结果: [(1, 2, 0, 2), (3, 6, 0, 2)]

# 读取合并单元格数据（仅需“起始行起始列”即可获取数据）
print(sheet2_object.cell_value(1, 0))   # 结果：合并
print(sheet2_object.cell_value(3, 0))   # 结果：合并2
# 或使用for循环获取所有的合并单元格数据
for (row_start, row_end, col_start, col_end) in sheet2_object.merged_cells:
    print(sheet2_object.cell_value(rowx=row_start, colx=col_start))

python学习
xlrd模块一、安装xlrd模块到python官网下载http://pypi.python.org/pypi/...
xlrd模块应用
一、安装xlrd模块到python官网下载http://pypi.python.org/pypi/xlrd模块安...
python xlrd读取和操作excel的常用方法
安装xlrd模块（cmd命令）引入xlrd模块和读取本地excel 常用方法参考：python里面的xlrd模...
python之解析execl表格
xlrd模块 python操作excel主要用到xlrd和xlwt这两个库，即xlrd是读excel，xlwt是写...
2018-09-07
用python读写excel（xlrd、xlwt）一、读excel表读excel要用到xlrd模块，官网安装（...
Python中xlrd和xlwt模块使用方法
Python中xlrd和xlwt模块使用方法 1.模块安装 2.具体使用 xlrd的使用 excel文档名称为联系...
excel 处理
下载 xlrd 模块，解压xlrd.tar.gz至指定文件夹python setup.py install 完成安...
Python xlrd 模块
获取 Excel 文件操作 Sheet 相关操作操作 Sheet 中的内容
python：xlrd模块
一、xlrd模块介绍 xlrd是读取excel表格数据；支持 xlsx和xls 格式的excel表格；三方模块...
插上翅膀，让Excel飞起来——xlwings（一）
python操作Excel的模块，网上提到的模块大致有：xlwings、xlrd、xlwt、openpyxl、py...

python：xlrd模块

一、xlrd模块介绍

二、xlrd模块操作

1. 基本函数

1.1. 打开workbook获取Book对象

1.2. 获取Book对象中所有sheet名称

1.3. 获取Book对象中所有Sheet对象

1.4. 判断Book对象中某个sheet是否导入

1.5. 对Sheet对象中的行操作

1.6. 对Sheet对象中的列操作

1.7. 对Sheet对象的单元格执行操作

2. 读取单元格内容为日期/时间的方式

3. 对合并单元格执行操作

相关文章

python学习

xlrd模块应用

python xlrd读取和操作excel的常用方法

python之解析execl表格

2018-09-07

Python中xlrd和xlwt模块使用方法

excel 处理

Python xlrd 模块

python：xlrd模块

插上翅膀，让Excel飞起来——xlwings（一）

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Python实例教程