前言
python用于处理数据是非常合适的,所以难免会经常要对excel文档进行读取的操作,网上这方面的资料相对来说不多而且比较残缺;本人在做自己的工程项目的时候,搜索了很多资料,总结一下比较全面、有效的关于python处理excel的知识(但还是不够完美);
下载模块
安装模块
下载完成后, 按如下方式安装:
Python中安装xlrd模块的步骤:
- 从 https://pypi.python.org/pypi/xlrd 下载压缩包
- 解压所下载的压缩包
- CD到解压目录,执行 sudo python setup.py install
导入模块
import xlrd
from xlutils.copy import copy
使用模块
首先要明白两个概念:
- table/ workbook: 指的是一个excel文件
-
sheet: 指的是excel里面的一张表
table_example.xlsm
下面开始看看如何使用加载的这些模块来完成对一个表的操作
读表
- xlrd.open_workbook()函数
input: 要读取的excel文件名,字符串类型
output: excel文件的句柄,相当于一个用来标志这个文件的一个对象;
例如:
table0 = xlrd.open_workbook('table_example.xlsm')
table->
- sheet_by_name(sheet_name)
这是属于excel文件句柄的一个函数
input:sheet的名字
output:sheet类型的句柄,相当于一个用来标识这个sheet的一个对象
例如:
sheet_loss_table0 = table0.sheet_by_name('all_k1m60px')
这就获得了一个在名为'table_example.xlsm'的excel文件中的一个叫all_k1m60px的sheet的对象;
sheet->
- nrows, ncols
属于sheet对像中的两个变量,代表这个sheet中有数据的行数(nrows) 和列数(ncols)
例如:
row = sheet_loss_table0.nrows
column = sheet_loss_table0.ncols
- col_values(),row_values()函数
输入:要读取的列的标号,从0开始的整数,例如i
输出:第i
列数据的list
例如:
datase_list = sheet_loss_table0.col_values(0)
#读取第0列的数据并以list形式存在dataset_list变量中
网友评论