pandas支持读取表格型数据(excel 2003或更高)文件,使用ExcelFile class或pandas.read_excel函数。这些工具需要一些富家的包xlrd和openpyxl来分别读取XLS和XLSX文件。你可以通过pip或conda来安装。
1 使用ExcelFile,创建一个instance,通过给xls或xlsx一个路径:
xlsx = pd.ExcelFile('../examples/ex1.xlsx')
2 保存在sheet里的数据,可以通过parse来读取为DataFrame
a = pd.read_excel(xlsx, 'Sheet1')
a
a b c d message
0 1 2 3 4 hello
1 5 6 7 8 world
2 9 10 11 12 foo
1 读取
如果要读取一个文件中的多个sheet,用ExcelFile会更快。但让,你也能把文件名直接传递给pandas.read_excel:
frame = pd.read_excel('../examples/ex1.xlsx', 'Sheet1')
frame
a b c d message
0 1 2 3 4 hello
1 5 6 7 8 world
2 9 10 11 12 foo
2 保存
如果要把pandas数据写为Excel格式,你必须先创建一个ExcelWrite,然后用to_excel方法
writer = pd.ExcelWriter('../examples/ex2.xlsx')
frame.to_excel(writer, 'Sheet1')
writer.save()
如果不用ExcelWriter的话,可以直接传给to_excel一个path:
frame.to_excel('../examples/ex2.xlsx')
网友评论