美文网首页
pandas读取表格的常用参数2023-03-19

pandas读取表格的常用参数2023-03-19

作者: 土雕艺术家 | 来源:发表于2023-03-18 19:46 被阅读0次

输入文件

import pandas as pd
pd.read_excel(io='./data.xls')
pd.read_excel(io='/LH_data_3/worklab/data.xls')
pd.read_excel('/LH_data_3/worklab/data.xls')

io:可以使用相对或者绝对路径,read_excel可以读取xls/xlsx格式文件。

读取sheet

pd.read_excel(io='./data.xlsx',sheet_name=1)
pd.read_excel(io='./data.xlsx',sheet_name=None)

sheet_name:可以指定读取excel的sheet。sheet_name默认值是0,表示读取第一个sheet。可以根据sheet的名字或者位置设置参数。设置sheet_name=None,可以读取全部的sheet,返回字典,key为sheet名字,value为sheet表内容。

读取列名

pd.read_excel(io='./title.xlsx',header=1)
data = pd.read_excel(io='./data.xlsx', sheet_name = 0, header = [0,1])

设置header参数,可以指定目标行的数据为列标签。header默认值是0,表示第0行为列标签。 设置header为i(整数),表示设置i行为列标签,i行之前的数据会被舍弃。header:指定哪几行做列名
默认header为0,如果设置为[0,1],则表示将前两行作为多重索引。

df=pd.read_table(io='./data.xlsx',header=None,names=['queryid','subjectid']

names:自定义列名
如果缺少列名,可以使用names指定列名字,会替代原来的列表头。
但是要注意的是,长度必须和excel的列大小相同。

设置索引

data = pd.read_excel(io='./data.xlsx', index_col='月份')
data = pd.read_excel(io='./data.xlsx', index_col=0)

index_col设置索引列。可以是某列的名字,如index_col=‘月份’;也可以是整型数字或列表,如index_col=0或index_col=[0,1]

相关文章

网友评论

      本文标题:pandas读取表格的常用参数2023-03-19

      本文链接:https://www.haomeiwen.com/subject/acqerdtx.html