之前的文章pandas读取表格数据已经实现了从excel/csv中读取出字典格式的数据,这里对其中的代码细节进行一些说明。
dataframe结构举例:
行索引获取
利用index
获取每一行的索引值。
data.index#返回索引对象
data.index.values#返回序列对象
行索引输出结果
筛选数据-loc
pandas
的筛选可以通过loc
以标签的方式进行筛选,行标签即是行索引,列标签则是各个列名。具体格式为:data.loc[:,:]
- 逗号之前代表行,逗号之后代表列;
- 冒号代表全部;
- 行索引是数字类型,可以分片的形式呈现,区间为闭区间,注意第一行的索引是0;
- 如果想展示特定的列,可将列名称依次列出。
data.loc[0:1,:]
#输出第1-2行,全部列数据
data.loc[0:1,['case_name','method']]
##输出第1-2行,case_name和method列的数据
输出结果
筛选数据-iloc
loc
是以标签索引,iloc
是以位置索引,即输出第几行第几列的内容。但需要注意,iloc
的区间,是开闭区间,即如果是第1行-第2行(第1列-第2列),需要写成0:2
。
下方两种写法,输出的数据结果相同。
data.iloc[0:2,0:2]
data.loc[0:1,['case_name','path']]
运行结果
自我记录,有错误欢迎指正~
网友评论