本篇笔记为原书第七章节的内容。
- MultiIndex DataFrames
DataFrame多重索引
多重索引可看作是一包含多重标签的一索引对象(多级标签用元组对象来表示)。
元组是不可变数据结构,即创建后其数据是不可改变。
image.png
-
行列都为多重索引
multiindex -
从csv表格文件读取数据
read_csv()- 查看dataframe的索引值:df.index
- 查看dataframe的索引名:df.index.names
- 查看dataframe的列索引值:df.columns
-
查看dataframe的列索引名:df.columns.names
列索引分配值
- 取得多重索引的具体值 get_level_values()
get_level_values()neighborhoods_df.index.get_level_values('City') #取得city列的索引值
neighborhoods_df.columns.get_level_values('Category') #取得category的值
多重索引排序
-
sort_index()
sort_index-
参数level可以指定是对某索引列数据进行排序处理(支持多值)
level参数
多值排序 -
参数axis可指定对列索引进行排序处理
axis参数
-
读取数据
-
指定列名(注意层级关系)
具体数据读取 -
loc()读取数据,支持行列索引切片组合进行数据提取
行列索引进行数据读取 -
iloc()通过位置进行数据读取
-
xs()指定层级进行数据读取
xs()
索引操作 (具体查阅手册帮助)
- reorder_levels(order=new_order)
- reset_index()
- set_index()
网友评论