美文网首页
Pandas实战——MultiIndex数据操作

Pandas实战——MultiIndex数据操作

作者: 深思海数_willschang | 来源:发表于2021-09-14 11:15 被阅读0次
pandas in action.png

原书地址

本篇笔记为原书第七章节的内容。

  • MultiIndex DataFrames

DataFrame多重索引

多重索引可看作是一包含多重标签的一索引对象(多级标签用元组对象来表示)。
元组是不可变数据结构,即创建后其数据是不可改变。


image.png
  • 行列都为多重索引


    multiindex
  • 从csv表格文件读取数据


    read_csv()
    • 查看dataframe的索引值:df.index
    • 查看dataframe的索引名:df.index.names
    • 查看dataframe的列索引值:df.columns
索引信息
  • 查看dataframe的列索引名:df.columns.names


    列索引分配值
  • 取得多重索引的具体值 get_level_values()

neighborhoods_df.index.get_level_values('City') #取得city列的索引值
neighborhoods_df.columns.get_level_values('Category') #取得category的值

get_level_values()

多重索引排序

  • sort_index()


    sort_index
    • 参数level可以指定是对某索引列数据进行排序处理(支持多值)


      level参数
      多值排序
    • 参数axis可指定对列索引进行排序处理


      axis参数

读取数据

  • 指定列名(注意层级关系)


    具体数据读取
  • loc()读取数据,支持行列索引切片组合进行数据提取


    行列索引进行数据读取
  • iloc()通过位置进行数据读取

  • xs()指定层级进行数据读取


    xs()

索引操作 (具体查阅手册帮助)

  • reorder_levels(order=new_order)
  • reset_index()
  • set_index()

相关文章

网友评论

      本文标题:Pandas实战——MultiIndex数据操作

      本文链接:https://www.haomeiwen.com/subject/bihnwltx.html