美文网首页
Pandas实战——MultiIndex数据操作

Pandas实战——MultiIndex数据操作

作者: 深思海数_willschang | 来源:发表于2021-09-14 11:15 被阅读0次
    pandas in action.png

    原书地址

    本篇笔记为原书第七章节的内容。

    • MultiIndex DataFrames

    DataFrame多重索引

    多重索引可看作是一包含多重标签的一索引对象(多级标签用元组对象来表示)。
    元组是不可变数据结构,即创建后其数据是不可改变。


    image.png
    • 行列都为多重索引


      multiindex
    • 从csv表格文件读取数据


      read_csv()
      • 查看dataframe的索引值:df.index
      • 查看dataframe的索引名:df.index.names
      • 查看dataframe的列索引值:df.columns
    索引信息
    • 查看dataframe的列索引名:df.columns.names


      列索引分配值
    • 取得多重索引的具体值 get_level_values()

    neighborhoods_df.index.get_level_values('City') #取得city列的索引值
    neighborhoods_df.columns.get_level_values('Category') #取得category的值

    get_level_values()

    多重索引排序

    • sort_index()


      sort_index
      • 参数level可以指定是对某索引列数据进行排序处理(支持多值)


        level参数
        多值排序
      • 参数axis可指定对列索引进行排序处理


        axis参数

    读取数据

    • 指定列名(注意层级关系)


      具体数据读取
    • loc()读取数据,支持行列索引切片组合进行数据提取


      行列索引进行数据读取
    • iloc()通过位置进行数据读取

    • xs()指定层级进行数据读取


      xs()

    索引操作 (具体查阅手册帮助)

    • reorder_levels(order=new_order)
    • reset_index()
    • set_index()

    相关文章

      网友评论

          本文标题:Pandas实战——MultiIndex数据操作

          本文链接:https://www.haomeiwen.com/subject/bihnwltx.html