美文网首页
数据分析(四)

数据分析(四)

作者: ZplD | 来源:发表于2018-11-11 15:59 被阅读0次

多层次pandas

多层次pandas创建pd.MultiIndex

  • 使用数组
    columns = pd.MultiIndex.from_arrays([['期中', '期中','期中','期末','期末','期末'],['语文','数学','英语','语文','数学','英语']])
    data = np.random.randint(0,150,size=(10,6))
    # index = [['一班', 1],['一班', 1],['一班', 1],['一班', 1],['一班', 1],['二班', 1],['二班', 1],['二班', 1],['二班', 1],['二班', 1]]
    index = pd.MultiIndex.from_arrays([['一班','一班','一班','一班','一班','二班','二班','二班','二班','二班'], np.arange(10)])
    df = DataFrame(data=data,columns=columns, index=index)
    
  • 使用元组
    columns = [['期中', '期中','期中','期末','期末','期末'],['语文','数学','英语','语文','数学','英语']]
    data = np.random.randint(0,150,size=(10,6))
    # index = [['一班', 1],['一班', 1],['一班', 1],['一班', 1],['一班', 1],['二班', 1],['二班', 1],['二班', 1],['二班', 1],['二班', 1]]
    # index = pd.MultiIndex.from_arrays([['一班','一班','一班','一班','一班','二班','二班','二班','二班','二班'], np.arange(10)])
    index = pd.MultiIndex.from_tuples([('一班', 1),('一班', 2),('一班', 3),('一班', 4),('一班', 5),('二班', 6),('二班', 7),('二班', 8),('二班', 9),('二班', 10)])
    df = DataFrame(data=data,columns=columns, index=index)
    
  • 使用product(推荐)
    columns = pd.MultiIndex.from_product([['期中','期末'],['语文','数学','英语']])
    data = np.random.randint(0,150,size=(10,6))
    # index = [['一班', 1],['一班', 1],['一班', 1],['一班', 1],['一班', 1],['二班', 1],['二班', 1],['二班', 1],['二班', 1],['二班', 1]]
    # index = pd.MultiIndex.from_arrays([['一班','一班','一班','一班','一班','二班','二班','二班','二班','二班'], np.arange(10)])
    index = pd.MultiIndex.from_product([['一班','二班'],np.arange(5)])
    df = DataFrame(data=data,columns=columns, index=index)
    
效果图

多层次pandas索引与切片

  • Series的操作

    【重要】对于Series来说,直接中括号[]与使用.loc()完全一样,推荐使用.loc中括号索引和切片。

#索引
Series['index']
Series.loc['index']
Series.iloc[index下标]
Series[index下标]
#切片
Series[index下标1:index下标2]
  • DataFrame的操作
#对第一层columns索引
d[第一层columns]
#对第二层columns索引
d[第一层columns][第二层columns]
#只对第一层index索引
d.loc[第一层index]
d.iloc[第一层index下标]
#对第二层index索引
d.loc[第一层index][第二层index]
  • 索引的stack
    • stack()
    • unstack()

stack()可将一行的columns挪到index,unstack()可将一列的index挪到columns(变到最里层),参数level为控制挪哪一层,比如0就是第一层即为最外层,以此类推

  • DataFrame聚合操作
DataFrame.sum(axis,level)
axis控制是对行还是对列,而level是保留哪个层

image.png

相关文章

  • 数据分析概论

    数据分析框架 整个分析框架发为四大层次 数据规划 数据采集 数据分析 数据决策 在数据分析框架中,用户是数据的来源...

  • 数据分析的框架

    数据分析框架分为四层:数据规划、数据采集、数据分析、数据决策。 数据分析工作大多时间耗费在数据采集、清理、转换等脏...

  • 公众号数据分析

    数据分析定义:有目的的收集数据,是确保数据分析过程有效的基础 微信订阅公众号数据分析主要分析四项 A:用户分析类别...

  • 如何通过分析数据提升运营效果?

    用户数据、图文数据、菜单数据、消息数据这四个板块的数据分析方法: 1.用户分析 (1)用户属性分析 包括性别分布、...

  • 数据分析思维——业务指标如何建立

    一、数据分析的流程 整个数据分析的流程,可以分为五个步骤,四个层级,这四个层级就是需求层、数据层、分析层跟输出层,...

  • 数据靠分析,行业是基础

    四词故事:数据,搭建,行业,模型。 数据靠分析,行业是基础,搭建是建模,模型是模式。 数据靠分析 谈数据:数据是未...

  • 英国零售商销售分析

    目录一. 项目背景二. 数据探索三. 数据清洗四. 数据分析1. 消费趋势分析2. 用户行为分析3. 用户分类 (...

  • 大数据建设意见

    结合当前大数据建设现状 一、数据获取 二、数据治理 三、数据应用 四、数据分析

  • 微信公众号数据原来是这样分析的

    1-23 微信小游戏制作及公众号数据分析 微信公众号数据分析主要四项:用户分析/ 图文分析 / 菜单分析 / 消息...

  • 四种大数据分析方法与大家分享

    本文主要讲述数据挖掘分析领域中,最常用的四种数据分析方法:描述型分析、诊断型分析、预测型分析和指令型分析。 当刚涉...

网友评论

      本文标题:数据分析(四)

      本文链接:https://www.haomeiwen.com/subject/qnwxfqtx.html