美文网首页
Pandas-统计信息可视化展示(一)

Pandas-统计信息可视化展示(一)

作者: Rainbow想喝奶茶 | 来源:发表于2022-02-23 15:37 被阅读0次

    接上回书,数据以Dataframe的形式存储后,接下来就是对一些数据进行计算或者图形化展示,直接上才艺了,感觉最近看的每一句都是一个知识点...

    数据分组

    原始数据
    针对上述数据,想要实现知道每个月有多少千克的销量,则是应用groupby实现分组操作。
    df1 = df.groupby(['year_month'])['kilogram'].sum().reset_index()
    # 括号内是分组依据的字段
    # 后续是分组后数据的处理,即是对kilogram这个字段进行求和。
    

    打印df1,结果如下:

    分组结果
    如果是在分组后,想对不同的列进行不同的数据处理,可以利用聚合操作agg
    df3 = df.groupby(['year_month']).agg({'kilogram': 'sum', 'amount': 'sum'}).reset_index()
    # 按照月份分组后,对一个月份的kilogram及amount分别进行求和
    

    执行结果如下:


    按月份对不同的字段进行聚合操作

    agg聚合操作有很多,如下所示:

    agg语法 代表意义
    max 最大值
    min 最小值
    mean 平均值
    sum 求和
    var 方差
    std 标准差
    median 中位数
    count 计数

    简单的数据可视化

    如果对于上述的分组结果,希望以柱状图的形式来看每一个月的销量变化。则可以应用plotly_express库。这个库设计简洁,只需导入,就可以画出可视化图形,实现简单的数据可视化。
    首先自然是需要安装:

    pip3 install plotly_express
    

    应用之前需要导入,通常会作为px进行使用。

    import plotly_express as px 
    
    柱状图

    依照最上方的df1,期望以柱状图的形式展现每个月的销量。实现语法如下

    fig = px.bar(df1, x='year_month', y='kilogram', color='kilogram')
    # x代表横轴,y代表纵轴,color代表颜色区分代表意义
    fig.update_layout(xaxis_tickangle=45) 
    # x轴坐标倾斜角度
    fig.show()
    # fig展示
    

    执行后,会自动在本地打开如下结果:


    柱状图
    折线图

    依照上方的df1,期望以折线图的形式展现每个月的销量。实现语法如下

    fig1 = px.line(df1, x='year_month', y='amount', markers=True)
    # x代表横轴,y代表纵轴,markers为True代表添加折线上点标记
    fig1.show()
    # fig1展示
    

    执行后,会自动在本地打开如下结果:


    折线图

    Pandas这个系列还是陆陆续续的努力更新中,最近的工作,不完全是测试了,开始有其它的任务了,但是我仍然希望能在第一季度结束的时候,Pandas有个小的完结~

    自我记录,有错误欢迎指正~~~

    相关文章

      网友评论

          本文标题:Pandas-统计信息可视化展示(一)

          本文链接:https://www.haomeiwen.com/subject/vpyolrtx.html