Python数据分析:可视化

作者: 数据蛙datafrog | 来源:发表于2019-02-02 23:44 被阅读6次

    本文是《数据蛙三个月强化课》的第二篇总结教程,如果想要了解数据蛙社群,可以阅读给DataFrog社群同学的学习建议。温馨提示:如果您已经熟悉python可视化内容,大可不必再看这篇文章,或是之挑选部分文章


    对于我们数据分析师来说,不仅要自己明白数据背后的含义,而且还要给老板更直观的展示数据的意义。所以,对于这项不可缺少的技能,让我们来一起学习下吧。

    零:准备工作

    画图之前,我们先导入包和生成数据集

    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    import matplotlib
    %matplotlib inline
    np.random.seed(100)
    df = pd.DataFrame(np.random.randint(-10, 10, (10, 3)), 
                      index=pd.date_range("1/1/2000", periods=10), columns=list("ABC"))
    df = df.cumsum()
    df.head()
    

    我们先看下所用的数据集


    一:折线图

    折线图是我们观察趋势常用的图形,可以看出数据随着某个变量的变化趋势,默认情况下参数 kind="line" 表示图的类型为折线图。


    这里默认是把索引当作了X轴,列作为了Y

    二:柱状图

    对于分类数据这种离散数据,需要查看数据是如何在各个类别之间分布的,这时候就可以使用柱状图。我们为每个类别画出一个柱子。此时,可以将参数 kind 设置为 bar 。


    这里还是以索引为X轴,列为Y轴。我们还可以改变显示的轴

    当然我们还可以变成堆积柱状图

    三:条形图

    条形图就是将竖直的柱状图翻转90度得到的图形。与柱状图一样,条形图也可以有一组或多种多组数据。


    水平条形图在类别名称很长的时候非常方便,因为文字是从左到右书写的,与大多数用户的阅读顺序一致,这使得我们的图形容易阅读。而柱状图在类别名称很长的时候是没有办法很好的展示的。

    四:直方图

    直方图是柱形图的特殊形式,当我们想要看数据集的分布情况时,选择直方图。直方图的变量划分至不同的范围,然后在不同的范围中统计计数。在直方图中,柱子之间的连续的,连续的柱子暗示数值上的连续。


    五:箱线图

    箱线图用来展示数据集的描述统计信息,也就是[四分位数],线的上下两端表示某组数据的最大值和最小值。箱子的上下两端表示这组数据中排在前25%位置和75%位置的数值。箱中间的横线表示中位数。此时可以将参数 kind 设置为 box。


    六:散点图

    如果想要画出散点图,可以将参数 kind 设置为 scatter,同时需要指定 x 和 y。通过散点图可以探索变量之间的关系。


    七:饼状图

    饼图是用面积表示一组数据的占比,此时可以将参数 kind 设置为 pie。


    image.png

    我们刚开始学习的同学,最基本应该明白什么数据应该用什么图形来展示,同学们来一起总结吧。

    相关文章

      网友评论

        本文标题:Python数据分析:可视化

        本文链接:https://www.haomeiwen.com/subject/vkresqtx.html