美文网首页
深入浅出统计学(一)信息图形化

深入浅出统计学(一)信息图形化

作者: rhuanhuan | 来源:发表于2018-06-12 23:41 被阅读25次

    统计能够化繁为简
    通过可视化的方法,使之公之于众


    要点

    频数是一种统计方法,用于描述一个类别中有多少个项
    饼图很好的体现比例
    条形图更灵活,更精确
    水平条形图用于展现类别数据,尤其类别名称太长时候
    一个条形图上多个数据,可以采用堆积or分段
    直方图展示数值型数据
    直方图的面积表示频数,高度是频数密度。
    频数密度=频数/组距
    累计频数: 规则下的累计频数总和
    折线图表示趋势,并且合适很多个对比
    时间序列图就是折线图的一种


    善于利用合适的图表

    1. 饼图

    用途:对不同组类进行比较。并且容易一眼看出哪个组具有较高频数
    无用:当扇形块大小相似时候


    2. 条形图

    用途: 类似于饼图,但是更精确
    类型: 垂直,水平两种

    标度

    百分比
    数字/频数
    并不是所有的图表都以标度0作为起点,这可以给人造成完全不一样的第一印象,因此看别人图时候要小心这一点。

    处理多批数据

    堆积条形图(一种类型有多个条)
    分段条形图(一个类型一个条,但是有多段)

    类别与数字

    类别数据(定性数据),例如游戏的种类。
    数值型数据(定量数据)例如重量,时间,标尺


    3. 直方图

    直方图与条形图不同,直方图适合数字类型的数据;条形图适合类别数据。直方图通常是连着的。

    • 优点:对于数值型图形,可以体现每个区间的宽度,还可以体现频数。
    • 直方图每个区间的宽度可以不一样
    • 长方形之间不能有间隔,一是为了体现数值没有间隔,所有的都包含在内;而是让区间宽度反映涵盖的数值范围
    • 注意长方形区间的汇合问题。(向上取整,向下取整,四舍五入都不一样)
    • 直方图的面积表示频数,高度是频数密度。
    区间宽度不同的直方图

    直方图的长方形面积必须与频数成正比。不用高度而用面积,可以保证每个组的相对大小与数据成正比例而不失真。
    频数密度=频数/组距
    可以将一杯果汁视为频数,果汁的高度就是频数密度,当杯底越宽,频数密度越小。

    短板

    比如:累计总和


    4. 折线图

    表达累计频数。
    折线图可以很好地体现数据趋势,并且多个对比不会太过拥挤。(条形图多个对比就很拥挤)
    短板:不要用折线图表示类别数据
    时间序列图就是折线图的一种

    更多资料可以搜索数据可视化

    相关文章

      网友评论

          本文标题:深入浅出统计学(一)信息图形化

          本文链接:https://www.haomeiwen.com/subject/xzareftx.html