美文网首页
深入浅出统计学(一)信息图形化

深入浅出统计学(一)信息图形化

作者: rhuanhuan | 来源:发表于2018-06-12 23:41 被阅读25次

统计能够化繁为简
通过可视化的方法,使之公之于众


要点

频数是一种统计方法,用于描述一个类别中有多少个项
饼图很好的体现比例
条形图更灵活,更精确
水平条形图用于展现类别数据,尤其类别名称太长时候
一个条形图上多个数据,可以采用堆积or分段
直方图展示数值型数据
直方图的面积表示频数,高度是频数密度。
频数密度=频数/组距
累计频数: 规则下的累计频数总和
折线图表示趋势,并且合适很多个对比
时间序列图就是折线图的一种


善于利用合适的图表

1. 饼图

用途:对不同组类进行比较。并且容易一眼看出哪个组具有较高频数
无用:当扇形块大小相似时候


2. 条形图

用途: 类似于饼图,但是更精确
类型: 垂直,水平两种

标度

百分比
数字/频数
并不是所有的图表都以标度0作为起点,这可以给人造成完全不一样的第一印象,因此看别人图时候要小心这一点。

处理多批数据

堆积条形图(一种类型有多个条)
分段条形图(一个类型一个条,但是有多段)

类别与数字

类别数据(定性数据),例如游戏的种类。
数值型数据(定量数据)例如重量,时间,标尺


3. 直方图

直方图与条形图不同,直方图适合数字类型的数据;条形图适合类别数据。直方图通常是连着的。

  • 优点:对于数值型图形,可以体现每个区间的宽度,还可以体现频数。
  • 直方图每个区间的宽度可以不一样
  • 长方形之间不能有间隔,一是为了体现数值没有间隔,所有的都包含在内;而是让区间宽度反映涵盖的数值范围
  • 注意长方形区间的汇合问题。(向上取整,向下取整,四舍五入都不一样)
  • 直方图的面积表示频数,高度是频数密度。
区间宽度不同的直方图

直方图的长方形面积必须与频数成正比。不用高度而用面积,可以保证每个组的相对大小与数据成正比例而不失真。
频数密度=频数/组距
可以将一杯果汁视为频数,果汁的高度就是频数密度,当杯底越宽,频数密度越小。

短板

比如:累计总和


4. 折线图

表达累计频数。
折线图可以很好地体现数据趋势,并且多个对比不会太过拥挤。(条形图多个对比就很拥挤)
短板:不要用折线图表示类别数据
时间序列图就是折线图的一种

更多资料可以搜索数据可视化

相关文章

网友评论

      本文标题:深入浅出统计学(一)信息图形化

      本文链接:https://www.haomeiwen.com/subject/xzareftx.html