说到条形图,我们都很熟悉了,它分为两种,一种是水平条形图,一种是垂直条形图。
无论是哪种条形图,我们总能精确的对数据的相对大小进行比较。这里面每一个长方形都代表着一个一个类别,比如上图中的区域1与区域2。
而长方形的长度则代表着这个类别在某维度下的数值。长度越长,数值越大。
但如果我们面对的数据它是以一个数值范围作为一类的话,比如0~10分。那么,这个时候,我们可以选择用直方图来展示数据。比如下面这样。
乍一看,这直方图和条形图好像没有什么两样,只是横轴不再是具体类别,而是换成了数值范围。
但是直方图有个特点:频数与每个长方形的面积必须成比例。
为什么这么说呢?因为在直方图里面,每个长方形的面积是已知的,就是每组频数。
因为长方形的面积等于长×宽,又介于长方形面积=频数,因此长方形面积公式我们可以等价为:
并且,在直方图里面,长方形的高度不仅代表着在这个区间里有多少频数,还用于量度这个特定组里频数的集中程度,用以说明数据到底是密集还是稀疏。
换句话说,直方图中的长方形高度代表着频数密度。如果用下面这个图来说明的话,就更好懂了。
最后,总结一下:
- 条形图分为水平条形图和垂直条形图,它的作用在于能让我们更精确的对数据的相对大小进行比较。
- 直方图的横轴不是具体的类别,而是一个个相互接续的数值范围。
- 在直方图中,频数与每个长方形的面积必须成比例。
参考资料:
《深入浅出统计学》
网友评论