直方图介绍
-
假设我们测量人们的身高
image-20201214095541387.png -
由于测量的人太多了,代表身高的点都重叠在一起了
image-20201214095739098.png
- 我们可以把相同的点堆起来,这样更直观。但是相同的点很少,大量的点依然被重叠在一起
-
因此我们不再堆积相同身高值的点,而是把身高值划分成不同的区段(bins),把点堆到这些区段中去。
image-20201214100932395.png
-
便得到直方图。最高的堆积,更多的的身高值在这个区域。我们可以使用这个直方图去预测未来得到身高值的概率。身高值落在中间区域的概率较高,落在两边的概率较低。如果你想用“distribution"去近似表达你的数据直方图是个很好的选择去证明你的结论。我们可以使用正态分布(normal distribution)来近似表达你的数据和未来的测量值
image-20201214101135085.png
-
如果你的数据像下图。我们可能会使用指数分布(exponential distribution)去近似表达你的数据和未来的测量值。
image-20201214102712742.png
-
注意事项:如何划分区段是很有讲究的。如果区段太窄,则没用。如果区段太宽,也没用。有时候我们不得不尝试不同的区段值,直到我们得到一个满意的直方图。换句话说,不要依赖程序提供的默认区段值来画图
image-20201214103258587.png
image-20201214103821240.png
网友评论