彩票的本源里面有各种各样的数据,这些数据类型不一,数量庞大。从混沌的眼光来看,这些数据是杂乱无章,无迹可寻的。但是如果我们有意的对这些无序的数据进行整理和分类,并且从不同的角度进行描述,那么我们就可以看清楚它们内在的变化趋势,了解它们的本质特征。
不管彩票数据如何变化,我们都可以从三个维度来进行描述,这三个维度就是:
算术平均值是最常用的数据集中趋势指标,决定算术平均值是否适用的前提条件是,你求得的算术平均值是否具有现实意义。我们这里只简单介绍一下简单算术平均值。
简单算术平均值是最典型,最常用,最具代表性的集中趋势指标。将数据集合中的所有的数据值相加的和除以数据值个数得到的值就是简单算术平均值。假设
算术平均值是应用最广泛的集中趋势指标,理解起来比较简单,受样本数据波动的影响也小,具有一定的稳定性。但是呢它也有缺点,就是当数据集合中有极大值或者极小值的时候,会对算术平均值产生很大的影响,计算结果会掩盖数据集合的真实特征,这时算术平均值就失去它的代表性,不再具有参考价值。
理论上大乐透2连号在本源里面共有8306760注号码,一年开59.7期。
59.7 – 57.5 =2.2期。就少啦2期,实际跟理论还是比较接近的。但是我们也应该看到理论上应该一年开60期,2015年实际开出54期,比理论值少开啦6期,那这个实际开出值54期就比较小,所以它就在很大程度上影响啦平均值的结果。
光是浏览一下数据,恐怕我们什么也弄不明白,只能看到一些简单的数字的罗列,但是我们能够抽取出这些数字的特征,并加以分析,我们就能对这些数字有一个本质的认识,简单算术平均值虽然简单,但是却是我们迈出啦彩票统计分析的第一步。
算术平均值会受到极端值的影响,不能完全展现数据集合的特征,而离散程度指标可以在一定的程度上弥补集中趋势指标的这个缺陷。方差作为一种离散指标可以反映出数据的离散程度,方差越大,说明数据集合的波动程度越大。方差越小,说明数据集合的波动程度越小。离散程度是一个相对的概念,需要一个参考值的对比,而算术平均值是最重要,也是最常用的一个集中趋势指标,所以均
值可以作为一个参考值。
下面我们看两组数据,分别是2连号的4年的开出数据,跟2尾号的4年的开出数据,看看它们在均值的周围是如何分散的。我们这里用标准差来度量它。
对比3.24和3.535,两个标准差差不多。但是数据A的标准差比数据B的标准差要大一点。
对于一个数据集合,计算其算术平均值的偏离可以表示其离散程度。平均偏差指的就是算术平均值的偏离,有一个问题是数据集合中的每个数值与算术平均值之间的偏差之和等于0,所以我们使用绝对值,然后再用平均的方法,消除啦负号带来的影响,这就有啦平均偏差的产生。
平均偏差举例,求算下列某工厂生产的产品的数据的平均偏差:
11.22cm,11.49cm,11.85cm,12.11cm,11.57cm
算出来平均偏差是0.266。
这是平常数据的平均偏差的计算方式,我们这里介绍一种适用于乐透型彩票的平均偏差的计算方式。这种平均偏差的计算方式只适合于乐透型彩票,是在以根为本去看世界这样一种宇宙观下诞生的思想,跟平均偏差不同的地方在于,我们不是让数据集合中的每个数值与算术平均值相减,而是让每个数值与一个固定的值相减,这个固定的值就是根果图中的果值。所以这样的偏差称为果值平均偏差。
我们算一下大乐透2连号这连续4年开奖结果的果值平均偏差:
果值平均偏差以果值为导向。根据大数定理,应该是统计的次数越多,果值平均偏差越小,当统计次数N趋于极限大,果值平均偏差为1。感兴趣的老铁可以证明一下,很好证明。
果值平均偏差可以从数据上看出果值的离散程度。果值平均偏差越大说明过往的开奖偏离中心点果值越大,反之越小说明其离散程度越小。
还是这张表:
求这4年的果值均值:
(58-60)+(54-60)+(55-60)+(63-60)/ 4 = -2.5。
所以说这4年的实际开奖结果的果值均值就是-2.5。果值均值的极限是0,统计期数越多,越会趋向于0。
果值均值,指的就是用实际的开奖结果的果值减去理论上的果值,然后除以相应的期数,所得到的这个数值称为果值均值,果值均值会随着统计期数的增加而趋向于0。
网友评论