从数据差异寻找经营的差异
统计学中,把不是因数据分散而偶然产生的差异叫作统计学上的显著性差异
在商业分析中,仅仅理解平均值和标准差是远远不够的。统计学上的显著性差异可以认为是业务差异导致的必然结果。商业分析就是要通过数据来倒推背后的原因。
在现实的商业分析中,比较几个对照组别中的平均值,一般不会超过2个标准差,如果有2个标准差那么大,不进行统计学上的数据运算也能明显发现差异。因此,统计学上需要用最少的数据来发现比2个标准差更小且更有现实意义、具有统计学上的显著性的差异。
基于差异的两种极端决策
为了用最少的数据发现比2SD(±2倍标准差)更小的统计学上的显著性差异,需要了解统计功效。
统计功效是指“在存在差异的假设成立的情况下,认为显著性差异存在的概率”
坦率的说我开始很难理解这个统计功效,我在阅读《统计思维》的基础上参考了简书作者年青的海岸的文章《统俗讲义之——如何计算统计功效(Statistical Power)》,这里阐述下我所理解的概念。
当我们遇到的两组数据,并希望发现其中的显著性差异时,会有这么一种情况,事实上存在差异,但是我们有可能能发现这个显著性差异的概率是1到0之间。当发现显著性差异的概率趋近1的时候,统计功效趋近0,可以理解为“我们100%可以发现这个显著性差异,还统计它干啥?”当发现显著性差异的概率趋近0的时候,统计功效趋近1,可以理解为“我们不可能发现这个显著性差异,赶紧让统计来发掘立功吧!”
所以当我们的两组数据的平均值偏离2SD以上,我们完全可以认为他们有差异了,也就不用检验显著性差异了,这种的统计功效很弱。当然也不能一味的提高统计功效,马克·吐温说过“坏掉的时钟每天业至少由两次指向正确的时刻”,这种情况就是“明明没有差异却主张差异存在“的错误,这种的统计功效很大,但是毫无意义。
统计学上,把“明明不存在差异却认为存在”的错误称为α错误,把“明明存在差异却没有发现”的错误称为β错误。可以理解α错误是过分激进的错误,β错误是过于保守的错误。(统计功效=1-β)
寻找科学权衡的方法
统计学在两种错误之间权衡取舍,但是也不能同时将两种错误降为0。我们可能会限制α和β错误发生的概率区间,对这种错误的允许程度被称为显著性水平。
在确定显著性水平后,在给定的显著性水平范围内,想办法将β错误最小化,或者将统计功效最大化。这种用来判断是否可以认为假设成立的方法在统计学中称为检验(统计性假设检验)。
在给定的显著性水平之下统计功效最高的检验方法,在统计学上则称为最强检验或最大功效检验。
在做任何决策之前一定需要样本或者全局的数据做分析,以样本做分析时首先需要了解样本量对统计结果的影响程度,也就是误差范围与数据数量的关系。统计学中误差的范围需要根据数据的数量和数据的分布方式(方差或标准差)来准确的计算。
统计学上的误差就是从有限数量的数据求出的平均值,以何种概率在何种程度上偏离“真值”。
从概率上偏离真值
从程度上偏离真值
原始数据分散程度越大,利用相同数量的数据求出来的平均值的偏离范围也就越大。
选取的抽样数据多少才合适
被选出来的样本所包含的数据数量就是抽样统计的样本量
从一组数据中多次抽取样本数据就平均值,得到的多个平均值的标准差,叫做标准误差(英文缩写SE)。

有公式可以知道平均值的分散程度(标准误差)一定会小于原始数据的分散程度(标准差),另外计算平均值所使用的数据样本量增加标准误差就会变小。
这样就可以根据实际情况来选择一个恰当的样本量,权衡误差范围和调查相应样本量的数据所需时间。
一个证明决策正确的方式
如果考虑的目的是洞察因果关系,就需要统计性假设检验的思维方式。
统计性假设思维下首先要确定“讨论的范围”,将假设的焦点集中到当前能收集到的数据中,然后再进行假设。制定“完全颠覆自己主张”的假设,然后如果根据实际数据,能证明这个假设只在非常不可能的概率下成立,就能证明自己的主张很难被完全颠覆了。
在预估自己的假设成立的情况下,初选这种现象的概率称为P值(p-value)。当p值足够小,我们可以认为原假设几乎不可能发生是合理的。一般情况下这个足够小用5%作为界限。相应的也就证明了自己的主张很可能是合理的。
参考资料:李晨 译 【日】西内启 著《统计思维》浙江人民出版社
网友评论