双十一过去了,很多人关注双十一的销售额, 然后就看到了这样一个图片
image.png这个图的意思是:把双十一历年数据进行二项式拟合,发现拟合R值特别接近1,认为从概率学上来说不可能事件,进而推断数据造假。 对于这类文章,我从来都是抱着怀疑和自我求证的态度, 下面我就自我求证下。
image.png如上图, 我把双十一历年数据整理好,做了几个维度的二项式拟合。分为实验组和对照组。
实验组:
- 2009-2019年全部数据。 实验组满足上文中所说拟合后R值接近1;
对照组:
- 将十年数据分割,看看前5年数据和5年数据的拟合结果。 如图2009-2014 ,2014-2019. 可以看到拟合R值依然在1左右。只是我们看到二项式的系数,前两个和后面的已经不一样了。
- 我还尝试了从2009 分别到2017,2018,2019年数据, 可以看到无论是R值还是系数,都是变化的。
-
我又尝试手动修改其中任何年付的数据, 比如给2012年增加20,或者18年减少100,其结果R值变化依然很小。
2012年增加20
2018年减少100
-
结论:1. 二项式拟合,对于这里销售数据都可以拟合出R值在1左右的,无论是京东还是淘宝。这个是个正常现象,并不是上文说的是很特殊现象。
- 敲黑板重点: 上图中其实弄混了概念了。概率论中的不可能事件是说的概率小于5% 的事件, 这个数值是概率。 而作者把R值偷换成概率,用R值接近1 来诱导人民以为这事概率很低。
所以, 并不能通过上面的拟合就推导出淘宝双十一造假,证据不足。
网友评论