阶段学习完概率统计和数据分析的内容,之前也说了想拿这个练练手,如果能换点收入也许还不错(白日梦)
结论:彩票没有规律可循
期望收益为负,但可以用统计方法排除极个别号码(16年只出现一次这类的),中奖只能全靠运气,所谓专家或者可以预测的网站或是其他神棍方法一律不能信
一、各玩法中奖期望概率一致
先来简单介绍一下投注方式
1、玩法和介绍:
单选:在0~9中选择3个号
彩金为1040元,组选300元
组选:
一种是包含对子的三个号,奖金为300元左右
排列组合方式为3种
另一种是选3个号,排列组合方式为6种,但奖金为170元
2、概率和期望:
0~9共10个号码,预期概率是均匀分布(这点后面再根据历史记录分析),是放回型的,也就是10×10×10=1000种可能性
可以看出期望上都差不多,既然期望概率上差不多,那么我们来看看数字频数分布情况,是否不是均匀分布,并且能提高中奖概率呢?
二、初步统计上没有发现规律
分析顺序
1、爬取所有数据
2、各位置数量频数分布
3、各号码组合出号情况
4、同期各数字联合频率分布
5、同一号码重复出现间隔天数
1、爬取相关数据
因为官网只有100期,所以爬了第三方网站的数据,然后做了一些数据清洗
2、所有时间和近30天频数分布
分为1,2,3位分别分析比较
1.png
可以看出长期来看频率的分布都差不多,长期的各位置频率极差为0.02,也就是2%,实际上想实用的话意义不大。
但是最近一个月内,2位上个别数字频率最大值达到了0.25,可以尝试用来预测。
3、组合出号概率
3 6 9 0.002565
5 7 3 0.002381
7 3 1 0.002198
6 6 9 0.002198
2 0 9 0.002198
6 6 7 0.002198
1 3 9 0.002198
0 2 0 0.002198
8 2 7 0.002198
3 9 3 0.002198
这些是组合出号最高的10个号码,最高的次数是14,在5000多条样本里,只出现了14次,这个不能拿来参考。
4.同期各数字联合频率分布
这个是总的频率
2.png
这个是最近30天的
4.png
可以看出出号还是很稳定的低,除了有些组合稍微比别的高那么一丁点外(真的是一丁点),概率很稳定没有什么相关性
把1,2,3列分别对比出来大于总体90%分位数的组合滤出来,然后合并到一起,做了一个排名,但是概率也没多高
1 2 3
0 8 0 2
1 2 9 6
2 7 0 2
3 7 0 4
4 8 0 4
5 3 3 7
5.同一号码出现间隔
使用了全部时间的数据
出过号码后再出一次号码的间隔时间:
平均为832天,标准差是777天
所以可以得出没有规律可循
现在基本可以做出结论了
网友评论