1. 二项分布
1.0 伯努利实验
① 实验只能有两种结果,发生或不发生,成功或失败,等等,不管怎么描述,只有两种互斥的结果
② 每次实验中,某种结果发生的概率是p,另一种结果发生的概率是1-p。
③ 实验是互相独立的,且可重复进行n次。
满足以上描述的实验,叫伯努利实验。伯努利实验对应的现实场景是有放回抽样。
1.1 二项分布
随机变量X描述的是:在n次伯努利实验中,单次实验发生概率为p的结果发生的次数~
![](https://img.haomeiwen.com/i2018986/c4b82f04ff09d8f2.png)
2 泊松分布
泊松分布描述的是一定时间段或空间区域或其它单位内某个事件发生的次数。这个事件满足两点要求:① 我们知道它在单位时间或单位空间内发生的平均次数(期望值);② 事件在任何时间或空间节点的发生是等可能的。
举个栗子:假设我们知道你的微信平均每天会收到3条消息(可太惨了),这并不是说你的微信每天一定会收到3条消息不多也不少,而是有可能一条也没收到,有可能收到100条,只是平均来说是3条。另外由于你的朋友都比较变态,你在凌晨和白天收到消息是等可能的,事实上你在任何时刻都有相同的概率会收到一条微信。那么你一天内收到的微信消息条数就满足泊松分布,其中一个参数就是上面说的3条。
泊松分布的具体形式:
![](https://img.haomeiwen.com/i2018986/a5b568d585a6487f.png)
PS1:显然,泊松分布描述的这个变量,期望是已知的。
PS2:泊松分布是一个偏态的长尾分布,峰值在λ处,左边在0处截止,右边延伸至无穷。
现实生活中很多次数类的数据,大概都能用泊松分布强行拟合一下。比如:用户过去半年在互联网小额贷款平台申请借款的次数
3. 超几何分布
前面说的泊松分布对应的场景是有放回抽样,超几何分布描述的场景则是不放回抽样。
举个栗子:若N个球里面有M个红色的剩下的不管,不放回的随机抽n个球出来,其中红色球的个数X,遵从的就是超几何分布。
![](https://img.haomeiwen.com/i2018986/74a72308033aac08.png)
网友评论