概率分布:
描述了一个随机变量在一个范围内,取某个值的概率。直观来说就是一张图,横坐标是随机变量的取值,纵坐标是对应的概率。严格来说对于连续分布,对应的概率是一个微小区间内的积分
二项分布:
丢硬币,丢N次,每次正面概率为P,反面概率为1-P,其中有K次为正面的概率。记为P(X)=N!/K!/(N-K)!*(P^K)*((1-P)^(N-K))
前面的N!/K!/(N-K)!实际上是从N中取K硬币的取法有多少种,就是以前学的排列组合。为什么叫二项分布,因为(1+x)^n 这个式子,其x^k这一项的系数,就是前面的C(N,K),因为是从N项中挑两个出来,然后有多少种挑法,系数就是多少。
应用:重复进行某个实验。实验的结果只有两种。每次实验的概率相互独立。
泊松分布:
通过观察,路口每小时平均通过μ(平均值,或数学期望)辆车。让你计算在1个小时内,过k辆车的概率?
假设,我用二项分布的知识来推导。1秒钟内我近似认为,只可能通过一辆车或0辆车,不可能通过多于1辆。那么问题转变为,在3600次试验内,有K次通过车辆的次数的概率有多大。
1秒钟内通过车的概率为μ/3600。 所以根据二项分布,概率为N!/k!/(N-k)!*k^(μ/N)*(N-K)^(1-μ/N) 其中N=3600
那么如果1秒钟也不够短呢?也许一秒钟内有好几辆车通过。于是让N取无穷大的极限,变成lim(n->∞)(N!/k!/(N-k)!*k^(μ/N)*(N-K)^(1-μ/N) )
可以通过推导,得到该极限的值为e^(-λ)*λ^k/k! 就是泊松分布的概率密度函数。其中λ就是μ。
推导的过程可以参见网易公开课的可汗学院的统计学,泊松分布2. 推导的最重要的过程是用到了e=lim(1+1/x)^x
泊松分布适合描述一段时间内发生指定次数的概率。每小段时间发生的概率要相互独立。
正态分布
给一组数值,知道了平均值λ和方差δ,就可以估算出数值为k的概率。
如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。抛硬币也可以算是正态分布。
网友评论