0-1分布
0-1分布就是n=1情况下的二项分布。即只先进行一次事件试验,该事件发生的概率为p,不发生的概率为q=1-p。这是一个最简单的分布,任何一个只有两种结果的随机现象。
![](http://www.forkosh.com/mathtex.cgi? p(X = k) = pk(1-p){(1-k)} )
![](http://www.forkosh.com/mathtex.cgi? E(X) = p)
![](http://www.forkosh.com/mathtex.cgi? D(X) = p(1-p))
二项分布
二项分布即重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。
![](http://www.forkosh.com/mathtex.cgi? p(X = k) = C_nkpk(1-p)^{(1-k)}} )
![](http://www.forkosh.com/mathtex.cgi? E(X) = np)
![](http://www.forkosh.com/mathtex.cgi? D(X) = np(1-p))
泊松分布
Poisson分布(法语:loi de Poisson,英语:Poisson distribution,译名有泊松分布、普阿松分布、卜瓦松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等),是一种统计与概率学里常见到的离散概率分布.
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于描述单位时间内随机事件发生的次数。
![](http://www.forkosh.com/mathtex.cgi? p(X = k) = \frac{\lambda ^ k}{k!}e^{-\lambda} )
![](http://www.forkosh.com/mathtex.cgi? E(X) = \lambda)
![](http://www.forkosh.com/mathtex.cgi? D(X) = \lambda)
泊松分布与二项分布
当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧10,p≦0.1时,就可以用泊松公式近似得计算。
事实上,泊松分布正是由二项分布推导而来的。
多项式分布
多项式分布(Multinomial Distribution)是二项式分布的推广。
二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。把二项分布公式推广至多种状态,就得到了多项分布。例如在上面例子中1出现k1次,2出现k2次,3出现k3次的概率分布情况。
![](http://www.forkosh.com/mathtex.cgi? p(X_1 = n_1, ..., X_k = n_k) =\frac{n!}{n_1!n_2!...n_k!}p_1n_1...p_kn_k, \sum_{i=1}^k{n_i} = n(otherwise, 0))
beta分布
在概率论中,Β分布也称贝塔分布,是指一组定义在区间的连续概率分布,有两个参数α,β。
Dirichlet分布
狄利克雷分布是一组连续多变量概率分布,是多变量普遍化的Β分布。
狄利克雷分布奠定了狄利克雷过程的基础,被广泛应用于自然语言处理特别是主题模型(topic model)的研究。dirichlet distribution就是由2种结果bernoulli trial导出的beta distribution外推到k种的generalization。
高斯分布
正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)。
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线
若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
![](http://www.forkosh.com/mathtex.cgi? f(x) =\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(x-\mu)2}{2\sigma2})
![](http://www.forkosh.com/mathtex.cgi? X\sim N(\mu, \sigma^2), Y = \frac{X-\mu}{\sigma} \sim N(0,1))
网友评论