美文网首页
二项分布和泊松概率分布2018-04-17

二项分布和泊松概率分布2018-04-17

作者: 予汐 | 来源:发表于2018-05-02 08:54 被阅读0次

说起二项分布(binomial distribution),不得不提的前提是伯努利试验(Bernoulli experiment),也n次独立重复试验。伯努利试验是在同样的条件下重复、相互独立进行的一种随机试验。

   伯努利试验的特点是:

(1)每次试验中事件只有两种结果:事件发生或者不发生,如硬币正面或反面,患病或没患病;

(2)每次试验中事件发生的概率是相同的,注意不一定是0.5;

(3)n次试验的事件相互之间独立。

   举个实例,最简单的抛硬币试验就是伯努利试验,在一次试验中硬币要么正面朝上,要么反面朝上,每次正面朝上的概率都一样p=0.5,且每次抛硬币的事件相互独立,即每次正面朝上的概率不受其他试验的影响。如果独立重复抛n=10次硬币,正面朝上的次数k可能为0,1,2,3,4,5,6,7,8,9,10中的任何一个,那么k显然是一个随机变量,这里就称随机变量k服从二项分布

我们推导下随机变量X=k的分布律。显然0<=k<=n,n次抛硬币中获得k次正面,第1次正面在n次抛硬币中出现有n种方式,则第2次正面在n次抛硬币中出现有n-1种方式,以此类推,则出现的总可能方式是:n(n-1)...(n-k+1)种,如果我们并不考虑这k次正面出现的排列顺序,因此恰好出现k次的总可能性是n(n-1)...(n-k+1)/k!种,分子和分母同时乘以(n-k)!,则该式等于n!/(k!*(n-k)!),也就是通常的组合公式C(n,k)=n!/(k!*(n-k)!)。

那么对于抛n次硬币,其中正面出现的次数是k,反面出现的次数必然为n-k次,不考虑顺序的情况下,则每一次恰好获得k次正面的概率是pk*(1-p)n-k,而n次试验中恰好出现k次正面的可能性是C(n,k)=n!/(k!*(n-k)!)种,因此,n次抛硬币中恰好出现k次的概率为

P(X=k) = C(n,k) * pk*(1-p)n-k

这就是二项分布的分布律,记作X~B(n,p),其中C(n,k)是组合数,在数学中也叫二项式系数,这就是二项分布名称的来历。判断某个随机变量X是否符合二项分布除了满足上述的伯努利试验外,关键是这个X是否表示事件发生的次数。二项分布的数学期望E(X)=n*p,方差D(X)=n*p*(1-p),具体证明可见《二项分布均值和方差的简单推导》。

看一个示例:某人篮球投篮的命中率是0.3,总共投篮10次,问至少投中2次的概率?

分析:

(1)每次投篮有2种结果,投中或没投中;

(2)每次投篮的投中概率是相同的,都为0.3;

(3)每次投篮可认为是独立事件。

因此,符合二项分布。

投中次数的概率质量分布

显然,二项分布属于离散型分布。

至少2次投中概率即:P(X>=2)=P(X=2)+P(X=3)+P(X=4)+...+P(X=10)。

输出结果:0.85

   再看一个例子:某种疫苗注射后过敏反应的概率是0.08,问某社区卫生院在接种该疫苗100人后,少于3人有过敏反应的概率是多少?

采用上例中的分析方法,该问题也属于二项分布问题。少于3人有过敏反应,即求:

P(X<3)=P(X=0)+P(X=1)+P(X=2)=C(100,0)(0.08)0(0.02)100+C(100,1)(0.08)1(0.02)99+C(100,2)(0.08)2(0.02)98=0.01127=1.127%

   在实际应用中还有伯努利分布、两点分布、0-1分布等,它们与二项分布之间有什么关系呢?

X~B(n,p),当n = 1时,二项分布就变成了伯努利分布(Bernoulli distribution),伯努利分布又称为“两点分布”或“0-1分布”,或者说伯努利分布/两点分布/0-1分布是二项分布在n=1时的特例,即伯努利分布、两点分布、0-1分布这三种分布是同一个分布的不同名称,又都是二项分布在n=1时的特例。

泊松概率分布

泊松概率是另外一个常用的离散型随机变量,它主要用于估计某事件在特定时间或空间中发生的次数。比如一天内中奖的个数,一个月内某机器损坏的次数等。

泊松概率的成立条件是在任意两个长度相等的区间中,时间发生的概率是相同的,并且事件是否发生都是相互独立的。

泊松概率既然表示事件在一个区间发生的次数,这里的次数就不会有上限,x取值可以无限大,只是可能性无限接近0,f(x)的最终值很小。

泊松概率还有一个重要性质,它的数学期望和方差相等。

让我们先通过一个例子,了解什么是"泊松分布"。

已知某家小杂货店,平均每周售出2个水果罐头。请问该店水果罐头的最佳库存量是多少?

假定不存在季节因素,可以近似认为,这个问题满足以下三个条件:

(1)顾客购买水果罐头是小概率事件。

(2)购买水果罐头的顾客是独立的,不会互相影响。

(3)顾客购买水果罐头的概率是稳定的。

在统计学上,只要某类事件满足上面三个条件,它就服从"泊松分布"。

各个参数的含义:

P:每周销售k个罐头的概率。

  X:水果罐头的销售变量。

  k:X的取值(0,1,2,3...)。

  λ:每周水果罐头的平均销售量,是一个常数,本题为2。

从上表可见,如果存货4个罐头,95%的概率不会缺货(平均每19周发生一次);如果存货5个罐头,98%的概率不会缺货(平均59周发生一次)。


泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数,宇宙中单位体积内星球的个数 ,耕地上单位面积内杂草的数目等 。

相关文章

  • 如何在Python中实现五类强大的概率分布

    五类概率分布 二项分布(Binomial Distribution) 泊松分布(Poisson Distribut...

  • 应用数学

    时间序列分析 马尔可夫过程 概率论 正态分布 二项分布-百度百科 二项分布-统计之都 泊松分布 泊松分布的现实意义...

  • 【泊松分布】

    从二项分布到泊松分布 二项分布概率公式: 泊松分布需要做以下假定: 一个事件在一段时间或空间内发生的平均次数或数学...

  • 概率分布

    几个重要的概率分布 离散型概率分布:二项分布,泊松分布,超几何分布 连续型概率分布:正态分布 由正态分布导出的几个...

  • 木东居士学习计划:第三周 数据分布(详实版)

    基本概念古典概率条件概率离散分布连续变量期望值 离散变量的概率分布二项分布伯努利分布泊松分布 连续变量的概率分布均...

  • 泊松分布

    泊松分布条件泊松分布条件.PNG 二项分布的近似 二项分布 n 较大,p 较小的时候可以用泊松分布来近似,减小计算...

  • 使用泊松分布判定chipseq的蛋白结合位点

    二项分布和泊松分布都描述的是事件成功次数的分布,泊松分布是二项分布的极限分布,其适用条件是n很大,p很小的情况。生...

  • 统计学第五周——实践概率分布

    本周为实践周,主要学习任务为使用python实现概率分布,包括二项分布、伯努利分布、泊松分布、几何分布以及正态分布...

  • 概率分布-python实现

    本文主要描述概率分布的python实现方法,包括二项分布、伯努利分布、泊松分布、几何分布、正态分布等。 一、二项分...

  • 泊松分布

    泊松分布由二项分布推导而来, 当二项分布 , 时, 便得出泊松分布的公式:其中: 单位时间内, 事件发生的次数, ...

网友评论

      本文标题:二项分布和泊松概率分布2018-04-17

      本文链接:https://www.haomeiwen.com/subject/bykpkftx.html