一、Poisson分布
你是否关注过在一个小时内达到某餐厅的顾客数量,某商品在一天内的销售量?在这两个例子中,事件发生的次数是离散的整数,并且可以用平均发生的次数描述给定时间段内的频率,该问题就是Poisson分布,Poisson分布是一种常用的离散型概率分布,是由二项分布的渐进公式提出,而后人们对此进行深入研究,发现实际生活中很多现象都服从Poisson分布,比如某医院每周接收到的急诊患者数量、显微镜下某单位方格内细胞数等等。
一般而言,变量X的取值为非负整数,即0,1,2,…,其相应取值的概率为:
称X服从于lambda为参数的Poisson分布,记为X{sim}Pleft(lambda ight),其中lambda是大于0的常数,称为Poisson分布的参数,e为自然对数的底,e约为2.7183。
二、Poisson分布特征
Poisson分布的特征一般有离散性、独立性、普通性、平稳性以及均值和方差相等。
Poisson分布的图形特征:若X服从参数为lambda的Poisson分布,以X的取值为横轴,相应的概率P(X)为纵轴,一般随着lambda的增大,Poisson分布的对称性越来越好。
三、Poisson分布检验
(一) 检验步骤
Poisson分布检验步骤如下:
1建立假设
一般先进行建立一个原假设和一个备择假设,原假设一般数据符合泊松分布,备择假设是数据不符合泊松分布。
2计算期望值
根据数据样本计算出时间时间发生的平均次数,即期望值。
3分组计数
将数据按照时间发生的次数进行分组,并统计每个分组中的观察频数。
4计算理论频数
使用泊松分布的概率质量函数,根据期望值lambda和分组中的事件次数,计算出每个分组的理论频数。
5进行假设检验
使用适当的统计检验方法,比如卡方检验等,计算观察频数与理论频数之间的差异程度。
6判断结果
根据计算得到的统计检验值和显著性水平,判断是否拒绝原假设,从而判断是否符合泊松分布。
(二) 案例计算
1.Poisson分布计算概率
根据某医院外科接诊的情况长期观察,发现颈椎问题的患者站接诊患者总数的2.0%,已知该科室某日接诊100人,试计算其中有5位患者出现颈椎问题的概率。
设X表示“100个人中出现颈椎问题的人数”,X服从Poisson分布,由题可知,n=100,pi=0.01,lambda=npi=100*0.02=2;
2. Poisson分布检验
某研究人员观察某医院每天急诊患者数量,总共观察50天,所以共有50个样本数据,最终针对50个数据进行汇总如下表,一列表示该天医院患者数量,一列表示有几天出现这样的情况,数据格式如下:
分析路径:
SPSSAU【实验医学/研究】→Poisson检验,
分析结果如下:
从模型可以看出卡方值为55.729,根据p值小于0.01(**表示显著性水平为0.01)的显著性水平,拒绝原假设说明数据不符合泊松分布的假设。其中卡方统计量的计算如下:
chi^{2}=sumrac{(A-E)^{2}}{E}=sum_{i=1}^{k}rac{(A_{i}-E_{i})^{2}}{E_{i}}=sum_{i=1}^{k}rac{(A_{i}-np_{i})^{2}}{np_{i}}(mathrm{i}=1,2,3,ldots,mathrm{k})
并且从柱状图也可以直观查看到:
四、知识小贴士
1、Poisson分布数据
Poisson分布数据一定是指每单位内的发生频数,比如某个路口每天闯红灯的汽车数量;一年内每万人中丢手机的频数等;
2、检验方式
Poisson检验共有两种检验方式,一种是通过特征判断;另外一种是通过Poisson检验。在现实研究中,可能更多会通过特征进行判断是否基本符合Poisson分布。
参考文献:
[1]孙振球.医学统计学.第3版[M].人民卫生出版社,2010.
网友评论