一、案例介绍
某研究者为检验某冶炼厂的砷暴露与因呼吸道疾病死亡之间的关系,对该厂1978-2009年的职工进行了回顾性队列研究,请对资料进行分析。
二、问题分析
本案例的分析目的为是否砷暴露与呼吸道疾病死亡之间的关系,了解单位时间、单位面积或者空空间内某时间发生数的影响因素,可以考虑使用Poisson回归,并且‘是否砷暴露’这个数据满足平稳性、独立性和普通性这三个特征,因而可以使用Poisson回归进行研究。
三、软件操作及结果解读
(一) 数据导入
1.数据格式
首先将数据整理成正确的格式,一般一个X为一列,Y为一例,并且分析的数据带有数据标签的,需要另添加一个表格进行说明,数据格式如下
2.导入数据
将整理好的数据上传至SPSSAU系统内,如下:
上传的数据如下:
(二) 适用条件判断
1.软件操作
Poisson回归分析路径为点击【实验/医学研究】→【poisson回归】然后进行分析:
2. 结果解读
分析Poisson回归模型似然比检验结果的目的主要是检验整体模型的有效性,首先对p值进行分析,如果该值小于0.05,则说明模型有效;反之则说明模型无效,AIC和BIC值用于多次分析时的对比;此两值越低越好;如果多次进行分析,可对比此两个值的变化情况,综合说明模型构建的优化过程,如果不进行多次分析对比,则无需关注此指标。从分析结果来看,p值小于0.05,因而说明拒绝原定假设,即说明本次构建模型时,放入的自变量具有有效性,本次模型构建有意义。其中AIC、BIC的计算如下:
AIC=-2ln(L)+2k;BIC=-2ln(L)+ln(n)*k;
其中 : L是该模型下的最大似然,n是数据数量,k是模型的变量个数。
然后查看poisson回归分析结果:
然后进行查看数据是否满足等离散检验:
o检验用于检测数据是否等离散。如果O值绝对值大于1.96(此时p 值小于0.05),则说明数据过离散,此时可考虑使用负二项回归进行研究。如果o值绝对值小于1.96 (此时p 值大于0.05),则说明数据等离散,此时数据适合使用Poisson回归,发现o检验的o值为19.402>1.96,p值小于0.05,说明数据过离散,此时可考虑使用负二项回归进行研究。负二项回归的结果如下:
从上表可知,以死亡数作为因变量,有砷暴露为自变量,进行负二项回归分析,从上表可以看出,模型公式为:Log(Y)=-5.919 + 0.597*砷暴露_有砷暴露 + ln(观察人年数)。但是砷暴露_有砷暴露的回归系数值为0.597,p值大于0.05,但是并没有呈现出显著性,说明有无砷暴露不会影响死亡数。
四、结论
想要某冶炼厂的砷暴露与因呼吸道疾病死亡之间的关系,使用SPSSAU进行poisson回归分析,通过模型似然比检验,但是数据过离散,没有通过O检验,所以进行负二项回归,进行负二项回归后,发现模型不显著,有无砷暴露不会影响死亡数。
五、知识小贴士
1、SPSSAU的Poisson回归时基数是什么意思?
泊松回归中基数是基于某个数字的意思,比如有30个省每年癌症患者人数,但是癌症患者人数是基于某省所有人数时才有对比意义。
2、泊松检验没有输出结果?
SPSSAU中,如果‘发生次数’>100则不输出该项的分析结果。默认情况下泊松分布数据具有发生次数很低但会稳定发生等特点,如果平均的发生次数即lambda值大于20,此时数据不应该是泊检分布数据,而应该考虑其正态性特质。
参考文献:
[1]孙振球.医学统计学.第3版[M].人民卫生出版社,2010.
网友评论