抽样误差:由于生物固有的个体差异的存在,从总体中随机抽取一个样本,所得样本统计量与总体参数往往是不同的,这种差异称为抽样误差。标准误可以用来衡量抽样误差的大小。在本文中主要介绍总体概率的参数估计。如某新药治疗100例脑血管梗塞患者,其中80例有效,标准药物治疗100例,其中83例有效,试估计新药治疗的有效概率,比较两组药物的有效率有无差别?
原理:根据二项分布原理,若随机变量X~B(n, π),则样本频率p=X/n的总体概率π,标准误为
当n足够大,一般是≥50,且np及n(1-p)均大于5时,p的抽样分布近似正态分布,总体概率的π的双侧(1-α)置信区间近似等于(p-Zα/2
Sp
,p+Zα/2
Sp
),则上述例子中新药的有效概率统计量为0.8,标准误为 为0.04,总体有效率95%的置信区间为(0.8-1.960.04,0.8+1.960.04),最后结果为(0.7216,0.8784),用了加减乘除、power函数等费了九牛二虎之力将总体概率的区间估计给计算出来了。
听一些人讲SPSS没法直接算概率的置信区间,每次都需要手动计算,一组计算还行,但是在实际工作中往往需要计算多组的概率的置信区间,那么sas有没有简便的语句可以实现?
答案:当然是肯定的,程序如下:
/建立上述分析数据集/
data test;
do medi="new","sta";
do results="effective","noeff";
input x@@;
output;
end;
end;
cards;
80 20
83 17
;
run;
/计算p和总体概率置信区间并输出结果到results数据集/
**proc ****freq **data=test;
weight x;
tables results/binomial;
by medi;
output out=results bin;
run;
这里需要解释的是, sas默认计算的概率为结果(results)升序排列第一个结果的概率,在本例中results="effective","noeff";升序排列时,effective在noeff的前面,因此计算的是有效概率,需要计算无效概率,需要调整结果名称如“Y”或”N”,升序排列时,N字母在Y之前,因此计算N的概率。当然数字调整是最简单的,想计算哪种结果的概率,直接定义其结果为1,其他为2。binomial计算样本概率和估计总体概率置信区间。ALPHA=定义α值。结果如下:
作者:任丽
编辑:乘物以游心
发布范围:微信、简书、CSDN、天善智能
微信号: sas应用分析
原文链接:https://mp.weixin.qq.com/s?__biz=MzIyNTE2MzM3MA==&mid=2650116643&idx=1&sn=e13426d7dff548f22a8bf03c27cc4d94&scene=0#rd
网友评论