Sas应用之总体概率的参数估计

作者: 乘物以游心 | 来源:发表于2016-07-13 23:51 被阅读281次

Sas应用之总体概率的参数估计
5.1 参数估计的概念及两种估计方法
统计学第四课：参数估计
推断统计-假设检验
假设检验
【数学建模算法】(30)数据的统计描述和分析（下）
Sas应用之宏变量%eval
参数估计与无参估计
机器学习基础之参数估计
小白学统计：如何用易懂的语言解释参数估计和假设检验？

抽样误差：由于生物固有的个体差异的存在，从总体中随机抽取一个样本，所得样本统计量与总体参数往往是不同的，这种差异称为抽样误差。标准误可以用来衡量抽样误差的大小。在本文中主要介绍总体概率的参数估计。如某新药治疗100例脑血管梗塞患者，其中80例有效，标准药物治疗100例，其中83例有效，试估计新药治疗的有效概率，比较两组药物的有效率有无差别？
原理：根据二项分布原理，若随机变量X~B（n, π）,则样本频率p=X/n的总体概率π，标准误为

。在实际工作中，常用p代替π近似计算标准误。
当n足够大，一般是≥50，且np及n(1-p)均大于5时，p的抽样分布近似正态分布，总体概率的π的双侧（1-α）置信区间近似等于（p-Zα/2
Sp
,p+Zα/2
Sp
）,则上述例子中新药的有效概率统计量为0.8，标准误为

为0.04，总体有效率95%的置信区间为（0.8-1.960.04,0.8+1.960.04），最后结果为（0.7216,0.8784），用了加减乘除、power函数等费了九牛二虎之力将总体概率的区间估计给计算出来了。
听一些人讲SPSS没法直接算概率的置信区间，每次都需要手动计算，一组计算还行，但是在实际工作中往往需要计算多组的概率的置信区间，那么sas有没有简便的语句可以实现？
答案：当然是肯定的，程序如下：
/建立上述分析数据集/
data test;
do medi="new","sta";
do results="effective","noeff";
input x@@;
output;
end;
end;
cards;
80 20
83 17
;
run;
/计算p和总体概率置信区间并输出结果到results数据集/
**proc ****freq **data=test;
weight x;
tables results/binomial;
by medi;
output out=results bin;
run;

这里需要解释的是， sas默认计算的概率为结果（results）升序排列第一个结果的概率，在本例中results="effective","noeff";升序排列时，effective在noeff的前面，因此计算的是有效概率，需要计算无效概率，需要调整结果名称如“Y”或”N”，升序排列时，N字母在Y之前，因此计算N的概率。当然数字调整是最简单的，想计算哪种结果的概率，直接定义其结果为1，其他为2。binomial计算样本概率和估计总体概率置信区间。ALPHA=定义α值。结果如下：