美文网首页
Sas应用之总体概率的参数估计

Sas应用之总体概率的参数估计

作者: 乘物以游心 | 来源:发表于2016-07-13 23:51 被阅读281次

    抽样误差:由于生物固有的个体差异的存在,从总体中随机抽取一个样本,所得样本统计量与总体参数往往是不同的,这种差异称为抽样误差。标准误可以用来衡量抽样误差的大小。在本文中主要介绍总体概率的参数估计。如某新药治疗100例脑血管梗塞患者,其中80例有效,标准药物治疗100例,其中83例有效,试估计新药治疗的有效概率,比较两组药物的有效率有无差别?
    原理:根据二项分布原理,若随机变量X~B(n, π),则样本频率p=X/n的总体概率π,标准误为

    。 在实际工作中,常用p代替π近似计算标准误。
    当n足够大,一般是≥50,且np及n(1-p)均大于5时,p的抽样分布近似正态分布,总体概率的π的双侧(1-α)置信区间近似等于(p-Zα/2
    Sp
    ,p+Zα/2
    Sp
    ),则上述例子中新药的有效概率统计量为0.8,标准误为 为0.04,总体有效率95%的置信区间为(0.8-1.960.04,0.8+1.960.04),最后结果为(0.7216,0.8784),用了加减乘除、power函数等费了九牛二虎之力将总体概率的区间估计给计算出来了。
    听一些人讲SPSS没法直接算概率的置信区间,每次都需要手动计算,一组计算还行,但是在实际工作中往往需要计算多组的概率的置信区间,那么sas有没有简便的语句可以实现?
    答案:当然是肯定的,程序如下:
    /建立上述分析数据集/
    data test;
    do medi="new","sta";
    do results="effective","noeff";
    input x@@;
    output;
    end;
    end;
    cards;
    80 20
    83 17
    ;
    run;
    /计算p和总体概率置信区间并输出结果到results数据集/
    **proc ****freq **data=test;
    weight x;
    tables results/binomial;
    by medi;
    output out=results bin;
    run;

    这里需要解释的是, sas默认计算的概率为结果(results)升序排列第一个结果的概率,在本例中results="effective","noeff";升序排列时,effective在noeff的前面,因此计算的是有效概率,需要计算无效概率,需要调整结果名称如“Y”或”N”,升序排列时,N字母在Y之前,因此计算N的概率。当然数字调整是最简单的,想计算哪种结果的概率,直接定义其结果为1,其他为2。binomial计算样本概率和估计总体概率置信区间。ALPHA=定义α值。结果如下:


    作者:任丽
    编辑:乘物以游心
    发布范围:微信、简书、CSDN、天善智能
    微信号: sas应用分析
    原文链接:https://mp.weixin.qq.com/s?__biz=MzIyNTE2MzM3MA==&mid=2650116643&idx=1&sn=e13426d7dff548f22a8bf03c27cc4d94&scene=0#rd

    相关文章

      网友评论

          本文标题:Sas应用之总体概率的参数估计

          本文链接:https://www.haomeiwen.com/subject/dprejttx.html