美文网首页
如何正确选择统计方法(to be continued)

如何正确选择统计方法(to be continued)

作者: oncology咕噜 | 来源:发表于2020-04-26 23:06 被阅读0次

    资料类型设计方案实验分组检验条件

    单变量资料差异比较的分析方法小结

    11种形式的列联表

    双变量(多变量)资料的关联性分析方法小结

    二、计量资料分析常见的统计问题

    2.1 忽视t检验的前提条件

    文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表5。原文作者用t检验分析此资料。请问:这样做正确吗?

    辨析:

    1.对表5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用t检验进行分析。

    正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行t检验,否则,采用非参数检验。

    2.给出确切的统计量和P值。

    2.2 误用成组设计资料的t检验分析配对设计资料

    辩析:1.考虑到对数据进行变换是正确的。但是如果采用成组t检验,还需要两总体方差齐性。 但本研究是配对设计,如果采用成组t检验,会降低检验效率。应该采用配对t检验进行分析。注意配对t检验的条件:要对每对数据的差值(d)进行正态性检验。如果不满足,改用Wilcoxon符号秩检验。2.应给出确切的统计量和P值。

    2.3 忽视方差分析的前提条件

    文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。

    问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。

    实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。

    请问:采用方差分析正确吗?

    辨析:此实验分3组,应为单因素三水平设计定量资料,应首先进行“独立性”、“正态性”和“方差齐性”检验,如果满足方差分析的3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果P<0.05,则进行多组均数间的多重比较。

    给出确切的统计量和P值。

    2.4 误用t检验分析等级资料

    文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验

    表4 两组临床主要症状和结肠镜肠粘膜病变评分

    ※:与对照组(G2)比较,P>0.05,组间差异无统计学意义;△:与治疗前比较,P<0.05,组内差异有统计学意义;▲:与对照组(G2)比较,P<0.05,组间差异有统计学意义。

    辨析:

    对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。

    分析“总评分”时,应对数据进行正态性和方差齐性检验后,决定选用t检验或秩和检验。

    与对照组(G2)比较,P>0.05,组间差异无统计学意义,不必在备注中表示。

    应写出确切的统计量和P值

    2.5 误用t检验处理重复测量的两因素试验设计

    文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成

    统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。

    辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。

    在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。

    文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T淋巴细胞亚群的影响。

    设计:作者选取60例恶性肿瘤患者,随机分成2组。试验组在伽玛刀放射治疗的同时给予复方苦参注射液20ml加入生理盐水500ml,静脉滴注,1次/d,10d为1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7。

    请问:统计分析方法选用t检验正确吗?

    辨析:

    1.统计分析错误

          本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。

    正确的做法:应将表7的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。

    2.6 误用配对设计资料的t检验处理单因素k(k>3)水平设计的资料

    原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,40只大鼠被随机分成4组,对照组:按10ml/kg鼠重灌服生理盐水,莪术组:按10ml/kg鼠重分别灌服25% 、50% 、100%莪术水煎液分成3组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的t检验进行统计处理,资料见表4。

    表 莪术水煎剂对大鼠子宫肌电活动的影响(均数±标准差)

    辨析:

    没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。

    本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设计或配对设计的t检验。

    措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用Dunnett t检验或LSD检验。

    如果在专业上有必要对3项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行处理。

    三、计数资料分析方法的常见问题

    3.1 计算相对数时分母太小

    文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4。请问:在表达资料方面有何不妥之处?

    辨析:

    计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。

    在表4中,各组样本例数都小于20,样本例数偏小,不宜计算率,直接给出例数就可以。

    3.2 误用χ2 检验分析结果变量为有序变量的资料

    某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经R×C表χ2检验,χ2=53.33 ,P <0.01 ,认为两组疗效之间的差异有统计学意义。

    辨析:

    本资料属于单项有序的R×C表,临床疗效有等级之分,对于等级资料可采用Ridit分析或秩和检验。而不应用R×C的χ2检验,R×C表χ2 检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,χ2值仍为53.33,不会有改变。

    3.3 误用χ2检验回答相关性问题

    表 不同年龄冠状动脉粥样硬化程度的分布

    上述资料用χ2检验得:χ2 =163.01,P<0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。

    问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?

    辨析1:

    本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个目的,因此,就对应着3套不同的统计分析方法。

    分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。

    分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。

    分析两者间是否存在线性变化趋势则应用线性趋势检验。

    作者欲考察“两个有序变量之间是否呈相关关系”,而χ2检验结果是P<0.05,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。

    事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的χ2检验的统计量数值是不会变化的,说明χ2检验用于处理有序变量形成的二维列联表资料是不合适的。

    辨析2:

    欲考察“两个有序变量之间是否呈相关关系”,应选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。

    本例采用Spearman秩相关分析,得:rs=0.53215,P<0.0001。

    结论为:表中两个有序变量之间呈正相关关系,即随着年龄的增加冠状动脉硬化等级也逐渐增大,两者之间的相关关系具有统计学意义。

    3.4 多值有序变量的高维列联表资料

    3.5 不满足连续性χ2检验条件时未做校正

    3.6 十一种形式的列联表

    3.7 误用χ2检验取代Fisher精确检验

    3.8 对R×C表直接分割进行两两比较

    四、统计分析方法表述问题

    (1)在统计学方法中注明“采用SPSS软件进行统计学处理”。此表述正确吗?

    辨析:

          从该表述中只能得知原作者采用了什么统计分析软件处理数据,没有交代清楚软件的版本和序列号;更未体现出文中资料所对应的实验设计类型和所采用的具体统计分析方法。

    (2)在统计学方法中注明“计量资料采用方差分析”。请问:此表述正确吗?

    辨析:

    从该表述中只能得知作者处理定量资料用了方差分析,至于这些统计分析方法的选用是否正确,则不得而知。

    通常情况下,比较各平均值之间的差别是否具有统计学意义,可能会用到的t检验有3种,方差分析有10种之多,他们之间的本质区别体现在定量资料所对应的“实验设计类型”上。

    在表述统计学方法时,应将所用方法写完整,即在统计分析方法前冠以实验设计名称,如配对设计定量资料的t检验、成组(或单因素两水平)设计定量资料的t检验或两因素析因设计定量资料的方差分析。

    (3)定性资料一律采用χ2检验,对吗?

    辨析:

          事实上,定性资料通常可以编制成11种形式的列联表。在进行统计分析时,应针对不同形式的列联表、统计分析目的和资料实际具备的前提条件,选用相应的统计分析方法,不可随意盲目选用,更不应将χ2检验视为处理定性资料的万能工具。

    (4)许多论文中,当统计数据经假设检验后,P值仅仅列出P >0.05或P<0.05 、P<0.01便称结果无显著差异,或结果非常显著。

    假设检验结果正确的表达方法是:

          应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,及其可信区间、检验统计量,如χ2、t、u、F 值等)、P值;然后根据P值大小作出统计学推断,并作出相应的医学专业结论。

    举例:

    SPSS实现多组率的两两比较

    pearson卡方

    SPSS对原始数据是频数表的,需进行加权处理(让软件横着看数据)后卡方检验。

    条件:(1)pearson卡方要求总例数大于40;(2)0 个单元格 (0.0%) 的期望计数小于 5。最小期望计数为 15.25。

    资料收集整理来自百度文库

    相关文章

      网友评论

          本文标题:如何正确选择统计方法(to be continued)

          本文链接:https://www.haomeiwen.com/subject/skwjwhtx.html