最近一个项目的统计分析中,疗效指标的分析是是使用Wilcoxon rank-sum test(秩和检验),这篇文章梳理一下秩和检验的内容。
SAP中的分析关于此处的具体描述如下,主要通过秩和检验获得一个P值。
For each histomorphometric parameter, descriptive summary statistics will be provided by mean, standard deviation (SD), median, lower and upper quartiles, and minimum and maximum values, along with a nominal p-value to summarize treatment diferences between Treatment R and placebo using the Wilcoxon rank-sum test, without multiplicity adjustment .
对于每个组织形态计量参数,将通过平均值、标准差(SD)、中位数、上四分位数和下四分位数、最小值和最大值提供描述性汇总统计;以及使用Wilcoxon秩和检验获取名义p值,汇总治疗组和对照组之间的治疗差异,检验不进行多重性的调整。
Frank Wilcoxon
Frank Wilcoxon (1892—1965) 是美国的统计学家,一生发表了 70 篇左右论文,其中最大的贡献就是这2个以他名字命名的非参数检验方法:秩和检验和符号秩检验。他在 1945 年发表的论文中将二者分别称为非成对检验(unpaired experiment)和成对检验(paired experiment)。 Wilcoxon秩和检验是通过两个随机样本推断其所代表的两个总体的分布位置是否相同;Wilcoxon符号秩检验是对配对资料的差值进行分析,判断差值对应总体的中位数是否为0。
成对检验,就是我们通常所说的配对检验,是两个相关样本的比较分析。这里的相关如何理解呢?是指起始条件一致的试验对象配成对,分别给予不同的处理。常见的配对方法有以下几种:
干预前后配对,同一个受试者经某个干预进行处理,干预前后的指标值形成配对;
同体异位配对,同一个受试者身体不同部位进行配对,例如,左臂右臂;
同样异测配对,同一个检测样本使用不同的方法进行检测,检测结果形成配对;
条件配对,按照特定条件筛选出来的两个试验对象进行配对。
显然,对于配对试验,各个处理组的人数是相同的。而我这个项目,两处理组人数不同,是非成对试验。
参数检验与非参数检验
秩和检验属于非参数检验,在介绍它之前,先了解下什么是参数检验。参数检验是指,对分布类型已知的总体,运用样本的统计量来估计总体的参数。例如,用样本均值估计总体均值,用样本标准差估计总体标准差。在进行参数检验时,样本需要满足一些前提条件(参数检验所需统计理论的假设条件)。比如,常见的t检验、方差分析要满足,独立、正态、方差齐,这三个条件。但是我们研究中的数据,可能会不符合这些前提条件,这时候使用参数检验的检验功效就比较低。此时,建议使用非参数检验。
而非参数检验是指不考虑数据的分布类型以及具体值,更多地运用数据大小排序的信息,来推测总体位置分布是否相同。此检验不能估计总体的参数,因而称为非参数检验。非参数检验不考虑数据的具体值,会造成数值型数据信息的丢失。所以,在符合参数检验的条件下就使用参数检验。
而我这个项目采用秩和检验,很可能所收集的数据不满足正态性或方差齐性。
假设检验
假设检验是一种统计推断的方法,应用到的具体方法有两个:小概率原理和反证法。
什么是小概率原理呢?先介绍小概率事件,在统计学上,将发生可能性小于0.05的事件,称为小概率事件。小概率原理是指,在一次抽样中,小概率事件不可能发生。
什么是反证法呢?我们先假设一个论题成立,然后根据这个论题进行推理,如果推出矛盾,这时就可以认为之前的假设是不成立的,这就是反证法。
假设检验的核心思想,可以用7个字进行概括:一分为二,灭其一。(参考课程:医学统计学-武松老师)
用一个虚构的例子来说明假设检验的思想。有个警察在追小偷,来到了一个Y字型的路口。警察不知道小偷走向了哪边,小偷的走向有两种可能,这就是一分为二。如果现在有证据将其中一种结果排除掉,那么小偷就在剩下的一种可能里了。
怎么排除呢?先假设小偷跑向了右边,然后我们竟然能够用统计学方法证明——小偷跑向右边的概率是小于0.05的。这意味着什么?意味着小偷跑向右边这个事件是一个小概率事件,而根据小概率原理,在小偷跑一次的过程中,这个小概率事件不会发生。因此我们有理由认为小偷跑向了左边。这就是典型的一分为二,灭其一。我们并不能直接证明小偷跑向了左边,但我们证明小偷没有跑向右边,那么他就跑向了左边。
警察追小偷上面的这个例子的关键是,假设小偷跑向右边时,能够用统计学方法获取到跑向右边的概率。在统计学上,这个假设称为零假设,与零假设相对的是备择假设。
以秩和检验的假设为例,零假设是,两组数据的总体分布位置相同;备择假设是,两组数据的总体分布位置不同。在零假设成立的情况下,我们可以推算出获取当前状态的样本或更极端状态的样本发生的可能性,也就是概率。如果概率小于0.05,那么它就是小概率事件。根据小概率原理,小概率事件在一次抽样中不可能发生,于是我们有理由拒绝零假设。
这就是假设检验的思想了。
感谢阅读!若有疑问,欢迎评论区留言讨论。
网友评论