Meta分析是一种用于整合针对某一共同科学问题的若干实证研究的统计方法,可弥补传统文献综述方法的缺点。在meta分析中,不同的实证研究会分别报告一些汇总统计量。对于连续性随机变量,最典型的汇总统计量是样本均值和样本标准差。由于某些原因,有些研究报告了中位数,第一、第三四分位数和(或)最大值、最小值。这样导致不同的实证研究所提供的汇总统计量不一致,使得无法进行有效的meta分析。最简单的方法是只保留报告样本均值和样本标准差的研究。但这样显然丢失了很多有用的信息。如果保留那些报告了中位数、极值或四分位数的研究,那么一个重要的科学问题是:如何将中位数、极值或四分位数转换为均值和标准差呢?
首先给出以下记号:a=最小值,q1 =第一四分位数,m=中位数,q3=第三四分位数,b=最大值。在研究报告中,以上综合统计量不一定会全部提供。根据实际情况,我们考虑以下两种最常见情况:
image对于标准差,在S1情况下,Hozo et al. (2005)根据样本量的大小构造了分段函数形式的估计量。Wan et al. (2014)指出,分段函数形式的估计量使得在分段点处非常地不准确,而且样本量这一关键信息并没有得到充分的利用。在正态性假定下,Wan et al. (2014)提出了如下形式非常简洁的估计量:
image.pngWan et al. (2014)和Luo et al. (2018)所提样本标准差和样本均值的估计量,不仅效果良好而且形式简洁,自提出后受到了众多学者的关注和使用。Wan et al. (2014)已被引用1100多次,而Luo et al. (2018)也已被引用150多次,在医学领域产生了较大的影响。
近期,McGrath et al. (2020)注意到如下事实。Wan et al. (2014)和Luo et al. (2018)所提估计量建立在正态性假定下,而在一个研究中,如果只报告了中位数,四分位数或者极值,则表明该研究中的数据很可能不是对称的。这样,直接使用Wan et al. (2014)和Luo et al. (2018)所提估计量可能存在一定误差。对此McGrath et al. (2020)提出了基于Box-Cox变换的方法。即先进行Box-Cox变换,而后对变换后的研究采用Wan et al. (2014)和Luo et al. (2018)所提估计量。具体参见McGrath et al. (2020)。
香港浸会大学数学系的童铁军教授已将他们所提的方法编成了在线计算器,见如下链接,欢迎使用!http://www.math.hkbu.edu.hk/~tongt/papers/median2mean.html
网友评论