荷兰阿姆斯特丹大学医学院麻醉科Patrick Schober 教授发表了一篇论文 Statistics From A (Agreement) to Z (z Score): A Guide to Interpreting Common Measures of Association, Agreement, Diagnostic Accuracy, Effect Size, Heterogeneity, and Reliability in Medical Research》
相关性Correlation
相关系数测量的是两个变量之间的关联强度。在一般医学研究论文中普遍都会报道相关系数。
Pearson相关系数描述了线性关系的强度,需假设两个变量都是连续变量,且呈近似正态分布。Spearman秩相关系数没有对数据分布做出任何假设,只是要求数据可以以一种有意义的方式进行排序。它描述了单调关系的关联强度,即一个变量的值随着另一个变量的值的增加而不断增加或减少,但不一定以线性方式增加或减少。
相关系数范围一般为-1至+1。正值表示一个变量的值随着另一个变量的值的增加而增加,而负值表示相反的关系。绝对值越来越接近1,表示关系越来越密切。
Pearson相关系数平方(或R2,决定系数)也经常在文献中报道。它的解释为一个变量被另一个变量解释的方差的比例(或百分比)。例如,表1中的Pearson相关系数对应的可解释的方差分别<1%、1%-15%、16%-48%、49%-80%和≥81%,相应的可解释的方差比例为“可忽略”、“较低”、“中等”、“较高”和“非常高”。
Cronbach’α系数
Cronbach’α系数是评价多条目评分量表的可靠性,即内部一致性的指标。评分量表广泛应用于心理学和社会科学,以解决所谓的无法直接测量的潜在结构,如自尊、焦虑、抑郁、躯体化等。
一个最为常见的例子就是李克特式(Likert)评分量表,在该量表中,评估者或受访者对每个问卷测量条目使用“非常同意”、“同意”、“中立”、“不同意”或“非常不同意”等描述词,来对观察结果、看法、态度、认知、表现等进行分类。
在医学研究中,心理测量评分量表应用越来越多,越来越强调不能直接测量的有关患者幸福感方面的问题,包括患者满意度、恢复质量或与健康相关的生活质量等等。
在开发、修订或评估评分量表的研究中,尽管存在一些局限性,但Cronbach’α仍然是最常用的评估内部一致性的指标。Cronbach’α的主要假设是所有的量表条目都是连续的,且呈正态分布,所有的量表条目都具有相同的潜在结构,每个条目对量表总得分的贡献是相等的(称为tau等效)。
当所有量表条目反映相同的结构时,整个量表条目的不同子集应产生一致的结果。
Cronbach’α反映了量表条目之间的相关程度或相互关系,它的值通常在0到1之间,值越接近于1表示内部一致性越强。然而,Cronbach’α值对量表条目的数量较为敏感,条目越多,Cronbach’α值越高,过高的值说明量表条目的冗余度较高。
虽然在文献中对Cronbach’α通俗易懂的解释差异较大,但Cronbach’α≥0.7通常被认为是“可接受的”。值得注意的是,这种情况主要适用于量表用于研究目的的情况(例如,比较两组患者之间的患者满意度)。
当量表用于临床评估时,通常需要更高的值(≥0.9)。因此,当量表用于患者治疗的临床决策时,“可接受”甚至“良好”的可靠性,可能并不够好。
统计指标的界值和解释说明
网友评论