相关性检验方法

作者: BeeBee生信 | 来源:发表于2020-03-08 15:13 被阅读0次

相关性计算与检验
R语言-相关系数计算(一)
题目41
R语言-相关性检验及线性拟合
03-相关性与线性回归
相关性检验方法
-0.1- 两个随机变量的相关性、独立性、两个概率分布之间的相似
R相关分析（二）
简聊卡方统计
R可视化——Mantel test分析及可视化

Pearson

假设

所有变量数据正态分布。
变量线性相关。
数据同方差性(homoscedasticity)

PS:检验数据分布方法见《fitdistrplus 检验数据的分布》一文
公式
$r_{xy} = \cfrac{n\sum{x_{i}y_{i}} - \sum{x_{i}}\sum{y_{i}}}{\sqrt{n\sum{x_{i}^2} - (\sum{x_{i}})^2}\sqrt{n\sum{y_{i}^2} - (\sum{y_{i}})^2}}$

度量效应
effect size 是对实验者效应大小的定量度量。度量效应常用 Cohen's d，用两组的均值差除以标准差。

Cohen's d 公式
$d = \cfrac{\bar{x_{1}} - \bar{x_{2}}}{s_{pooled}}$
其中
$s_{pooled} = \sqrt{\cfrac{(n_{1} - 1)s_{1}^2 + (n_{2} - 1)s_{2}^2}{n_{1} + n_{2} - 2}}$

Cohen's d 等级划分

效应大小	d
小	0.2
中	0.5
大	0.8

Cohen 总结了效应大小与相关系数的关系，得到了相关性(Strength of Association)与相关系数的关系。

相关性	\|r\|
弱	0.1 - 0.3
中等	0.3 - 0.5
强	0.5 - 1

Kendall rank correlation

Kendall 法是非参数检验，不依赖于数据的分布。跟 Spearman 一样依赖于数据的秩，如果样本数少或者有许多同秩(tied ranks)可以用 kendall 法代替 Spearman。对于 n 个样本，两两组合共有 n(n - 1) / 2 种组合，Kendall rank correlation 公式
$\tau = \cfrac{n_{c} - n_{d}}{\frac{1}{2}n(n - 1)}$
其中