美文网首页
相关性检验方法

相关性检验方法

作者: BeeBee生信 | 来源:发表于2020-03-08 15:13 被阅读0次

Pearson

假设

  • 所有变量数据正态分布。
  • 变量线性相关。
  • 数据同方差性(homoscedasticity)

PS:检验数据分布方法见《fitdistrplus 检验数据的分布》一文
公式
r_{xy} = \cfrac{n\sum{x_{i}y_{i}} - \sum{x_{i}}\sum{y_{i}}}{\sqrt{n\sum{x_{i}^2} - (\sum{x_{i}})^2}\sqrt{n\sum{y_{i}^2} - (\sum{y_{i}})^2}}

度量效应
effect size 是对实验者效应大小的定量度量。度量效应常用 Cohen's d,用两组的均值差除以标准差。

Cohen's d 公式
d = \cfrac{\bar{x_{1}} - \bar{x_{2}}}{s_{pooled}}
其中
s_{pooled} = \sqrt{\cfrac{(n_{1} - 1)s_{1}^2 + (n_{2} - 1)s_{2}^2}{n_{1} + n_{2} - 2}}

Cohen's d 等级划分

效应大小 d
0.2
0.5
0.8

Cohen 总结了效应大小与相关系数的关系,得到了相关性(Strength of Association)与相关系数的关系。

相关性 |r|
0.1 - 0.3
中等 0.3 - 0.5
0.5 - 1

Kendall rank correlation

Kendall 法是非参数检验,不依赖于数据的分布。跟 Spearman 一样依赖于数据的秩,如果样本数少或者有许多同秩(tied ranks)可以用 kendall 法代替 Spearman。对于 n 个样本,两两组合共有 n(n - 1) / 2 种组合,Kendall rank correlation 公式
\tau = \cfrac{n_{c} - n_{d}}{\frac{1}{2}n(n - 1)}
其中

  • n_{c} - 排序方向一致,即 (x2 - x1) 与 (y2 - y1) 正负号相反。
  • n_{d} - 排序方向不一致,即 (x2 - x1) 与 (y2 - y1) 正负号相反。

Spearman rank correlation

Spearman 也是无参的不对数据分布有要求/假设。但 Spearman 要求数据是有序的,像连续型变量比如金额、温度、高度这些都是有序的可以根据大小去排列;像小学-中学-高中-大学也是有序的;像风-马-牛这就是无序的。另外要求数据是单调(monotonic)关系的。下图解释了什么是单调关系。


单调关系

Spearman 公式
\rho = 1 - \cfrac{6\sum{d_{i}^2}}{n(n^2 - 1)}
其中
d_{i} = rg(x_{i}) - rg(y_{i})
是两变量排序等级的差异。

[参考]
Correlation (Pearson, Kendall, Spearman) - Statistics Solutions
What does effect size tell you? | Simply Psychology
Cohen’s Standards for Small, Medium, and Large Effect Sizes – Introductory Business Statistics
Kendall Rank Correlation Explained. - Towards Data Science

相关文章

  • 相关性计算与检验

    成对数据进行相关性分析可使用可视化方法及相关性检验方法:可视化方法主要通过散点图观察数据的线性关系; 而相关性检验...

  • R语言-相关系数计算(一)

    应用R语言完成相关性检验,相关性矩阵及相关性可视化首先安装相应的R包 相关性分析的方法Pearson correl...

  • 题目41

    41.什么是Bartlett球形检验? 巴特利特球形检验是一种检验各个变量之间相关性程度的检验方法。一般在做因子分...

  • R语言-相关性检验及线性拟合

    相关性检验 相关性检验R=1时为完全正相关。R=-1为完全负相关。R=0为正态分布 斜率与R值无关 相关性检验co...

  • 03-相关性与线性回归

    1 相关性 1.1 散点图评估 1.2 正态分布检验 1.3.1 pearson相关性检验 (正态分布) 1.3....

  • 相关性检验方法

    Pearson 假设 所有变量数据正态分布。 变量线性相关。 数据同方差性(homoscedasticity) P...

  • -0.1- 两个随机变量的相关性、独立性、两个概率分布之间的相似

    [相关性检验参考link][独立性检验参考link][分布的相似性参考link] -1- 两随机变量相关性检验 前...

  • R相关分析(二)

    相关性分析 本节提到的相关性分析和后面会提到的t-test, ANOVA 以及回归分析等被称为参数检验,这些检验在...

  • 简聊卡方统计

    简介卡方检验是一种用途非常广泛的假设检验方法,在统计推断中使用非常多,可以检测多个分类变量之间的相关性是否显著。 ...

  • R可视化——Mantel test分析及可视化

        此前我们已经讲过了如何使用R语言计算两列数据相关性的分析方法,今天,我们来看一种检验两个矩阵相关关系的方法...

网友评论

      本文标题:相关性检验方法

      本文链接:https://www.haomeiwen.com/subject/czwddhtx.html