美文网首页
卡方检验关联性

卡方检验关联性

作者: 吴十三和小可爱的札记 | 来源:发表于2021-05-15 11:06 被阅读0次

简介

关联分析就是统计分析每个变异与目标性状之间的关联性大小,选出最相关的遗传变异进行验证,并根据验证结果最终确认其与目标性状之间的相关性。一般来说,最直接的方法就是直接用卡方检验检测对照和实验组的SNP allele。


Lecture 12 - Deep Learning in Life Science (Spring 2021)

R语言实现

卡方检验(Chi-Squared Test或 χ2 test) 是一种非参数检验,用于推断总体分布与期望分布是否有显著差异,或比较两个或两个以上样本及两个分类变量之间是否相关,其根本思想是统计样本的实际观测值与理论推断值之间的偏离程度。

卡方分布本身是连续分布,而实际应用中我们接触的大多是非连续的整型的频数,此时任何一个栏位的期望次数小于5,均会使“近似于卡方分配”的假设不可信,导致统计值会系统性地偏高。

在R语言中,我们一般依照以下规则:

  1. 所有栏位的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验。
  2. 如果有栏位的理论数T<5但T≥1并且n≥40,用连续性校正的卡方进行检验。
  3. 如果有理论数T<1或n<40,则用Fisher’s检验。
  4. 用Fisher's exact test 替代2 x 2 列联表的卡方独立性检验。
  5. 用Binomial test 替代2 x 1 列联表的卡方拟合优度检验。

在这里是推断两个分类变量是否相关(independence):
H0:两个变量之间相互独立,观测值中差异是随机产生的(p越小,越有理由拒绝H0)

table_snp <- matrix(c(22, 68, 976, 932), 
                    nrow = 2, 
                    ncol = 2)
chisq.test(table_snp)

# X-squared = 23.467, df = 1, p-value = 1.271e-06

解释: X-squared 值与图中相近,但是p值有很大差异,通过调取期望值可以发现两边的期望值是不同的,可能由此导致X-squared 值有微弱差异。

chisq.test(table_snp)$expected

由于这是一个2 x 2 列联表的卡方检验,我们可以看到Fisher's exact test的结果与图中是相似的。

fisher.test(table_snp)
# p-value = 7.199e-07

Reference

Chi-squared_test
Disease Circuitry Dissection GWAS - Lecture 12 - Deep Learning in Life Science (Spring 2021)
Fisher's exact test

相关文章

  • 机器学习之sklearn.feature_selection c

    统计里面的卡方检验 卡方检验主要是用来进行 分类变量(离散变量)的关联性、相关性分析,其根本思想就是在于比较理论频...

  • 待转载的好文章

    1、卡方检验:两个离散变量的关联性分析 - TzeSing的文章 - 知乎https://zhuanlan.zhi...

  • 卡方检验

    ①四格表卡方检验 ②配对卡方检验 ③RxC卡方检验

  • 卡方检验关联性

    简介 关联分析就是统计分析每个变异与目标性状之间的关联性大小,选出最相关的遗传变异进行验证,并根据验证结果最终确认...

  • 干货!一文汇总卡方检验分析步骤

    一、类型 SPSSAU中卡方检验包括卡方检验、卡方拟合优度、配对卡方、分层卡方。 对于上述四种卡方检验区别如下: ...

  • R实战|卡方检验及其可视化

    R实战|卡方检验及其可视化 卡方检验 卡方检验是一种以χ 2 分布为基础的用途广泛的假设检验方法。是一种非参数检验...

  • 白话“卡方检验”

    白话“卡方检验” 什么是“卡方检验”? 卡方检验是假设检验的一种,用于分析两个类别变量的相关关系,是一种非参数假设...

  • 医学临床试验文献统计方法解读(卡方检验)

    四、卡方检验 (一)文献中应用 文献中如此描述卡方检验的应用:”卡方检验用来比较试验组和控制组在被试分布、移植物分...

  • 卡方检验

    今天我们公司的一个做数据的女孩子问我卡方检验问题,女孩子的问题不管怎么样都要回答的,也帮他解决了,虽然这是一个简单...

  • 卡方检验

    卡方检验是非参数检验方法中的一种,其基本功能是通过样本的频数分布来推断总体是否服从某种理论分布或者某种假设分布。通...

网友评论

      本文标题:卡方检验关联性

      本文链接:https://www.haomeiwen.com/subject/mgehjltx.html