GWAS理论 1-1 全基因组关联分析基本概念和材料选择

GWAS理论 1-1 全基因组关联分析基本概念和材料选择

作者: 奔跑的Forrest | 来源:发表于2020-03-28 14:05 被阅读0次

先把GWAS系列课程看一遍，后面再把不懂的东西再补充上来

一、概念和理论基础

全基因组关联分析定义

是对多个个体在全基因组范围的遗传变异（标记）多态性进行检测，获得基因型，进而将基因型与可观测的性状，即表型，进行群体水平的统计学分析，根据统计量或显著性 P 值筛选出最有可能影响该性状的遗传变异（标记），挖掘与性状变异相关的基因。

质量性状与数量性状

质量性状指相对性状的变异呈不连续性，呈现质的中断性变化的性状。由1对或少数几对主基因控制。如鸡羽的芦花斑纹和非芦花斑纹、角的有无、毛色、血型等都属于质量性状。

数量性状指相对性状的变异呈连续性，个体之间的差异不明显，很难明确分组。受微效多基因控制，控制数量性状的基因称为数量性状位点(quantitative trait loci, QTLs).在QTLs中, 基因的效应也有大有小。其中, 效应较大的称为主效QTL, 效应较小的称为微效QTL(或微效多基因)。动植物的许多重要经济性状都是数量性状，如作物的产量、成熟期，奶牛的泌乳量，棉花的纤维长度、细度等等。

但是，生物的许多性状并不是绝对的质量性状或数量性状, 多数表型介于两者之间，同时受到主基因和数量性状位点(QTLs)的控制。水稻包穗性状就是受到主基因和数量性状位点的共同控制。

分为两类：

全基因组水平的关联分析
已知候选基因的关联分析（用的是候选基因的标记和背景基因的标记）

主要步骤就三步：

标记开发
表型考察
统计分析

关联分析与连锁分析

连锁分析与关联分析的区别

关联分析和连锁分析

关联分析是以连锁不平衡(linkage disequilibrium, LD)为基础的。连锁不平衡是不同基因座位上等位基因的非随机组合。

图示

1、连锁采用家系样本；关联采用散发样本
2、连锁应用LINKAGE核心IBD算法做计算；关联用卡方检验计算2组，找到相关行
3、连锁一般找到的是某个区域；关联找到的是某个点
4、连锁结果相对准确，假阳性小，但精细定位很困难，主要原因是家系问题。关联相对粗糙，假阳性很高，但可以直接定到基因位点
这里还有一个对于在人类疾病中的相关解释（https://huans.github.io/2017/12/18/QTL/）

连锁不平衡

LD :

当位于某一座位的特定等位基因与另一座位的某一等位基因同时出现的概率大于群体中因随机分布的两个等位基因同时出现的概率时，就称这两个座位处于连锁不平衡状态（linkage disequilibrium）

LD 衰减距离相关解释（https://www.jianshu.com/p/a36bd4145ef7）

单体型块图（LD bolck）(https://www.omicshare.com/forum/thread-1201-1-1.html)

r^2 和 D'

LD 衰减分析

衰减图

LD block

LDheatmap 是一个 R 包，挺好用

LD 与 GWAS

二、材料的选择

材料选择

样本量

群体类型

种质资源材料

人工群体

F2群体

人工群体优缺点

动物关联分析材料

相关文章

网友评论

群体遗传学

本文标题：GWAS理论 1-1 全基因组关联分析基本概念和材料选择

本文链接：https://www.haomeiwen.com/subject/ajlluhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

群体遗传学

热点阅读

群体遗传学

关于我们|服务条款|联系我们|GWAS理论 1-1 全基因组关联分析基本概念和材料选择|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！