Tag SNP
理论上,研究者通过对全部一千万个SNP位点都进行基因分型,也能够寻找到这样的区域。但是,目前用这种方法进行检定的成本是过于昂贵。
通过单体型图计划将鉴定出20~100万个标签SNP位点,从而提供与一千万个SNP位点大致相同的图谱信息。这样将大幅度地减少成本使研究易于进行。
单体型图谱分析内容
大多数染色体区域只有少数几个常见的单体型(每个具有至少5%的频率),它们代表了一个群体中个体与个体之间的大部分多态性。
广义单体型图谱的研究内容
- SNP分型
- 连锁不平衡分析——Haploview
- 重组率和重组热点分析(不适合大群体)——Ldhat,HotspotFisher
- 群体结构分析——structure
- 进化分析——Mega5.05
- GWAS (genome-wide association studies) ——structure,spagedi,TASSEL……
连锁不平衡(Linkage Disequilibrium)
不同座位上某两个等位基因出现在同一条单元型上的频率与预期的随机频率之间存在明显差异的现象,称连锁不平衡 (linkage disequilibrium)。连锁不平衡参数有:
- D’:D 是 LD(连锁不平衡) 的基本单位,度量观察到的单倍型频率与平衡状态下期望频率的偏差。因为 D 的取值强烈地依赖于人为指定的等位基因频率,所以它不利于 LD 程度的比较。标准化的不平衡系数 D’能够避免这种对等位基因频率地依赖。
- :代表两个位点之间的统计相关。当等于 0 时也说明两个位点之间是完全独立的;在连锁不平衡作图中更加有用,因为其具有较强的群体遗传学理论基础和一些统计学上的优势。
LD 的衰减指位点间由连锁不平衡到连锁平衡的演变过程,LD的衰减距离决定关联分析时所需标记密度,也在一定程度上决定关联分析的精度,因为衰减了就意味着位点间趋向自由组合,在这种状态下标记基因型与实际基因型的关联性会大大降低,换句话说,功能多态旁边的位点(标记)如果和他自由组合(连锁平衡),那么标记的不同基因型很难与表型有显著差别。
LD 衰减程度的度量和意义
一般情况下用LD半衰减值来表示LD衰减程度(The LD decay rate was measured as the chromosomal distance at which the average pairwise correlation coefficient (r2) dropped to half its maximum value),如果用D’来做LD衰减,一般用D’值降低到0.5以下对应的距离来表示。
- 不同染色体之间的衰减程度不同,可以判别主要受选择的染色体区域。
-
不同亚种之间的LD衰减情况有明显差异,从而可以判定哪种亚种受到更大的选择压力,区分野生品系和栽培品系。
LD_decay图 X:两两位点之间的距离 Y:某一window区间内R^2平均值
LD Block(单体型块)
当超过两个等位基因位点都是连锁的,我们把这些位点划定在一个小区域内,定义为‘haplotype block’ ;这些block边界便是重组热点区域。 很多物种都已经有了单体型block图谱。 Haplotype blocks 大小从几kb到上百kb不等。
Haplotype blocks 有利于找到稳定遗传的控制目的性状有关的基因。
网友评论