BSA定义
- BSA:Bulked segregant analysis ,即混池分离分析,选择具有相对性状的亲本构建分离群体,选取表型极端的一定数量个体构建混池,基于两个混池的DNA分子标记差异,实现QTL定位。
- 适用于质量性状和数量性状主效基因的初步定位。
- 单次只能研究1个目标性状
- QTL:quantitative trait locus,基因组上的位点
MutMap
在传统的图位克隆中,我们一般先利用BSA原理进行粗定位,寻找和突变表型连锁的marker,再在附近设计新的marker,利用作图群体进行精细定位,一步步缩小和突变表型连锁的染色体区段,直到鉴定出突变基因。MutMap的原理和图位克隆本质上是一样的,只不过由于高通量测序技术的出现,我们常规使用的marker换成了SNP,把通过PCR和酶切进行多态性鉴定,换成了用重测序的方法直接对SNP的多态性进行分析。
MutMap适合对EMS诱变的隐性突变基因进行分析。通过EMS诱变和自交得到纯合突变体后,将突变体和其亲本回交得到F1,F1自交得到的F2后代会出现表型的分离,得到野生型表型群体和突变表型群体(耐盐表型)。对这两个群体的DNA分别进行等量混合,得到野生型DNA混池和突变体DNA混池。将两个混池分别进行DNA测序,得到野生型和突变型混池测序变异SNP信息;突变为隐性,根据遗传学定律,在F2群体中,与耐盐表型不相关的突变会随机的分布在F2群体个体中,因此,与目标性状不相干的SNP会以:野生型类型:突变体类型=1:1的比例进行分离,而导致突变体表型的SNP,受到了人为选择,在突变体混池中所有的个体都是是纯合的。为了方便分析,作者定义了一个参数SNP-index,突变体类型的SNP所占的比例(也就是上图中右下角图示)。那么在突变位点,SNP-index为1,越往两侧,SNP-index越小,并最终接近于0.5。对SNP-index进行滑窗作图后,就会出现一个峰,该处就是连锁区域。在附近进行候选基因的筛选和排查,可以比较容易找到突变基因。
QTL-seq
QTL全称是Quantitative Trait Loci。顾名思义就是基因组上的一些位点,对一些特定性状具有某种量化的影响。QTL定位的基本原理,就是测定一群个体的某个数量性状(表型),以及它们的基因型,然后寻找基因型和表型的对应关系。QTL定位本质上就是要找基因组上哪些遗传标记跟数量性状的相关性最强。
基于双亲杂交群体2个极端混池的快速基因定位
GradedPool-Seq
性状有较大差异的双亲组配,形成一个较大规模的F2群体(最好数千株),依据F2分离群体的表型分成三组(也可以三组以上),分别为“高值组”,“中值组”,“低值组”,然后进行个体的DNA提取和等量混合,形成三个混池(或者三个以上的混池)。这里面的“高值组”和“低值组”和普通的BSA一样,不同的是增加了一个“中值组”。与性状连锁的SNP在三个混池中会呈现出不同的频率分布,基于Ridit算法的三个混池之间SNP差异显著性比较,获得每个SNP的P值,为了消除背景噪音的影响,通过滑窗法(slide window)处理背景噪音。GradedPool-seq最终实现了水稻400Kb左右的定位分辨率。
QTG-seq
1.群体构建:F1, F2,F2:3家系,BC1F1,BC1F1:2群体;
2.QTL定位:F2群体的遗传图谱QTL定位,F2:3家系验证QTL定位结果;
3.QTL分离:F1和轮回亲本回交后得到BC1F1,利用以上QTL内分子标记筛选目标QTL杂合,其它QTL纯合的BC1F1单株(BC1F1数量要大,保证足够的重组交换事件),然后自交得到BC1F1:2家系;
4.极端表型选择:从BC1F1:2中选2个极端表型组(两极端混池各占群体总量比例20%且总共至少1000个单株);5.极端表型混池:提取DNA并等量混池,形成2个极端池;
6.测序并变异检测:对两个混池测序,与参考基因组比对检测变异;
7.关联分析:结合smoothing LOD(准确关联靶标位点),ED(Hill et al., 2013)与G' value(Magwene et al., 2011)定位目标基因/QTL。
RapMap
根据显性、半显性和超显性三种遗传效应总结出了12种单位点遗传分离模型,并在此基础上提出单位点遗传分离的本质特征是在任意遗传分离群体中目标QTL/基因区段的两种纯合基因型能够与对应表型共分离,即共分离标准(图1c);该“共分离标准”是单位点遗传的充要条件,对遗传学中单位点遗传分离的传统判断标准(如双峰分布、3:1分离比等)起更正和澄清的作用,这一判断标准的更新,大大提高了获取单位点分离群体的效率和可能性。为了最大可能地满足分离群体的共分离标准,从核心种质选取表型差异较小的双亲构建一系列F2梯度群体(F2GP)进行遗传定位的策略(图1a),以期最少化每个遗传群体中控制目标性状的分离位点数量,并克隆不同双亲组合中的主效QTL;不满足共分离标准的群体,可通过自交低、中、高值的F2或F3的若干家系,根据后代分离情况,选取目标区段杂合而背景分离位点纯合的家系来实现单位点分离。F2梯度群体结合单位点遗传的共分离标准,实现了QTL定位、验证及其类近等基因系(NIL-LL)筛选的“三位一体”的基因定位与克隆策略,大大节省了获取单位点遗传定位群体的时间和成本。
图1
BSR
BSR是将BSA与RNA-seq结合起来的分析方法,与重测序BSA不同的是,在分离群体中选择极端性状的个体构建两个池,提取两个池的总RNA,进行转录组测序,根据混池个数和物种的基因组大小确定测序的数据量。基于转录组数据同样开发SNP标记,用经典贝叶斯算法找到与突变基因共分离的SNP位点和区间,最后预测候选基因(Liu et al., 2012)。由于贝叶斯算法需要花费较长时间和较多的计算资源,仍然可以用ED或者SNP-index的算法进行BSR的性状关联。另外,BSR还能反映亲本(混池)的基因表达量信息,可以根据候选区段内相关基因的表达差异筛选候选基因,这个特性使得BSR对抗逆性状(诱导型表型)而言更加适用。BSR分析一般需要参考基因组,所以分析结果会受到参考基因组组装质量的影响,这点同重测序BSA一致。由于基因只占基因组的1-3%,BSR也更适用于基因组较大的物种,比如麦类物种。
BSR存在的问题:
基因不均衡表达,低丰度基因无法准确进行变异检测
存在时空特异性,并不是所有基因都表达
等位基因特异性表达,同源染色体上两个等位基因的表达水平显著差异
RNA编辑,转录后的RNA发生碱基的加入、丢失或转换等现象导致RNA与DNA水平不一致
MMAPPR
利用斑马鱼构建的F1代分离群体,构建表型的极端混池,基于转录组数据检测SNP,利用欧氏距离法(ED)计算混池之间SNP的距离差异。ED算法,是利用测序数据寻找混池间存在显著差异标记,并以此评估与性状关联区域的方法。理论上,BSA项目构建的两个混池间除了目标性状相关位点存在差异,其他位点均趋向于一致,因此非目标位点的ED值应趋向于0。ED值越大表明该标记在两混池间的差异越大。
网友评论