原创不易,只为交流和传播知识。
对侵权行为保留起诉权!
转载请注明。
为什么对HomozygosityMapper感兴趣
- 可用于寻找常隐性疾病致病基因所在的纯合区域
- 适用于consanguineous families(近亲结婚,在土耳其、芬兰、意大利等国家尤其常见)的隐性性状研究
- 网页可在5分钟内完成一个包括6例病患个体(5万基因型/例)的项目
- 类型在一百万阵列上的项目,数据上传和分析时间在半小时左右
如果你觉得可以想出好的idea,那么加入阅读party🎉吧~
文献解读: HomozygosityMapper-an interactive approach to homozygosity mapping
为什么需要HomozygosityMapper
'In most studies, applications for multipoint linkage analysis are applied to determine the genomic region linked to disease. Unfortunately, these are neither suited for very large families nor for the inclusion of tens of thousands of SNPs. Even if less than 10 000 markers are employed, such an analysis may easily last hours if not days.' - From HomozygosityMapper-an interactive approach to homozygosity mapping
Note: linkage同样不适用于小家系(没有power,如linkage不适用多发性硬化症研究,因其家系极小,通常家族聚集的家系跨三代的情况极其罕见);这里不适用于非常大的家系的原因没有提及。
阅读之前需要学习的背景知识
- consanguineous family
临床医学中,近亲结婚被定义为两个second cousins或更近的亲缘关系的人的结合,近亲繁殖系数(inbreeding coefficient, F)大于等于0.0156,F代表近亲的后代预计会从双亲遗传到相同基因拷贝的基因座比例。这包括被称为first cousins, first cousins once removed and second cousins。血缘关系越近,F越大 (Fig 1.)。
Fig 1. Consanguineous Families- Genetic linkage
两个基因在同一条染色体上相互靠近,且趋向于一同遗传给后代,则这两个基因相互遗传学link。
示例 (Fig 2.):
R/r基因和B/b基因分别控制表达花的颜色和大小;
显性/隐性对应表现为红色/白色,和大花/小花。
Fig 2. An example孟德尔研究中,test cross是对RB基因的杂合个体和AB基因的隐性纯合个体的杂交。
这里我们以RrBb(大红花)x rrbb(小白花)杂交为例,它们会产生两种parental offsping: RrBb, rrbb,其表型和亲本中的一方一致;另外会产生两种recombinant offspring: Rrbb, rrBb,这里子代的表型和亲本中的任意一方都不一致。通过test cross计算parental和recombinant offspring的相对比例,分为RB基因位于不同染色体和RB基因位于相同染色体两种情况进行讨论。
1. 假设RB基因位于独立的两条染色体时 (not link),理论(预计,expected)上的子代表型比例分布
减数分裂过程中,染色体随机assort,形成四种配子RB, Rb, rB和rb的概率均等为25%(因为染色体assort的事件是独立事件,所以形成四种可能的配子的概率均分),配子融合形成parental offspring (RrBb, rrbb)的概率分别为25%;形成recombinant offspring (rrBb, Rrbb)的概率分别为25%。
2. 假设RB基因在同一条染色体上link,理论上的子代表型比例分布
减数分裂的染色体复制过程中,显性基因在同一条染色体上配对存在,隐性基因在另一条染色体上配对存在,这种基因位置的安排称为'sis' / 'coupling' arrangement。由于RB基因同处于一条染色体,通常产生的配子为RB或rb,概率各为50%。但有时在减数分裂过程中可能发生crossing over (recombination,即染色体重组),对应孟德尔遗传学三大定律的连锁交换定律(law of linkage and crossing-over),基本内容:生殖细胞形成过程中,位于同一染色体上的基因是连锁在一起作为一个单位进行传递,称为连锁律。生殖细胞形成时,一对同源染色体上的不同对等位基因之间可发生交换,称为交换律。
简言之,同源染色体间的连锁基因的交换,发生的概率低,产生重组后代。
因此,相对于#1,#2也可能产生recombin配子Rb, rB,但发生概率低,所以 parental offspring (RrBb, rrbb)% > recombinant offspring (rrBb, Rrbb)%。具体recombinant offspring%和染色体重组事件的发生有关,后者发生的概率决定前者的概率是否更高;而染色体重组发生的概率取决于两个连锁基因间的距离,距离越近,越不容易发生染色体重组 (Fig 3.)。
Fig 3. Crossing-over3. 结果解释
3.1 parental offspring: 50%, recombinant offspring: 50% → 说明RB基因位于不同染色体,子代四种表型的比例均分为25%;
3.2 recombinant offspring: parental offspring >> 50%, recombinant offspring << 50% → 说明RB基因位于同一条染色体,且连锁
4. 计算RB基因的重组率
假设上述RB基因控制果蝇的眼睛颜色和翅膀大小,经过繁育产生2000只果蝇后代,其中有110只rrBb和90只Rrbb (recombinant offspring),那么recombinant% = (110 + 90) / 2000 x 100% = 10%,则R(r)B(b)基因的重组率为10%。
5. 使用基因重组率计算recombination units (map units)
1 map unit = 1% recombination
所以这里R(r)B(b)基因的距离为10 map units,或10 recombinant units,又称为10个cM (centimorgan, i.e. map unit)。
- Gene mapping
绘制基因位置,以及染色体上基因间的距离,图中基因间的距离称为map units,或recombination units。
根据上述的RB基因果蝇繁殖实例可以计算出二者的遗传学距离为10cM,即100个个体有10个源自染色体重组形成的个体,recombinant offspring (Fig 4.)。
下方附gene mapping的例子图,图片来源:Source here。
Fig 4. Gene MappingHomozygosity:纯合性(AA, aa);Heterozygosity:杂合性(Aa)
Autozygosity: 由于近亲结婚获得的和亲本一样的alleles或DNA片段拷贝。
Autozygosity mapping: 使用近亲家系寻找常染色体隐性的疾病致病基因的有力工具,下图显示后代个体间共有的来自亲本的Autozygosity区域,致病基因大概率位于这部分区域 (Fig 5, 6.)。
Fig 5. Autozygosity Fig 6. Autozygosity
- Normal workflow for analyzing homozygosity
(i). 结合microsatellites,或SNPs进行genome-wide linkage分析。特别由于SNP markers的低信息性,通常能够推论出的有关减数分裂的信息有限,因此通常使用multipoint linkage分析软件,如GENEHUNTER, Allegro, SIMWLAK2或Merlin在隐性疾病模型下进行分析;
(ii). 手动或使用软件制备haplotype;
(iii). 手动检查单倍型并搜索子代中病患个体间共有的纯合区域(如果来自祖先的基因型可用),以及子代中健康成员的不纯合区域。
工具简介
Homozygosity mapping,目的在于autozygosity mapping,基于网络的纯合子mapping,使用近亲家系寻找常染色体隐性疾病的纯合区域(致病基因),优势在于不需要健康成员而只需病患成员的DNA。数据库中存储有marker数据,用户上传自己的SNP基因型文件即可。
操作步骤:(以人为例)
1. Upload genotypes
主界面键入项目名称,"chip"选项选择手头的数据类型,官方有sample,我这里选择测试vcf文件
2. Analyze your genotypes
依次键入project, analysis name, cases, controls; allele frequencies选项在这里不用管(因为提交的是vcf文件),如果提交的是SNP chip的文件,则选择'from controls' (Fig 7.)。
Fig 7. Upload interface3. Genome-wide homozygosity
结果会以条形图方式展示基因组范围的纯合性评分,横坐标分布了22条常染色体,纵坐标对应纯合性评估分值。纯合性评分超过最大分值的80%区域会以红色标红竖条显示 (Fig 8.)。条形图下方列有所有纯合性评分超过最大值的80%的区域。列表中的broad部分是采用来了相对松的标准,'use this when you expect some genetic heterogeneity';narrow采用相对严格的标准,'use this when all patients are in the same family' (Fig 9.)。
Fig 8. 超过80%的显著区域被红色标明显示 Fig 9. 基因组范围条形图下方的表格有意思的区域的许多连续marker都有较高的纯合性评分,在条形图中表现为许多彼此仅靠的红色柱形条,若这些marker彼此十分靠近,整体看上去是一条厚的红柱 (Fig 10.)。
Fig 10. 整体表现为一条厚的红柱列表下方:
- 'GeneDistiller'会显示所有长纯合区域的候选基因 (可以自定义区域显示的SNPs数);
- 还可以生成文件通过Alohomora执行潜在疾病区域的精细定位;
- 对深度测序所需的富集,HomozygosityMapper可以产生*.bed文件,其中包含所有区域或完整基因/仅包含其中的外显子。
4. Chromosomal homozygosity
单击染色体区域或条形图下方表格中的第一个'genotypes',之后点击'Click here for the genotypes table'可查看具体区域下,样本在某一位置的基因型 (Fig 11.)。通过家系内部的健康成员基因型可以对识别到的区域进行过滤,即利用健康成员的基因型排除某区域和疾病致病的相关性。
Fig 11. Genotype details5. Genotypes view
在此视图,每列对应每个样本相应的SNP,病患个体显示在顶部,健康个体显示在底部,它们之间有一个小空间隔开。基因型显示为颜色编码框,灰色框表示未知基因型,蓝色表示杂合型,红色表示纯合区域,纯合块越长,红色程度越深。minor allele的基因型有黑色对角线。两个可能的不同纯合基因型由较不丰富的基因型小竖线表示,这种情况在数据来自于不同家系,但是对同一疾病基因座的不同疾病haplotypes进行分析时会发生 (Fig 12.)。
Fig 12. Genotypes view6. 创建个人账户
如果想隐藏project并在稿件接受时公开,可创建个人账户,在主界面点击'create a profile'。
工具准确性验证
Familial thrombocytosis, Nephrotic syndrome等疾病已有公布的10K,50K,250K阵列使用linkage软件分析找出的疾病基因,可以用HomozygosityMapper重复结果,详见官网说明。
工具应用示例文献
研究背景:募集的家系含色素性视网膜炎患者,遗传模式为常染色体隐性。
研究目的:找出色素性视网膜炎的遗传缺陷。
研究方法:利用两个近亲大家庭的9例病患个体进行全基因组高密度SNP chip分析,通过mapping搜索病患个体的纯合区域,之后分别在每个家系中,对病患个体和健康成员进行单倍体比较,找到所有病患个体共有的纯合区域;对mapping找到的纯合区域进行Sanger 测序,测已知视网膜疾病相关的基因。(说明:有用到其他方法对检测到的变异进行生物学相关性验证,不是这里讨论的重点,就不赘述了。)
研究结果:在两个家庭最大的纯合区域均检测到TULP1基因,序列分析从其中一个家庭检测到一个已报道的变异(c.1138A>G; p.Thr380Ala),从另一个家庭检测到新的致病变异(c.1445G>A; pArg482Gln)。上述两个变异在两个家系的病患个体中均为纯合型,在未患病的父母中为杂合型,在健康成员中为杂合型,或缺失型(即不含突变)。
研究结论:Homozygosity mapping,结合候选基因分析法,识别了和色素性视网膜炎相关的遗传缺陷,变异位于TULP1基因。
周边工具
家系绘制:HaploPainter
Possible causality of the identified variant: SIFT, Polyphen,补充CADD也是不错的选择
码字不易,如果你有收获,欢迎小心心❤️哟~
网友评论