HiFi测序作为PacBio的明星选手,兼具长读长(10-20Kb)和高准确度(≥99%)双重优势,特别适合SV的检测和遗传病研究。今天一起看下PacBio HiFi测序在遗传病研究中的动人风采!
一、案例一:HiFi测序揭示综合征性智力障碍的致病性结构变异
文章名称:Pathogenic 12-kb copy-neutral inversion in syndromic intellectual disability identified by high-fidelity long-read sequencing
发表单位:日本横滨市立大学医学院和大阪市妇女儿童医院等
发表期刊:Genomics
发表时间:2021年1月
1、研究背景
智力障碍(Intellectual Disability,ID)是一种常见的发育障碍,其主要临床特征表现为认知能力低下和社会适应能力缺陷。遗传和基因组变异是ID的主要原因,已知ID与 500 多个基因变异相关联。研究发现,对ID患者进行核型分析、染色体微阵列分析和基于NGS的分析,诊断率分别达到了约3%、15-20%和28%。然而,仍然有许多和智力障碍相关的病例无法进行分子诊断。因此,使用新技术确定之前无法确定的致病变异很重要。
2、材料方法
材料为一对12岁的单卵双胞胎女孩及其父母。这对双胞胎自5个月时起出现发育迟缓,眼睑严重下垂和癫痫发作,临床症状符合伴有畸形相、上睑下垂及颈椎融合的智力发育障碍(IDDDFP)。该病例以前曾用Trio-WES 进行过分析,但未发现致病变异。对这对双胞胎之一以及她们双亲的样本(II-2,I-1和I-2)进行 PacBio HiFi 测序(深度分别为 20.4X,10.8X 和 10.1X),以探索之前未被全外显子测序检测到的致病变异。
图1 样本选择及患者表型特征(图片引自文献[1])3、研究思路
4、主要结果
(1)变异检测和有害性筛选
使用pbsv软件检测Trio数据中的SV。在II-2中共检测到10,616个缺失、15,363个插入、63个倒位和1,476个重复,其中,450个缺失,586个插入,7个倒位和178个重复为新生突变。基于对基因功能的影响程度进行SV筛选,共发现11个缺失、2个插入、2个倒位和1个重复与RefSeq注释的外显子区域有重叠。一个发生在BRPF1基因上,包含Bromodomain和PHD Finger的编码序列的12 kb倒位变异立即引起了研究人员的注意,因为BRPF1基因异常会导致IDDDFP(OMIM#617333)。且在影响RefSeq基因外显子的16个SVs中,没有其他基因与OMIM常染色体显性遗传病相关。
IGV结果显示12Kb的倒位区段涉及BRPF1的前两个外显子(具有起始密码子的外显子1和2)和Copine家族成员9(CPNE9)的后四个外显子(外显子18至21)。这两个基因都被倒位变异所破坏,并可能导致基因功能丧失。重要的是,患者的临床特征符合IDDDFP,其特征是智力残疾、面部特征畸形、颈椎融合和癫痫发作,这令人信服地将其归因于BRPF1功能的丧失。Southern印迹分析显示仅在受影响的双胞胎(II-2和II-3)中检测到与倒位等位基因相对应的5.1 kb KpnI片段,而在其哥哥(II-1)或父母(I-1和I-2)中未检测到。
图2 12Kb的倒位变异及其验证结果(图片引自文献[1])(2)单倍体分型追溯倒位变异的来源
使用Google DeepVarian从HiFi数据中检测SNV和Indel,然后使用WhatsHap将这些变异用于单倍型分型。II-2的20.4X的HiFi数据被分成22,363个单倍型块,平均块大小为84kb。12kb的倒位位于II-2中的321kb的单倍型块(chr3:9,513,568-9,834,905)内。比较来自三人(II-2,I-1和I-2)的分型结果,揭示了倒位染色体的来源。含染色体位置9,757,086 _ 9,757,754 _ 9,757,993 _ 9,775,730 _ 9,782,977的5个SNP的单倍型G_A_C_A_A成功地证实了12kb倒位遗传自母亲。
图3 单倍型分析揭示倒位的来源(图片引自文献[1])5、研究结论
该研究清楚地表明了亚显微拷贝中性倒位的重要性,以及利用长读长测序技术检测遗传病中这种变异的价值。研究表明,PacBio 测序技术可以发现之前短读长测序遗漏的致病变异,并可以通过单倍型分析追溯致病变异的起源。
二、案例二:HiFi测序助力神经发育障碍诊断
文章名称:Long-read genome sequencing for the moleculardiagnosis of neurodevelopmental disorders
发表单位:美国HudsonAlpha生物技术研究所等
发表期刊:Human Genetics and Genomics Advances
发表时间:2021年4月
1、研究背景
神经发育障碍(Neurodevelopmental Disorders,NDDS)包括发育迟缓、智力障碍、自闭症谱系障碍、和注意力缺陷/多动障碍等,是导致多种身体和智力残疾的异质性疾病,大约会影响1-3%的儿童,是一种罕见病。全外显子组和全基因组测序已被证明是诊断NDDs的有效工具,但仍然有大部分NDDs不能通过NGS测序检测到对应的遗传变异。这很可能,至少部分是因为许多遗传变异很难或不能通过典型的短读测序方法检测出来。
2、材料方法
样本为6个患者家庭的先证者以及他们的父母。这6个Trio家系样本已经进行了基于Illumina的基因组测序(全基因组或全外显子组测序,平均测序深度30X),然而并没有找到致病变异甚至潜在的因果遗传变异。采用PacBio HiFi测序技术进行全基因组测序和致病性研究,先证者平均测序深度为32×(25~44),父母平均测序深度为16×(10~22)。
图4 样本选择及测序情况(图片引自文献[2])3、研究思路
4、主要结果
(1)变异检测比较
PacBio数据和Illumina数据(Illumina genome sequencing ,IGS)检测的变异基本上是一致的。SNV的一致性为96.88%,Indels的一致性为75.96%。先证者的一致性略高,可能是因为父母的PacBio测序深度覆盖率较低导致。IGS的Indels数量远远高于生物学预期,PacBio 数据产生的Indels要少得多,可能主要是IGS的假阳性检测导致。每个Trio家系的三个成员中平均检测出56,000个SVs,每个先证者平均有59个候选新发SVs。对先证者中的35个简单重复区域(已被其他研究表明的可能与各类疾病相关的短串联重复发生区域)进行研究和比较,在所有六个先证者中,97%(34/35)的重复区域被至少10个HiFi读数覆盖,而具有高质量IGS读数占比仅为11%(4/35)。与IGS相比,HiFi测序提供了对这些区域变异的更准确的评估。
(2)致病变异发现验证
先证者6中HiFi数据分析表明CDKL5基因中有一个新的插入突变 (MIM:300203,图1A)。鉴于CDKL5与早期婴儿癫痫性脑病2(EIEE2,MIM:300672)的关联,以及疾病与先证者表型的重叠,包括智力残疾、发育延迟和癫痫发作等,研究者将这一事件列为先证者中最有趣的候选变异。研究表明,该变异为CDKL5基因内复杂的L1介导的插入事件,使外显子3重复并可能导致移码和功能丧失。RT-PCR验证了先证者中带有外显子3第二拷贝的转录本的存在,从而确定该变异导致了先证者的CDKL5功能丧失。
图5 先证者6的插入变异导致CDKL5的外显子3重复(图片引自文献[2])先证者4中HiFi数据分析表明发现多个大的、复杂的结构变异影响到多条染色体(染色体6、7和9)。6号染色体发现了一个包含着丝粒的臂间倒位及8个片段的局部重排,其中大部分(7/8)在先证者中被PCR确认。总而言之,6号染色体上发现的10个断裂位点预计将扰乱至少6个基因,其中5个被注释为蛋白质编码。被断裂点破坏的蛋白质编码基因中,至少一个被预测为单倍剂量不足。
图6 先证者4的6号染色体上结构变异情况(图片引自文献[2])5、研究结论
研究使用PacBio HiFi测序对6个受NDDs影响的先证者及其父母进行分析,有助于更全面和准确地检测不同类别的变异,包括低复杂度的重复序列、移动元件插入和复杂的结构变异等。研究表明,PacBio测序可以检测到通过NGS无法检测到的复杂的SV,未来它很可能将成为罕见疾病遗传学中进行科学研究和诊断测试的强大一线工具。
参考文献:
1. Takeshi M, Nobuhiko O, et al. Pathogenic 12-kb copy-neutral inversion in syndromic intellectual disability identified by high-fidelity long-read sequencing[J]. Genomics, 2021, 113:1044-1053.
2. Susan M. Hiatt, James MJ. Lawlor, et al. Long-read genome sequencing for the molecular diagnosis of neurodevelopmental disorders[J]. Human Genetics and Genomics Advances, 2021,2(2).
网友评论