美文网首页
2021-07-10 UDI & UMI

2021-07-10 UDI & UMI

作者: NAome | 来源:发表于2021-07-10 22:19 被阅读0次

简述

UDI,即Unique Dual Index,双端唯一标签技术UMI,即Unique Molecular Identifier,分子条形码或者分子标签技术

index

要实现对多个样本同时测序,必须在各样本PCR扩增阶段,往DNA片段上添加一段分子序列作为样本标签,这种标签叫做index。在多样本混合测序后,通过这些标签即可确定对应的样品。Index一般由8位碱基所组成,常有单端与双端两种添加模式,为了增加同时上样的通量,大家一般在面临大量样本同时测序时,会选择双端index。例如如果单段有12种index形式,双端则可以实现对12*12=144种样品的混合测序。

文库结构示意图

目前常用的双端index策略是通过少数几种index序列排列组合,去实现更多样本的标签区分(如96种),但这种方式一直存在交叉污染的可能。

同时,为了进一步提升通量与扩增效率,降低测序成本,Illumina为Novaseq等高通量型测序仪引入了图案化流动槽(Patterned Flow Cell Technology,PFCT)和排他性扩增(Exclusion Amplification,ExAmp)成簇技术。这两个看似美好的技术却无意间放大了一种叫做标签跳跃(index hopping)的样本标签错配的现象,导致科研人员无法正确拆析样本与数据的关系,最终可能与重大发现“失之交臂”。

为了降低标签跳跃,Illumina在白皮书[1]中提到可以使用UDI双端特殊标签对样本进行标记,混样后进行测序。

UDI的引入使得文库两端的index序列是唯一,且一对一组合的,不存在共用。换句话说,只有两端带有完全正确index序列的reads才能进入后续的样本分析,从而可以剔除标签错配的reads,有效避免样本之间的数据串扰。

一句话总结:采用UDI策略,能更正确拆解测序数据与样本之间的一一对应关系,减小样本“戴错号码牌”的概率

下面再来讲讲名为分子标签技术的UMI:

UMI的原理就是给每一条原始DNA片段加上一段特有的标签序列,经PCR扩增后一起进行测序。这样根据不同的标签序列,生信人员就能区分不同来源的DNA模板,分辨哪些是PCR扩增及测序过程中的随机错误造成的假阳性突变,哪些是患者真正携带的突变,从而提高检测灵敏度和特异性。

一些需要较高正确度的应用,如肿瘤稀有突变分析,常会对5%、甚至1%左右的稀有变异作检测。这时一旦出现测序错误、或者PCR偏差,便会产生大量假阳性结果,因此需要添加UMI进行校正。

相关文章

网友评论

      本文标题:2021-07-10 UDI & UMI

      本文链接:https://www.haomeiwen.com/subject/dlshpltx.html