首先华大没有给我塞钱,最近有用华大的测序,就学习了一下。
华大的测序技术起源于 CG(Complete Genomics) 的 cPAL(combinatorial Probe-Anchor Ligation) 测序。
CG 的 cPAL 测序的建库称为 DNB(DNA Nanoballs), 利用 RCA(Rolling circle replication) 让 DNA 扩增成线性的螺旋结构。这个建库方式优点是所有的扩增模板都是最初的插入片段,这样 PCR 产生的错误不会累积,只影响该扩增序列。像 ILLUMINA 的测序如果扩增发生错误,那么后续扩增会有该错误片段作为模板,从而导致错误累积。
通过 RCA 扩增的片段是连接在一起形成线性螺旋的 DNA
文库构建后加入到测序芯片,测序芯片有 DNB 结合位点,一个位点结合一个 DNB.
Pattern Array
然后是 cPAL 测序。每轮测序先加入与接头匹配结合的锚序列(anchor sequence),然后加入大量只有一个荧光标记碱基的探针,该荧光标记碱基在探针的位置由需要测序的位置决定,比如要测第一个碱基,那么就只标记探针第一个碱基,要测第五个碱基就荧光标记探针第五个碱基。探针结合后洗去未结合的探针,然后检测应该信号,得到序列信息。然后移除所有的结合探针和锚序列,开始下一轮测序。对比 ILLUMINA 的 SBS 测序,优点是下一个碱基不依赖于上一碱基,这样测序错误更加随机。
cPAL 测序
后来的 BGISEQ-500 仪器使用改进自 cPAL 的 cPAS(combinatorial probe-anchor synthesis) 技术,具体这个 cPAS 技术细节我没找到合适材料,但我猜测应该是类似于 ILLUMINA 的 SBS. 有资料的朋友欢迎分享。
MGISEQ-2000 依旧使用 DNB 建库,但是测序应用了 CoolMPS 新技术。这是一种基于抗体的技术,荧光标记在抗体上,而不是 dNTP 碱基上(因此称为 cold dNTPs)。这解决了 ILLUMINA 平台在 dNTP 添加荧光基团会导致 DNA “疤痕” 影响后续测序准确度。
蓝色箭头指示 DNA “疤痕”
CoolMPS 技术如下示意。对比 ILLUMINA SBS 主要改进就是将荧光基团标记在抗体上,让抗体跟碱基特异性结合,从而测序更准确。另外,抗体可携带多个荧光基团,让荧光信号更强。
CoolMPS 测序
那么 DNB 建库后用 CoolMPS 的双端测序是怎么一个过程呢?如下所示,A 进行 Read1 的引物结合并测序;B 在 Read1 完成后继续合成序列,直到下一段序列的 5' 端。C 新合成序列 3' 端到达下一序列 5' 端后,5' 端被置换形成分叉;D 在分叉上进行 Read2 测序。
DNB 进行 CoolMPS 测序
下图显示 CoolMPS 测序前 2 碱基对被测碱基信号影响小。
图来自 MGISEQ-2000 彩页
参考资料
Chen, Fei, et al. "The history and advances of reversible terminators used in new generations of sequencing technology." Genomics, Proteomics & Bioinformatics 11.1 (2013): 34-40.
Drmanac, Snezana, et al. "CoolMPS™: Advanced massively parallel sequencing using antibodies specific to each natural nucleobase." bioRxiv (2020).
华大官网
网友评论