【生信知识】---第四代测序技术的生信软件汇总

作者: 卡布达b1 | 来源:发表于2020-04-27 16:08 被阅读0次

【生信知识】---第四代测序技术的生信软件汇总
学习小组Day7笔记--axin
2018-11-18 学习小组Day7 笔记——基因测序入门（郭
学习小组Day7笔记--没有眼镜
学习小组DAY7笔记-非非
学习小组Day7笔记——懒懒
学习小组Day7笔记——冬梅
【生信知识】---Nanopore测序分析软件nanopolis
学习小组Day7笔记--卜小云
学习小组Day7 初识测序及时雨

1 碱基识别工具
Metrichor是ONT公司推出的基于隐马尔可夫模型进行碱基识别的软件。它的使用需要网络连接。MinION注册用户需要获得开发者账号才能获得软件的源代码。2016年初，两个实验室分别开发了Nanocall和DeepNano软件。这两个软件都可以在本地运行，不需要网络连接。Nanocall基于隐马尔可夫模型，可对1D read在本地进行碱基识别；DeepNano基于recurrent neural network framework，可以获得比隐马尔可夫模型更准确的碱基识别。

2 序列比对工具
传统的NGS序列比对软件不能满足MinION序列比对的需求。这是因为MinION测序数据错误率相对高且序列长，即使调整参数也不能取得好的效果。在这种情况下，适合MinION测序数据的比对软件应运而生。
MarginAlign是通过更好地估计MinION测序reads测序错误来源从而提高与参考基因组的比对效率。通过评估检测到的变异，发现其显著提高了比对的准确性。由于MarginAlign是基于LAST或BWA mem的比对结果进行优化，结果的最终准确性依赖最初的比对结果。
GraphMap是另一个用于MinION测序数据比对的软件。它利用的是一种启发式（heuristics）方法，对高错误率reads和长reads进行了优化。一项研究表明GraphMap比对的灵敏性可与BLAST媲美，且它对reads测序错误率的估计与MarginAlign相当。

3 从头组装工具
MinION测序数据不适合利用NGS数据组装的de Bruijn图法进行组装，主要存在两方面的原因。第一，de Bruijn图法等方法依赖测序reads拆分的k-mer测序准确，而高错误率的MinION测序reads不能保证这一点；第二，de Bruijn图的结构不适用长reads。
MinION测序数据的长reads更适合Sanger测序时期基于有overlap的共有（consensus）序列组装的方法。需要的是在组装前进行测序reads的纠错。第一个基于这种原理进行组装的研究组利用MinION数据组装了一个完整的E. coli K-12 MG1655基因组，序列准确率达到99.5%。他们利用的流程称为nanocorrect，首先利用graph- based，greedy partial order aligner方法进行纠错，然后利用Celera Assembler将纠错后的reads进行组装，最后利用nanopolish对组装结果进行进一步提升。

4 单核苷酸变异检测工具
Reference allele bias是一种在变异检测中倾向于少检测出变异的现象。该现象在测序reads错误率高的情况下尤为严重。
MarginAlign中的marginCaller模块是研究机构开发的适用于MinION测序数据的变异检测软件。MarginCaller利用maximum-likelihood参数估计和多条测序reads序列比对来检测单核苷酸变异。当计算机模拟出测序错误为1%时，测序深度在60X，marginCaller检测出的SNV具有97%的准确率和完整度。另外一项研究中，研究者利用GraphMap方法，检测人基因组的杂合变异，可以达到96%的准确率。利用计算机模拟的数据，GraphMap同样可以高准确率，高完整度地检测出结构变异。
Nanopolish也可以用来检测变异。它用的是event-level alignment算法。在该方法中，从参考基因组序列开始，依次评估参考基因组序列产生的电信号与测序reads的相似性进而依次修饰参考基因组序列，生成一个consensus read。直到consensus read与测序read产生的电信号足够相似，将consensus read与参考基因组序列比较，得到变异。该方法在埃博拉病毒的研究中有大约80%的准确性。
PoreSeq采用与Nanopolish类似的算法。它可以利用更低深度的测序数据获得高准确率和高完整度的SNV检测。在一项研究中，PoreSeq在16X测序深度下获得99%准确率和完整度的SNV检测，与marginAlign相比，它显著降低了测序深度。

5 共有序列的测序（consensus sequencing）方法
MinION测序数据目前只有92%的准确性。在低深度测序的情况下，不能够满足类似单体型（haplotype phasing）和人样品的SNV检测的要求。文章提到的解决问题的方法是rolling circle amplication，它的原理是将一个片段进行多次扩增，在一个DNA分子上生成多个拷贝，这样最终获得的共有序列测序结果的准确率可以达到97%。