Author summary
CNV是一种重要的基因组结构变异类型,由于其改变了细胞中基因的拷贝数,影响了编码序列,在人类疾病的易感性或抗性中发挥着重要作用,与复杂的表型相关。为了识别CNV,已经开发了几种实验方法,但它们的分辨率非常低,短CNV的检测成为瓶颈。近年来,高通量测序技术的发展使精确检测CNV,特别是短基因CNV成为可能。许多CNV检测应用是基于高通量测序数据的可用性而发展起来的。由于CNV检测算法的不同,不同应用所识别的CNV有很大的差异。因此,有必要帮助研究者根据他们的目标选择合适的应用来检测CNV。为此,我们不仅比较了10种常用的CNV检测应用,而且还通过灵敏度、特异性和计算需求对这些应用进行了基准测试。我们的结果表明,测序深度对CNV的检测有很强的影响。在10个基准应用程序中,LUMPY在每个测序深度的高灵敏度和特异性方面表现最好。我们还推荐了用于特定用途的应用,例如CNVnator和RDXplorer用于高灵敏度,CNVnator和GROM-RD用于低深度测序数据。
摘要
近年来,拷贝数变异(copy number variation,CNV)作为一种在复杂表型和疾病易感性中起重要作用的基因组变异,引起了人们的广泛关注。由于最近开发了许多CNV检测方法,因此有必要帮助研究人员根据其目标选择合适的CNV检测方法。因此,本研究比较了10种常用的CNV检测应用,包括CNVnator、ReadDepth、RDXplorer、LUMPY和Control FREEC,并通过敏感性、特异性和计算需求对应用进行基准测试。以DGV金标准变体作为标准数据集,我们使用5倍到50倍的测序深度的真实测序数据评估了10个应用程序。在十种基准方法中,LUMPY在每个测序深度的高灵敏度和特异性方面表现最好。出于高特异性的目的,Canvas也是一个不错的选择。如果首选高灵敏度,则CNVnator和RDXplorer是更好的选择。此外,CNVnator和GROM-RD在低深度测序数据方面表现良好。我们的结果为这些选定的CNV检测方法提供了全面的性能评估,并有助于CNV预测方法的未来发展和改进。
LUMPY的使用可以参考https://www.jianshu.com/p/1844870f3b25
网友评论