测序方式:ngs(二代测序)
突变数据过滤对象:仅限snp 和small indel
样本类型:临床肿瘤样本
突变caller: mutect2 vardict
对于临床肿瘤样本报告解读是非常重要的一部分,在生信流程端能够减少假阳性的数据输出到报告解读的同事,这样会大大减少他们的工作量,提升报告签发效率。在数据过滤中,常常需要依赖多个公共数据库如clinvar, dbsnp, exac, cosmetic, 1000genome等,这样可以去掉大部分没有重要临床意义的突变,但是在实际分析过程中,仍然会存在部分突变位点,在实验室的多数样本中存在,但在公共数据库中可能并没有注释重要的信息。如果一刀切,将这部分数据过滤掉,肯定是不合理的。我们考虑构建本实验室内部的突变过滤数据库,将所有样本经过公共数据库过滤后的variants,统计发生概率,如果发生概率大于50%,可能认为这部分突变是由于实验室操作或测序仪等湿实验端原因引入的假阳性突变。
对于实验室内部突变过滤数据库,应该考虑样本类型(cfDNA/gDNA),检出panel 等差异,进行细分统计。不用panel 的探针捕获区域/捕获效率都不同,如果混合统计会对结果有影响。
实验室发生概率过滤的阈值定位50%,是考虑到目前实验室积累的样本数据比较少,采用一个比较宽松的阈值,后续随着样本积累,我们会测试并调整合适的阈值。
网友评论