
简介
这是一篇发表于《nature biotechnology》 2021年4月12日的一篇文章,名称为《评估ctDNA测序在癌症精准医疗中的有效性》。文章主要利用软件模拟数据、人工合成DNA、细胞系来源标准物质对行业内5家公司的ctDNA测序流程的各个阶段进行了评估。结果显示,当突变频率大于0.5%时,各家结果都有良好的灵敏度、特异性和重复性,当突变频率低于此值时,各家结果差异变大,检测结果变得不可信。突变结果显示假阴性突变要比假阳性突变更常见,因此稀有ctDNA片段的有效提取仍然是ctDNA测序技术的关键。这篇文章综合性的评估了ctDNA流程,为该技术更好服务于精准医学提供了指导。
项目起源
当癌细胞发育时,它们会在其DNA中积累突变,当癌细胞降解时,其片段也会进入血液循环。得益于新一代测序的测定方法,这些ctDNA片段现在可以在患者的血液样本中检测到,用于鉴定和监测癌症,替代更具侵入性的组织活检。但是,ctDNA测序也存在主要的技术挑战。cfDNA本身作为小片段存在(约160bp),并且浓度较低(癌症病人血浆中,DNA含量<10ng/mL,基因组数目<3000copies/mL)。然而,来源于肿瘤细胞的cfDNA含量更少(通常突变频率<1%,但经常低至0.01%)。从如此痕量的原始材料中检测稀有somatic突变具有非常大的挑战性。ctDNA测序本身还受到各种实验操作和人工干预的影响,PCR扩增建库过程中扩增偏差也会影响后续突变的检测。
ctDNA测序如此重要并且具有相当大的难度,公众有必要去理解这项技术的灵敏度、特异性、重复性及影响技术性能的各种因素。由美国FDA 领导的基因芯片/测序质控(MicroArray/Sequencing Quality Control,MAQC)协会在SEQC2项目中,对5家公司的ctDNA流程进行了评估。以下为参与评估的5家公司(罗氏、Illumina、IDT、燃石、赛默飞)试剂盒及其参数:

结果
1 利用模拟数据评估ctDNA测序方法
该部分利用wgsim软件,模拟了155个癌症相关基因的SNV_INDEL突变,覆盖深度为9000X,突变频率为0.1%-5%。结果显示:1、对于低频突变,覆盖深度对于突变的检出占主要作用。2、受捕获测序的影响,外显子中部reads覆盖深度高,边缘覆盖深度度低。考虑到许多有害的变异会发生在外显子边界以及splice区域,在进行探针设计时这些区域需要重新考虑。3、由于ctDNA长度较短、携带突变等因素较容易出现比对问题,存在大量非最优比对reads,造成突变区域覆盖深度下降,突变检测灵敏度降低。最明显的例子是RAS家族基因(KRAS、NRAS和HRAS)。

2 利用人工合成内参(sequins)评估ctDNA测序方法
该部分利用sequins方法(具体操作见上篇文章),合成了87个癌症相关基因中的134个突变。结果显示:1、ctDNA方法不仅可以有效的检测突变,并且在足够深度时可以对VAF>=0.8%的突变频率进行精确的检测。2、覆盖深度、突变频率、突变位置、区域GC含量、序列复杂性都会对突变灵敏度检出造成影响

3 多公司、跨平台的精确度研究
该部分利用10个癌症细胞系进行了等比混样获得样品A(在外显子区域含有~4000个已知突变,10.2 Mb的阴性区域),样品A与阴性细胞系B按照20%和4%比例混样,获得Lbx-high (20% A / 80% B) 和 Lbx-low (4% A / 96% B)样品。样品交由5个公司的12独立个实验室进行ctDNA测序,并用各自试剂盒和生信流程进行检测并提交最终突变结果,再有独立的团队比较最终结果的灵敏度、准确性及重复性。
3.1 覆盖深度和异质性
在相同样品量(25ng)条件下,不同公司覆盖深度中位数有较大的差异。F3.c所示,BRP和ROC最高(约4700X),ILM最低(约1200X)。其中BRP覆盖深度的均一性较好。
3.2 灵敏度分析
对比5家公司Lbx-high、 Lbx-low 样品中的突变检出结果(Lbx-high样品突变频率较高,作为已知突变),当突变频率较高(VAF > 2.5%, 0.99–1.00)或中等(VAF 0.5–2.5%, 0.96–1.00)时灵敏度较高,但突变频率较低(VAF 0.1–0.5%, 0.39–0.83)时灵敏度显著下降。其中,IDT和BRP在VAF 0.3-0.5%时,灵敏度仍在0.9以上,表现最好,如F3.d,F4.a所示。
以上结果显示,灵敏度的高低与覆盖深度以及均一性具有重要的相关性,BRP具有最高的平均覆盖深度和均一性,所以灵敏度最好。LDT虽然覆盖深度不是最高,但是均一性较好,灵敏度仍然好于ROC。


3.3 准确性分析
由于参评的所有ctDNA流程都采用UMI进行测序错误的校正,FP(假阳)数量相对较少,每个重复样品中只有1.6-5.3个,并且大多都存在于VAF小于0.5的区域。如F4.b ROC曲线所示,BRP的表现最好。在假阳率都较低的情况下,灵敏度显然是ctDNA流程更重要的因素。
3.4 重复性分析
该部分对4家公司每次实验(within-lab)及不同实验室间(between-lab)的重复性进行了测定,评价重复性的指标为重复实验中共同突变所占的比例。与灵敏度相似,当突变频率较高(VAF>2.5%)或者中等频率(2.5%>VAF>0.5%)时重复性较好,分别为0.99–1.00,0.95–1.00。在突变频率较低(VAF<0.5%)时,重复性较差为0.58–0.83。虽然5家公司在panel的重复性上表现不一,但是在各公司的实验室间的重复性很高。


3.5 初始cfDNA含量及血清提取影响
该部分评估了不同cfDNA起始量(10ng,25ng,50ng)对捕获ctDNA测序的影响。结果显示:1、随着DNA起始量的增加,同一公司ctDNA覆盖深度呈线性增加,但是不同公司之间覆盖深度相差较大 2、当输入的量从10ng变为25ng时,灵敏性、重复性和方法表现都有实质性的提升,尤其是低频突 3、在固定输入量时,检测平台检测到的深度越高,检测表现约稳定,BRP是最稳定的,如Fig5所示。

3.6 比较TFS扩增子测序与杂交捕获的方法
TFS扩增子测序只包含11个癌症相关基因,由于这11个基因都包含在ROC、ILM和BRP公司的Panel内,因此可以用于对比两种方法的结果。结果显示:1、TFS扩增子测序表现与杂交捕获方法类似。在高DNA起始量下(25ng,50ng),TFS表现优异与ROC和BRP方法相同。在低DNA起始量下(10ng),TFS表现迅速下降(覆盖深度较低的原因),但仍然好于ILM 2、在低DNA起始量下,TFS和ILM的重现性相较于ROC和BRP要低,TFS在不同实验和同一实验之间没有表现复现性差异 3、由以上结果可知,ctDNA方法的表现很大程度是由覆盖深度决定的,与捕获测序还是扩增子测序方法无关。结果如Fig6所示:

参考文献:
[1] Deveson I W , Gong B , Lai K , et al. Evaluating the analytical validity of circulating tumor DNA sequencing assays for precision oncology[J]. Nature Biotechnology, 2021.
网友评论