前言:
- 之前接触实体瘤RECIST 1.1标准时,直接读原版论文吸收效率太低;网传中文版大都为同一版本,内容不全且翻译有些拗口。于是当时自己动手翻译了除附录外的内容。
- 从RECIST 1.1的工具属性角度看,阅读中文说明的效率大大提高;熟悉了解标准之后,再次阅读原文、肿瘤项目的Protocol、SAP,内容理解也会更加深刻。
- 后台回复:RECIST,获取论文以及翻译的PDF文档。抽空整理,也算字字斟酌,句句推敲。翻译不易,转载请注明出处(by 野藤/SAS茶谈)。
摘要
背景:
评估肿瘤负荷的变化是癌症治疗临床评估的一个重要特征:肿瘤缩小(客观缓解)和疾病进展在临床试验中都是有效的终点。自2000年RECIST发表以来,许多研究者、合作团体、行业以及政府部门在评估治疗结果时采用了这些标准。不过,也出现了一些问题和争议,这推动了RECIST指南(1.1版)修订的开发。在本期特刊中,不同的论文总结了修订的依据,这些依据来自于对一个大型数据库的评估(>6500例患者)、模拟研究以及文献综述。
修订后的RECIST 1.1的要点:
主要变化包括:
病灶评估的数量(Number of lesions to be assessed):基于来自一个用于分析目的、从众多试验数据库合并成的数据库的证据,为确认疗效的肿瘤负荷评估所需要的病灶数量从最多10个减少到最多5个(每个器官最多2个)。
病理性淋巴结的评估(Assessment of pathological lymph nodes)现在被纳入:短轴≥15mm的结节被认定为是可测量和可评估的靶病灶。在计算肿瘤疗效时,病灶直径总和应包含短轴的测量长度。短轴缩小到<10 mm的结节被认定为是正常。
疗效确认(Confirmation of response)在疗效为主要终点的试验中是需要的,但在随机研究中不再需要,因为对照组可以作为解释数据的适当手段。
疾病进展(Disease progression)从以下几个方面阐明: 除了之前疾病进展的定义,靶病灶直径总和增加20%外。现在还需要绝对值增加5mm,以避免总和非常小时被过度认定为PD。此外,还提供了关于不可测量/非靶病灶的“明确进展”的指导,这是最初的RECIST指南中造成混乱的一个原因。最后,关于新病灶检测的章节,包含了对FDG-PET扫描评估的解释。
影像学指导(Imaging guidance):修订后的RECIST包含一个新的影像学附录,其中更新了病灶最佳解剖评估的建议。
未来工作:
RECIST工作组在开发RECIST 1.1时考虑的一个关键问题是,从肿瘤负荷的解剖学一维评估转移到解剖学立体评估,或者转移到PET或MRI的功能性评估,是否合适。结论是,目前还没有足够的标准或证据来放弃肿瘤负荷的解剖学评估。唯一例外是,使用FDG-PET成像作为确定疾病进展的辅助手段。正如本期特刊的最后一篇文章中所详述的,使用这些有前景的新方法需要适当的临床验证研究。
1. 背景
1.1 RECIST标准的历史
评估肿瘤负荷的变化,是癌症治疗临床评估的一个重要特征。肿瘤缩小(客观缓解)和疾病进展时间是癌症临床试验的重要终点。在筛选新药、为寻找抗肿瘤疗效的证据的Ⅱ期试验中,使用肿瘤消退作为试验终点,得到了多年研究证据的支持。这些证据表明,对于许多实体瘤来说,在Ⅲ期随机化研究中,在一定比例的患者中引起肿瘤缩小的药物,有相当大的可能性(虽然不完全),在随后的总生存期或其他事件时间指标上显示出改善(综述于[1-4])。目前,客观缓解具有比任何其他生物标志物更多的证据,支持其在Ⅱ期筛查试验中作为有前景的治疗效果的衡量标准。此外,在药物开发的Ⅱ期和Ⅲ期阶段,晚期疾病的临床试验越来越多地利用疾病进展时间(或无进展生存期)作为得出疗效结论的终点,这也是基于肿瘤大小的解剖学测量。
然而,这两个肿瘤终点,客观缓解和疾病进展时间,只有在基于广泛接受和容易应用的肿瘤解剖学负荷标准时才有效。1981年,世界卫生组织(WHO)首次公布了肿瘤疗效标准,主要用于肿瘤疗效作为主要终点的试验。世界卫生组织的标准引入了肿瘤负荷的总体评估概念,通过对病灶二维测量结果的求和,并通过评估治疗期间基线变化来确定治疗疗效5。然而,在该标准发表后的几十年里,为适应新技术或解决原始文件中不明确的领域,使用世卫组织标准的合作团体和制药公司经常对其进行“修改”。这导致了对试验结果解释上的混乱6,事实上,应用不同疗效标准会造成同一方案中有效性结论大大不同7。考虑到这些问题,为了疗效标准的标准化和简化,一个国际工作小组在1990年代中期成立。新的标准,于2000年发布,被称为RECIST(实体瘤疗效评估标准)8。初版RECIST的主要特点包括,定义可测量病灶的最小尺寸,随访病灶的数量说明(最多10个;每个器官部位最多5个),对肿瘤负荷应使用一维而不是二维的方法进行全面评估。这些标准随后被学术机构、合作团体和产业界广泛采用,用于主要终点为客观缓解或疾病进展的试验。此外,监管当局接受RECIST作为这些评估的合适指南。
1.2 为什么要更新RECIST?
自从2000年RECIST发表以来,许多研究者在前瞻性分析中证实了用一维标准替代二维标准(甚至三维)的有效性(在[9]中回顾)。除了极少数例外(例如间皮瘤),一维标准的使用似乎在实体瘤Ⅱ期研究中表现良好。
然而,出现了一些值得回答和进一步澄清的问题。其中包括是否可以评估少于10个病灶而不影响患者的总体指定疗效(或试验中关于活性的结论); 如何在Ⅲ期随机化试验中应用RECIST,其中疾病进展是主要终点,而非疾病缓解,特别是如果并非所有患者都有可测量的病变;是否可以利用以及如何利用较新的成像技术,例如FDG-PET和MRI;如何处理淋巴结的评估;是否确实需要确认疗效;以及,同样重要的是,RECIST在靶向非细胞毒性药物试验中的适用性。RECIST 指南的此次修订包括涉及所有这些要点的更新。
1.3 RECIST 1.1 开发过程
RECIST工作组由来自学术研究机构、政府和行业的具有早期药物开发专业知识的临床医生以及影像专家和统计学家组成,定期开会,为 RECIST 的更新制定议程,确定证明所做的各种更改所需的证据,并审查新出现的证据。修订过程的一个关键方面是创建一个数据库,其中包含从工业和学术小组试验中获得的前瞻性记录的实体瘤测量数据。该数据库在Jan Bogaerts和Patrick Therasse(本指南的共同作者)的领导下在EORTC数据中心组建,由>6500名患者以及>18000个靶病灶组成,用于调查各种问题(例如所需靶病灶的数量,疗效确认的需求以及淋巴结测量规则)对缓解和无进展生存结果的影响。这项工作的结果经过RECIST工作组的评估,造成了修订后的指南的大部分变化,在本期特刊的另一篇文章中详细报道了这项工作的结果。拉里·施瓦茨(Larry Schwartz)和罗伯特·福特(Robert Ford)(也是本指南的共同作者)还提供了关键数据库,从中可以做出推论,为这些修订提供信息。
该修订指南的发布被认为是及时的,因为它包含了简化、优化和标准化临床试验肿瘤负荷评估过程中的变化。主要变化的摘要见附录Ⅰ。由于评估的基本方法仍然基于疾病的解剖学评估,而不是功能性评估,因此我们选择将此版本命名为RECIST 1.1,而不是2.0。
1.4 体积或功能评价如何?
这就提出了一个经常提到的问题,即现在是否“是时候”从肿瘤负荷的解剖学一维评估转向解剖学立体评估或功能性评估(例如动态对比增强MRI或CT或(18)F-氟脱氧葡萄糖正电子发射断层扫描(FDG-PET)技术评估肿瘤代谢)。可以看出,工作组,特别是那些参与影像学研究的工作组,认为目前没有足够的标准化和广泛的可用性来建议采用这些替代评估方法。如本指南后面所述,唯一的例外是使用FDG-PET成像作为确定疾病进展的辅助手段。正如本期特刊的论文所详述的那样12,我们认为使用这些有前景的新方法(可以增加或替代RECIST中描述的解剖学评估)需要适当和严格的临床验证研究。Sargent等人的这篇论文说明了能够定义这些模式的“终点”所需的数据类型,以及如何确定这些标准/模式可以在何处和何时使用,以提高识别真正有效的新药物和丢弃真正非活性的新药物的可靠性与Ⅱ期筛选试验中的RECIST标准相比。RECIST工作组期待在未来几年内出现此类数据,以便对RECIST标准的下一次迭代进行适当修改。
2. 该指南的目的
本指南描述了实体瘤测量的标准方法和定义,用于客观评估成人和儿童癌症临床试验的肿瘤大小变化。预计这些标准将用于所有以客观缓解为主要研究终点的试验,以及进行疾病稳定、肿瘤进展或进展时间分析评估的试验,因为所有这些研究结局指标都是基于对肿瘤解剖学负荷及其变化的评估。本文没有任何关于符合这些终点标准的、表明药物或治疗方案是有效的患者比例的假设:这些定义取决于正在进行试验的癌症类型以及正在研究的特定药物。方案必须包括适当的统计学部分,这部分定义了试验样本量和决策标准所依据的疗效参数。除了提供评估肿瘤疗效的定义和标准外,本指南还就以肿瘤疗效为终点的试验结果的标准报告给出了建议。
虽然这些指南可能适用于恶性脑肿瘤研究,但在这一领域关于疗效评估已有单独的标准出版13。本指南不适用于恶性淋巴瘤的研究,因为淋巴瘤疗效评估的国际指南已单独发布。
最后,许多肿瘤学家在日常临床实践中通过反复的影像学检查来跟踪患者的恶性疾病,并根据客观和症状标准做出继续治疗的决定。只有肿瘤治疗学家认为RECIST指南是合适的,指南才会在决策中发挥作用。
3. 基线肿瘤的可测量性
3.1定义
在基线时,肿瘤病灶/淋巴结将被分类为可测量与不可测量,如下所示:
3.1.1 可测量
肿瘤病灶:
必须在至少一个维度上准确测量(测量平面中的最长直径将被记录),最小尺寸为:
- 10mm,通过CT扫描(CT扫描切片厚度不大于5mm;见附录Ⅱ关于影像学指南)。
- 10mm,通过临床检查(无法用卡尺准确测量的病灶应记录为不可测量)。
- 20mm,通过胸部X光检查。
恶性淋巴结:
当通过CT扫描评估时(建议CT扫描切片厚度不超过5mm),淋巴结的短轴必须≥15mm才会被认定为是病理性增大和可测量。在基线和随访中,仅测量和跟踪其短轴(见施瓦茨等人在本期特刊15)。另请参阅下文关于“靶病灶和非靶病灶的基线记录”的说明,以获取有关淋巴结测量的信息。
3.1.2 不可测量
所有其他病灶,包括小病灶(最长直径<10mm或短轴≥10至<15mm 的病理性淋巴结)以及真正不可测量的病灶。被认为真正无法测量的病灶包括:软脑膜疾病、腹水、胸腔或心包积液、炎性乳腺疾病、皮肤或肺淋巴管炎受累、通过体格检查发现但无法进行可重复的影像学技术测量的腹部肿块/腹部器官肿大。
3.1.3 关于病灶可测量性的特殊注意事项
骨病灶、囊性病灶和既往接受局部治疗的病灶需要特别注意:
骨病灶:
- 骨扫描,PET扫描或平片不认为是测量骨病变合适的影像学技术。然而,这些技术可用于确认骨病灶的存在或消失。
- 如果软组织成分符合上述可测量性的定义,则可通过横断面成像技术(如 CT或 MRI)评估的具有可识别软组织成分的溶解性骨病灶或混合溶解性原始细胞病灶,可被视为可测量病灶。
- 原始细胞性骨病灶是不可测量的。
囊性病灶:
-
符合影像学定义的单纯性囊肿标准的病灶不应被视为恶性病灶(既非可测量,也非不可测量),因为根据定义,它们是单纯性囊肿。
-
被认为代表囊性转移的“囊性病灶”如果符合上述可测量性的定义,则可以被视为可测量的病灶。然而,如果同一患者存在非囊性病灶,则首选这些病灶作为靶病灶。
既往接受局部治疗的病灶:
- 除非病灶已证实疾病进展,否则位于先前照射区域或接受其他局部区域治疗的肿瘤病灶通常不被认为是可测量的。研究方案应详细说明此类病灶被认定是可测量的条件。
3.2 测量方法规范
3.2.1. 病灶的测量
如果使用经过临床评估的卡尺,所有测量值均应以公制单位记录。所有基线评估都应尽可能接近治疗起点,切勿超过治疗起点的前4周。
3.2.2. 评估方法
应使用相同的评估方法和相同的技术,来描述基线和随访期间发现和报告的每种病变。除非所跟踪的病灶无法成像,但可通过临床检查进行评估,否则应始终进行基于影像学的评估,而不是临床检查。
临床病灶:临床病灶只有在浅表且使用卡尺评估 ≥10mm直径(例如皮肤结节)时才被认为是可测量的。皮肤表浅病灶建议使用彩色照片记录,照片附上测量病灶大小的比例尺。如前所述,当病灶既可用临床检测也可用影像学检查时,由于影像学更客观并可用于治疗后研究终点的回顾,应采用影像学检查。
胸部X片:胸片和胸部CT测量病灶,因为CT在发现新病灶等方面比较X片更敏感,优先选用CT扫描,特别在重要的治疗终点时。当然,肺实质中边界清楚的病灶也可使用胸片检测。详见附录Ⅱ。
CT, MRI:CT是目前用来评估病灶疗效最有效和重复性最好的检测方法。指南定义可测量病灶用CT扫描基于层厚不超过5mm。如附录Ⅱ所示,当CT层厚超过5mm,可测量病灶最小应是层厚的两倍。MRI在某也情况下也可使用(如全身扫描)。更多关于使用CT和MRI检测实体瘤评估疗效的意见详见附录Ⅱ。
超声检查:超声检查不适用于评估病灶大小,不应用作测量方法。超声检查在两次相邻的观察间不能完全再现,而且结果依赖于检查者,从一次检测到下一次,不能保证相同的技术和测量结果(详见附录Ⅱ)。如果在研究过程中通过超声发现新的病灶,建议用CT或MRI验证。如果顾虑CT的射线照射,可用MRI代替来检测待检病灶。
内窥镜检查、腹腔镜检查:不建议使用这些技术进行肿瘤客观评估。然而,在获得活检时,它们可用于确认完全病理性缓解;或者在完全缓解或手术切除后复发为终点的试验中确定复发。
肿瘤标志物:肿瘤标志物不能单独用于评估肿瘤客观疗效。但是,如果标志物最初高于正常值上限,则必须使其正常化,才能考虑患者完全缓解。由于肿瘤标志物具有疾病特异性,应根据疾病特异性将其测量说明纳入方案中。关于CA-125反应(复发性卵巢癌)和PSA反应(复发性前列腺癌)的具体指南已经发布16-18。此外,国际妇科肿瘤协作小组还制定了CA125进展标准,该标准将与肿瘤客观评估相结合,用于卵巢癌的一线试验19。
细胞学、组织学:如果方案要求,这些技术可用于在极少数情况下区分PR和CR(例如,生殖细胞肿瘤等肿瘤类型的残留病变,其中已知残留良性肿瘤可能仍然存在)。当已知积液是治疗的潜在不良反应时(例如使用某些紫杉烷类化合物或血管生成抑制剂),如果可测量的肿瘤符合缓解或疾病稳定标准,则可以考虑对治疗期间出现或恶化的任何积液的肿瘤起源进行细胞学确认,以区分缓解(或疾病稳定)和疾病进展。
4. 肿瘤疗效评估 (Tumour response evaluation)
4.1. 评估肿瘤总体负荷与可测量病变
为了评估客观缓解或未来进展,有必要在基线时评估肿瘤总体负荷,并将其作为后续测量的比较对象。在以肿瘤客观缓解为主要终点的方案中,只有基线有可测量病变的患者才会入组。可测量病变定义为,存在至少一个可测量的病灶(详见上文第3节)。在主要终点是肿瘤进展的研究中(进展时间或固定日期的进展比例),方案必须指定是否仅限于患有可测量病变的患者入组,或者仅患有不可测量病变的患者是否也符合入组条件。
4.2. 靶病灶与非靶病灶的基线记录
当基线存在一个以上的可测量病灶时,代表所属器官的病灶总共最多5个,会被认定为靶病灶(每个器官最多2个),并在基线进行记录和测量(这意味着,患者在只有一个或两个器官部位病变的情况下,将分别记录最多两个或四个病灶)。对于仅选择5个靶病灶的依据,参见Bogaerts等人对一个大型前瞻性数据库的分析文章10。
靶病灶应基于其大小尺寸进行选择(直径最长的病灶),应是所属器官中最有代表性的病灶,但也应该是可重复测量的病灶。有时可能会出现这样的情况,最大病灶本身不适合进行重复测量。这种情况下,应该选择下一个可重复测量的最大病灶。为了说明这一点,请参阅附录Ⅱ中的图3的例子。
淋巴结需特别说明,因为它们是正常的解剖结构,即使不涉及肿瘤,也可以通过影像看到。如第3节所述,定义为可测量且可能被确定为靶病灶的病理性淋巴结,必须符合CT扫描短径≥15 mm的标准。只有这些结节的短径,才会被纳入基线总和的计算。通常放射科医生通过使用淋巴结的短径,来判断是否有实体瘤。结节大小通常记录为所获影像的两个平面维度 (对于CT扫描,这几乎总是轴向面;对于MRI,采集平面可能是轴向、矢状或冠状)。在这些测量中,较小的那一条径线就是短径。例如,一个报告为20mm * 30mm的腹部淋巴结,其短径为20mm,属于可测量的恶性淋巴结。本例中,应记录20mm作为结节的测量值(参见附录Ⅱ中的图4示例)。其他所有病理性淋巴结(短径≥10 mm,但<15 mm),应被认定为非靶病灶。短径<10mm的淋巴结被认为是非病理性的,不应该记录或随访。
所有靶病灶的直径之和(非淋巴结病灶使用长径,淋巴结病灶使用短径),将会在基线时计算,并记录为基线总和。如果淋巴结被纳入总和计算中,如上所述,只有短径会算入总和。基线直径总和将作为参考,以进一步在病变可测量的维度上描述任何肿瘤客观消退。
所有其他病灶(或病变部位),包括病理性淋巴结,应认定为非靶病灶,也应在基线时记录。这些病灶不需要测量,应随访为“存在”、“不存在”,或在极少数情况下“明确进展”(更多细节见下文)。此外,可以将所属同一器官的多个非靶标病灶记录为病例报告表上的单个项目(例如“多发性盆腔淋巴结肿大”或“多发性肝转移”)。
4.3. 疗效标准
本节提供了用于确定靶病灶的肿瘤客观疗效的定义标准。
4.3.1. 靶病灶的疗效评价
-
完全缓解(Complete Response, CR): 所有靶病灶消失。任何病理性淋巴结 (无论是否为靶病灶) 的短径必须缩短至 <10 mm。
-
部分缓解(Partial Response, PR): 以基线直径总和作为参考值,靶病灶的直径总和至少减小30%。
-
疾病进展(Progressive Disease, PD): 以研究中的直径总和的最小值作为参考值,靶病灶的直径总和至少增加20% (如果基线总和是研究中的最小值,则参考值为基线总和)。除了相对增加20%,总和增加的绝对值还必须至少是5毫米 (注意:出现一个或多个新病灶也被认为是疾病进展)。
-
疾病稳定(Stable Disease, SD): (直径总和) 既没有减少得足够多,以达到PR;也没有增加得足够多,以达到PD (以研究中的直径总和的最小值作为参考值)。
4.3.2. 靶病灶评估的注意事项
淋巴结 (Lymph nodes)
被认定为靶病灶的淋巴结,即使在研究中消退至10mm以下,应始终记录短轴的实际测量值(在与基线检查相同的解剖平面上测量)。这意味着当淋巴结作为靶病灶时,即使满足完全缓解标准,病灶的“总和”也不可能为零,因为正常淋巴结定义为拥有<10mm的短轴。因此,为了符合CR条件,病例报告表或其他数据收集方法可以将淋巴结靶病灶记录设计在单独的部分,其中每个节点的短轴必须<10mm。对于PR,SD和PD,节点短轴的实际测量值,应包含在靶病灶的总和中。
“太小而无法测量”的靶病灶 (Target lesions that become ‘too small to measure’)
在研究中,基线记录的所有病变(淋巴结和非淋巴结)都应在每次后续评估中记录其实际测量值,即使非常小(例如2mm)。然而,有时在基线时记录为靶病灶的病变或淋巴结在CT扫描中变得非常微弱,以至于放射科医生可能无法给定精确的测量值,而将其报告为“太小而无法测量”。
发生这种情况时,在病例报告表上记录一个值很重要。如果放射科医生认为病灶可能已经消失,则应将测量记录为0mm。如果认为病灶存在且隐约可见,但太小而无法测量,则应分配默认值5mm(注意:此规则不太适用于淋巴结,因为通常它们在正常时具有可定义的大小,并且经常被脂肪包围,例如在腹膜后;但是,如果认为淋巴结存在并且隐约可见,但太小而无法测量,则在这种情况下也应分配默认值5mm)。此默认值源自5mm CT切片厚度(但不应随 CT切片厚度的变化而改变)。这些病灶的测量可能是不可重复的,因此提供默认值将防止基于测量误差的假缓解或假进展。然而,重申一下,如果放射科医生能够提供实际的测量结果,即使它低于5毫米,也应该记录下来。
治疗中分裂或融合的病灶 (Lesions that split or coalesce on treatment)
如附录Ⅱ所述,当非淋巴结病灶变成“碎片”时,应将碎片部分的最长直径相加以计算靶病灶总和。同样,当病灶融合时,可以在它们之间保持一个平面,以帮助获得每个单个病变的最大直径测量值。如果病变确实已经融合,以至于不可分离,在这种情况下,最长直径应该是“融合病灶”的最长直径的最大值。
4.3.3. 非靶病灶的评估
本节提供用于确定一组非靶标病灶的肿瘤疗效标准的定义。虽然一些非靶病灶实际上可能是可测量的,但它们不需要测量,而应仅在方案指定的时间点进行定性评估。
-
完全缓解(Complete Response, CR):
所有非靶病灶消失,肿瘤标志物水平正常化。所有淋巴结的大小必须是非病理性的(短轴<10mm) 。 -
Non-CR/Non-PD: 一个或多个非靶病灶持续存在和/或肿瘤标志物水平维持在正常值上限以上。
-
疾病进展(Progressive Disease, PD): 现有非靶病灶的明确进展(见下文评论)。(注意:一个或多个新病灶的出现也被认定为是进展)。
4.3.4. 非靶病变进展评估的特别说明
非靶病变进展的概念需要以下额外解释:
当患者还有可测量的病变时
在这种情况下,为了在非靶病变的基础上实现“明确进展”,非靶病变的总体水平必须显著恶化,这样,即使在靶病变中存在SD或PR,肿瘤总体负荷也已增加到足以值得停止治疗(请参阅附录Ⅱ中的示例以及下面的更多详细信息)。一个或多个非靶病灶的大小尺寸的适度“增加”通常不足以达到明确进展状态。因此,面对靶病灶的SD或PR,仅根据非靶病灶的变化来确定总体进展是极其罕见的。
当患者只有不可测量病变时
当研究入组标准不是具有可测量病变时,这种情况会出现在某些Ⅲ期试验中。如上所述,一般同样的概念在这里也适用,但是,在这种情况下,没有可测量的病变评估用于解释不可测量疾病负荷的增加。由于非靶病变的恶化不容易量化(根据定义:如果所有病变确实不可测量),因此在评估患者的明确进展时可以应用的有效检测是,考虑基于不可测量病变变化的总体疾病负担的增加,是否与宣布PD为可测量疾病所需的增加相当:即肿瘤负荷的增加意味着“体积”额外增加73%(相当于可测量病变的直径增加20%)。例如,胸腔积液从“少量”增加到“大量”,淋巴管炎疾病从局部增加到广泛,或者在方案中可能被描述为“足以需要改变治疗”。附录Ⅱ的图5和图6显示了一些说明性示例。如果看到“明确进展”,则应考虑患者此时达到整体PD。虽然最好有适用于不可测量疾病的客观标准,但这种疾病的性质使其无法这样做,因此增加必须是实质性的。
4.3.5. 新病灶
新的恶性病灶的出现意味着疾病进展,因此,一些关于新病灶检测的讨论很重要。没有识别新发病灶的具体影像学标准;然而,新病变的发现应该是明确的:即不能归因于扫描技术的差异、成像方式的变化或被认为代表肿瘤以外的其他东西的发现(例如,一些“新”骨病灶可能只是先前存在的病灶的愈合或耀斑)。当患者的基线病灶显示部分或完全缓解时,这一点尤其重要。例如,肝脏病变的坏死可能在CT扫描报告中报告为“新”囊性病灶,但事实并非如此。
在随访研究中发现一个解剖位置的病灶在基线时未扫描,可以被认定是新病灶,并表明疾病进展。这方面的一个例子是患者在基线时患有内脏病变,需在研究中做脑部CT或MRI以揭示转移灶的情况。患者的脑转移被认为是PD的证据,即使他/她在基线时没有进行脑成像。
如果一个新病灶是模棱两可的,例如由于其体积小,持续的治疗和随访评估将说明它是否代表真正的新疾病。如果重复扫描确认肯定有新病灶,则应使用初始扫描的日期作为进展的日期。
虽然FDG-PET反应评估需要额外的研究,但有时在评估进展时(特别是可能的“新”病变),使用FDG-PET扫描来补充CT扫描是合理的。基于FDG-PET成像的新病灶可以根据以下算法识别:
-
a. 基线时FDG-PET阴性,随访时FDG-PET阳性是一个基于新病灶的PD信号。
-
b. 基线时无FDG-PET,随访时FDG-PET阳性:
- 如果随访时FDG-PET阳性对应于CT确认的新病变部位,则为PD。
- 如果随访时FDG-PET阳性未被CT确认为病变新部位,则需要进行额外的随访CT扫描,以确定该部位是否确实发生进展(如果是,PD的日期将是FDG-PET初始异常的扫描日期)。
- 如果随访时FDG-PET阳性对应于CT上预先存在的病变部位,而根据解剖影像没有进展,则不是PD。
4.4. 最佳总体疗效的评估 (Evaluation of best overall response)
考虑到任何确认要求,最佳总体疗效是从研究治疗开始到治疗结束记录的最佳疗效。有时,直到治疗结束后才记录疗效,因此在确定最佳总体疗效时应考虑治疗后的评估,方案应明确这一点。方案必须说明在进展前引入的任何新疗法将如何影响最佳疗效的判定。患者的最佳疗效的评估将依赖于靶病灶和非靶病灶的发现,也将考虑新病灶的出现。此外,根据研究的性质和方案要求,可能还需要确认测量值(见第4.6节)。具体而言,在以疾病缓解为主要终点的非随机试验中, PR或CR需要确认后才能认为是“最佳总体疗效”。下文将对此作进一步说明。
4.4.1. 时间点疗效 (Time point response)
假设在方案指定的每个时间点,都会进行一次疗效评估。下一页的表1总结了在基线时有可测量病灶的患者,在每个时间点的总体疗效 (overall response) 的状态计算。
Table 1当患者仅有不可测量病变时(因此非靶),应使用表2。
Table 24.4.2. 缺少评估与不可评估的说明
当在特定时间点完全没有影像/测量时,患者在该时间点是不可评估的(NE)。如果在评估中只测量了部分病灶,该病例在该时间点通常也被认为是NE,除非有令人信服的依据,即单个缺失病灶的贡献不会改变指定时间点的疗效。这最有可能发生在疾病进展的病例中,例如,如果一个患者三次测量的基线总和为50mm,在随访时仅评估了两个病灶,但这些评估的总和为80mm,无论缺失病灶的贡献如何,患者都将达到PD状态。
4.4.3. 最佳总体疗效:所有时间点 (Best overall response: all time points)
一旦获取患者的所有数据,就可以确定最佳总体疗效。
在不需要确认完全或部分缓解的试验中,最佳疗效的确定:
这些试验中的最佳疗效被定义为所有时间点中的最佳疗效(例如,病人第一次评估为疾病稳定(SD),第二次评估为部分缓解(PR),最后一次评估为疾病进展(PD),则最佳总体疗效为部分缓解(PR))。当疾病稳定(SD)被认为是最佳疗效时,它也必须满足方案规定的从基线开始的最小时限。如果不满足最小时限,疾病稳定(SD)就不会被认为是最佳疗效,患者的最佳疗效就取决于随后的评估。例如,病人第一次评估为疾病稳定(SD),第二次为疾病进展(PD),并且不满足疾病稳定(SD)的最小持续时间,则其最佳疗效为疾病进展(PD)。第一次评估为疾病稳定(SD)后未能随访的患者,将被认为是不可评估的。
在需要确认完全或部分缓解的试验中,最佳疗效的确定:
只有在方案规定的后续时间点满足对应标准(通常是4周后),才能确认完全缓解(CR)或部分缓解(PR)。在这种情况下,最佳总体疗效如表3中说明。
Table 3a 如果在第一个时间点确实达到了CR,那么在随后的时间点出现的任何病变,甚至是与基线相关的符合PR标准的病变,都将使该疾病在那个时间点出现PD(由于疾病必须在CR后再次出现)。最佳疗效取决于是否满足SD的最小持续时间。然而,当随后的扫描显示小病变可能仍然存在,并且实际上患者在第一个时间点是PR,而不是CR时,有时可能会声称“CR”。在这种情况下,应将原始CR更改为PR,最佳疗效是PR。
4.4.4. 疗效评估的特别说明
当淋巴结病变包括在靶病灶的(直径)总和中,并且淋巴结减小到“正常”大小(<10mm)时,其仍然可能在扫描报告中有测量结果。即使结点是正常的,这种测量也应该记录下来,避免夸大基于结点大小增加的疾病进展。如前所述,这意味着CR患者的病例报告表(CRF)上的直径总和可能不是“零”。
在需要确认缓解的试验中,重复的“NE”时间点评估可能会使最佳疗效的确认复杂化。试验分析计划必须解决,在确定缓解和进展时,如何处理缺失的数据/评估。例如,在大多数试验中,将具有时间点疗效PR-NE-PR的患者视为确认缓解是合理的。
如果患者健康状况总体恶化,需要停止治疗而当时没有疾病进展的客观证据,则应报告为“症状恶化”。即使在停止治疗后,也应尽一切努力记录客观的进展情况。症状恶化不是客观疗效的描述:只是停止研究治疗的一个原因。这类患者的客观疗效状态,将通过对靶病变和非靶病变的评估来确定,见表1-3。
定义“早期进展、早期死亡和不可评估”的条件是各研究所特有的,应该在方案中明确说明(取决于治疗持续时间,治疗周期)。
在某些情况下,区分残余病灶和正常组织可能会很困难。当评估完全缓解取决于这一决定时,建议在确认完全缓解状态之前对残留病灶进行检查(细针穿刺/活检)。在残余影像学异常被认为代表纤维化或瘢痕形成的情况下,FDG-PET可用于将疗效改善至CR,其方式类似于活检。在这种情况下,FDG-PET的使用应在方案中进行前瞻性描述,并应得到适应症对应的特定疾病医学文献的支持。然而,必须承认,由于FDG-PET和活检分辨率/敏感性的局限性,这两种方法都可能导致假阳性CR。
对于疾病进展不明确的发现(例如,非常小和不确定的新病灶;囊性病灶或已有病灶的坏死),治疗可持续到下一次的计划评估。如果在接下来的计划评估中,疾病进展得到确认,则疾病进展日期应以怀疑疾病进展的较早日期为准。
4.5 肿瘤重新评估的频率
治疗期间肿瘤重新评估的频率应具有方案特异性,并适应治疗类型和方案。然而,在治疗的有益效果尚不清楚的Ⅱ期研究中,每6-8周随访一次是合理的(时间安排在周期结束时)。在特定的治疗方案或情况下,比这些时间间隔更小或更大可能是合理的。该方案应指定在基线时评估哪些器官部位(通常是那些最有可能与所研究肿瘤类型的转移性疾病有关的器官部位)以及重复评估的频率。通常,所有靶和非靶部位在每次评估时间点都要进行评估。在某些情况下,对某些非靶器官的评估可能不那么频繁。例如,仅在靶病变确认完全缓解或怀疑骨骼疾病进展时,骨扫描才需要重复进行。
治疗结束后,是否需要重复评估肿瘤,取决于试验目标是缓解率还是事件发生的时间(进展/死亡)。如果“到某一事件的时间”(例如,疾病进展时间、无病生存期、无进展生存期)是研究的主要终点,则有必要对方案指定的疾病部位进行常规的计划性重新评估。特别是在随机比较试验中,计划的评估应按照时间表进行(例如:治疗后每6-8周或治疗后每3-4个月一次),并且不应受到治疗延迟、药物假期或任何其他可能导致治疗组疾病评估时间不平衡的事件影响。
4.6. 确认测量/缓解持续时间
4.6.1. 确认 (Confirmation)
在疾病缓解作为主要终点的非随机试验中,需要确认PR和CR,以确保疾病缓解不是测量误差的结果。这也将允许在历史数据的背景下对结果进行适当的解释,在这些试验中,按传统疾病缓解需要确认(见Bogaerts等人在本期特刊中的论文10)。然而,在所有其他情况下,即在随机试验(Ⅱ期或Ⅲ期)或以疾病稳定或疾病进展为主要终点的研究中,不需要确认缓解,因为它不会增加对试验结果的解释。然而,特别是在非盲法研究中,为防止偏倚,取消对疾病缓解的确认可能会增加中心审查的重要性。
在SD的情况下,必须在研究开始后,至少有一次测量符合研究方案中定义的最小时限的SD标准(通常不少于6-8周)。
4.6.2. 总缓解期 (Duration of overall response)
总缓解期是指,从首次满足CR/PR测量标准的时间(以首次记录者为准)到客观记录的疾病复发或疾病进展的第一个日期(以研究中记录的最小测量值作为疾病进展的参考)的持续时间。
完全缓解期是指,从首次满足CR测量标准的时间到客观记录疾病复发的第一个日期的持续时间。
4.6.3. 疾病稳定期 (Duration of stable disease)
疾病稳定期是指,从治疗开始(在随机化试验中,从随机化日期开始),到符合疾病进展标准的持续时间,疾病进展以研究中的直径和的最小值作为参照(如果基线总和最小,基线总和就是计算PD参考值)。
疾病稳定持续时间的临床相关性在不同的研究和疾病中有所不同。如果在特定试验中,在最短时间内达到疾病稳定的患者比例是重要的终点,则方案应指定两次测量之间确定疾病稳定所需的最小时间间隔。
注:缓解期、稳定期及与无进展生存期会受到基线评估后随访频率的影响。定义标准随访频率不在本指南的范围内。确定随访频率应考虑多个参数,包括疾病类型和阶段、治疗周期和标准操作。然而,如果要在试验之间进行比较,应考虑测量终点精度的这些限制。
4.7. 无进展生存期/无进展比率
4.7.1. Ⅱ期试验
本指南主要侧重于Ⅱ期试验中客观缓解终点的使用。在某些情况下,“缓解率”可能不是评估新药物/新方法潜在抗癌活性的最佳方法。在这种情况下,“无进展生存期”(PFS)或具有里程碑意义的时间点的“无进展比例”可能被认为是适当的替代方案,以提供新药物生物学效应的初始信号。然而,很明显,在非对照试验中,这些措施会受到批评,因为明显有希望的观察结果可能与患者选择等生物学因素有关,而不是干预的影响。因此,利用这些终点的Ⅱ期筛查试验最好采用随机对照设计。如果某些癌症的行为模式非常一致(并且通常一直很差),因此非随机试验是合理的,则可能存在例外情况(例如参见van Glabbeke等人20)。然而,在这些情况下,在没有治疗效果的情况下,必须仔细记录估计预期PFS或无比例进展的基础。
4.7.2. Ⅲ期试验
晚期癌症的Ⅲ期临床试验,越来越多地将评估无进展生存期 (PFS) 或至肿瘤进展时间 (TTP) 作为主要研究终点。如果试验方案要求所有患者都有可测量的病灶,疾病进展评估就相对简单。但是,限制患者入组会遭受批评:如果在研究的疾病中,大量患者被排除在外,那么可能会导致试验结果不太具有普遍性。此外,限制入组将减缓研究的受试者招募。所以,在越来越多的试验中,可测量病灶的患者与只有不可测量病灶的患者都被允许入组。在这种情况下,对于那些没有可测量病灶的患者,必须仔细明确地描述使其符合疾病进展的发现条件。此外,在这种情况下,方案必须说明可测量病变患者记录的靶病灶的最大数量是否可以从五个减少到三个 (基于Bogaerts等人10和Moskowitz等人11发现的数据)。正如在“疾病进展评估的特别说明”中描述的那样,这些指南为这种情况下的疾病进展评估提供了建议。此外,如果可行,经过验证的疾病进展的肿瘤标记物测量可能有助于整合到疾病进展的定义中(已被提议用于卵巢癌)。如果要根据研究结果做出重要的药物开发或药物批准决定,可能需要对影像学研究或影像学原始报告进行集中盲法审查,以验证“明确进展”。最后,如前所述,由于进展日期存在确定性偏倚,研究组的调查时间应相同。Dancey等人在本期特刊21上发表的文章对随机试验疾病进展的评估进行了更详细的讨论。
4.8.缓解和进展的独立审查
对于以客观缓解(CR + PR)为主要终点的试验,特别是关键药物开发决策基于对最少数量的应答者的观察,建议所有得出的疗效应由独立于研究的专家进行审查。如果该研究是随机试验,理想情况下,审查员应该对治疗分配不知情。最好的方法是同时审查患者档案和放射学影像。
对疾病进展的独立审查引出了一些更复杂的问题:例如,使用基于中心审查的疾病进展时间,代替基于调查人员的疾病进展时间,存在统计问题。因为当前者先于后者时,可能会引入信息审查。Ford等人在本期特刊的一篇文章中概述了这些因素以及从独立审查中获得的其他经验教训22。
4.9.报告最佳疗效结果
4.9.1. Ⅱ期临床试验
当疗效是主要终点,因此所有患者必须有可测量的病变才能进入试验时,即使存在重大的方案治疗违背或者不可评估,研究中包括的所有患者都必须在结果报告中予以考虑。 每位患者将被划分为以下类别之一:
- 完全缓解 (Complete response)
- 部分缓解 (Partial response)
- 疾病稳定 (Stable disease)
- 疾病进展 (Progression)
- 疗效不可评估 (Inevaluable for response):特定原因(例如:因肿瘤而早期死亡;因毒性早期死亡;肿瘤评估资料不能重复或不完全;其他(特定))
通常,所有符合条件的患者都应包括在分母中,以计算Ⅱ期试验的缓解率(在某些方案中,包括所有治疗的患者是合适的)。对于计算出的缓解率,通常最好给出95%的双侧置信限。试验结论应基于所有符合条件(或所有接受治疗的)患者的缓解率,而不应基于选定的“可评估的”子集。
4.9.2. Ⅲ期临床试验
Ⅲ期试验中的疗效评估可能是所评估治疗的相对抗肿瘤活性的指标,并且几乎总是次要终点。观察到的缓解率的差异,可能并不能预测研究人群的临床相关治疗效益。如果选择客观缓解作为Ⅲ期研究的主要终点(只有在肿瘤客观缓解和临床相关治疗效益之间有直接关系的情况下,才可以明确地为研究人群证明),应采用与Ⅱ期试验相同的标准,所有进入试验的患者都应该至少有一个可测量的病灶。
在许多情况下,缓解是次要终点,并非所有试验患者都有可测量的病变,报告总体最佳缓解率的方法必须在方案中预先指定。在实践中,可以使用“治疗意向”分析(分母中的所有随机患者)或仅包括基线时可测量病变患者的亚组分析来报告缓解率。方案应该清楚地规定如何报告疗效结果,包括计划的任何亚组分析。
RECIST的原始版本建议,在Ⅲ期试验中,人们可以使用对RECIST指南的“宽松”解释来编写方案(例如,减少测量的病灶数量),但不应再这样做,因为这些修订后的指南已经修订,明确了这些标准应如何应用于所有以肿瘤缓解或进展的解剖学评估为终点的试验。
附录Ⅰ RECIST 1.0到RECIST 1.1的主要变更摘要
利益冲突陈述书
没有宣布
致谢
(未翻译,参考原文)
附录Ⅱ 标准解剖放射成像规范
(未翻译,参考原文)
附录Ⅲ 常见问题
参考文献
感谢阅读, 欢迎关注:SAS茶谈!
若有疑问,欢迎评论交流!
网友评论