为进一步探索药物临床试验中不同特征患者的疗效和安全性差异,评估不同亚组可能的获益-风险,更好的支持对亚组分析结果的解释,我中心组织起草了《药物临床试验亚组分析指导原则(征求意见稿)》,现在中心网站予以公示,以广泛听取各界意见和建议,欢迎各界提出宝贵意见和建议,并请及时反馈给我们。
征求意见时限为自发布之日起1个月。
您的反馈意见请发到以下联系人的邮箱:
联系人:衡明莉、辛晓娜
联系方式:hengml@cde.org.cn,xinxn@cde.org.cn
感谢您的参与和大力支持。
2020年8月28日
附件 1 :《药物临床试验亚组分析指导原则(征求意见稿)》
附件 2 :《药物临床试验亚组分析指导原则(征求意见稿)》起草说明
原文链接:http://www.cde.org.cn/news.do?method=viewInfoCommon&id=9bc3c4eeab71cf7f
一、概述
参与临床试验的患者由于受各种因素(如遗传学、人口学、环境、病理生理学、合并症和合并用药等)的影响,往往具有不同程度的异质性,从而可能导致试验药物在不同患者中的疗效不同。临床试验中将具有不同特征的患者分组,是探索不同患者人群之间疗效差异的直观方法,同时也是获益-风险评估不可缺少的一部分。
对于事先未设定亚组分析的临床试验,在对结果进行解读和下结论时需要特别慎重。事后根据数据驱动寻找有统计学意义的亚组,会导致I类错误膨胀,其结果通常不能用于确证该亚组的有效性。此外,因亚组的样本量较少而导致检验效能不足,可能会影响试验药物在这些亚组人群中疗效的精确估计,或者无法得出各亚组间疗效是否一致的结论。
本指导原则中将目标适应症人群称为总体人群,将通过入排标准纳入临床试验的人群称为全人群。亚组人群(简称亚群)指总体人群中具有某些特征的一个子集,亚组是全人群中的一个子集。亚组分析是指对试验药物在亚组中的疗效和/或安全性进行试验设计与统计分析的过程,亚组是亚群的一个样本,将亚组结果推广到亚群时需要考虑亚组对亚群的代表性问题。
本指导原则主要阐述了亚组的识别和定义、亚组分析的类型、一般考虑以及确证性临床试验中的亚组分析等方面的内容,旨在为申办者能够在临床试验中对亚组分析进行正确地设计、实施和评价提供指导性建议。本指导原则主要适用于以支持药品注册上市为目的的确证性临床试验,也可供以非注册为目的的临床试验参考。
二、亚组的识别和定义
(一)亚组的识别
亚组的识别一般基于早期临床试验或确证性临床试验的探索性分析,可以使用定量的方法,如交互树和递归分割树等方法;也可以根据文献报道或者医疗实践积累的知识进行识别。
亚组识别主要关注不同亚组间疗效的差异及其临床意义,本质上属于探索性研究,一般无须控制I类错误。进行亚组识别时应考虑的因素包括但不限于以下几个方面:①临床上的可解释性;②临床上的可操作性;③药物的作用机理;④定义亚组的变量个数和类型(如连续变量、分类变量);⑤误分或漏分亚组两种情况带来的风险;⑥亚组识别模型的选择(不宜过于复杂,以避免过拟合)。
(二)亚组的定义
亚组通常由患者的一个或多个内在和/或外在因素(见 ICH E5)来定义,而且应具有一定的临床意义。这些变量通常是基线变量,包括人口学特征(如年龄、性别等)、实验室检查指标、基因组相关标志物、疾病的严重程度或分型、临床状况(如合并症、伴随用药)、地区(如国家、试验中心)和环境因素等。
实际应用中,亚组大多由一到两个变量来定义,例如把研究对象按照年龄分为18-65岁和>65岁两个年龄组;在抗肿瘤药物研究中,把患者按照ECOG分数和基因突变(或基因表达)水平,分成不同的亚组。需要注意的是,使用多于两个变量定义亚组比较少见,主要是因为:①定义亚组的变量过多,容易出现误分和漏分等情况;②使用多个变量定义亚组时,对亚组分析结果的解释往往出现困难。当亚组的定义确实需要涉及多个变量时,可以考虑将这些变量通过一定的方法转换成单一的风险分数,并以此来定义亚组。例如抗肿瘤药物试验中常用的ECOG评分反应了患者自我保健、日常活动和体能状况等综合能力。
三、亚组分析的类型
根据研究目的,亚组分析分为探索性亚组分析、支持性亚组分析和确证性亚组分析。对于探索性亚组分析,亚组既可以在设计阶段事先定义、也可以在分析阶段事后定义(如根据数据驱动划分的亚组分析)。对于支持性亚组分析,亚组一般应在临床试验的设计阶段事先定义,并在试验方案中详细描述。对于确证性亚组分析,亚组必须在临床试验的设计阶段事先定义,并在试验方案中详细描述。
(一)探索性亚组分析
探索性亚组分析主要用于早期临床试验或在确证性临床试验的探索性分析中,其目的是发现药物在不同亚组间疗效或安全性方面的差异,进而提出研究假设,以待在后续的临床试验中进一步探索和验证。因此,探索性亚组分析主要关注的是其结果在生物学上的合理性或临床上的可解释性,一般无须进行多重性调整。
(二)支持性亚组分析
在确证性临床试验中,除了对全人群的主要终点进行分析外,还需要对各亚组的疗效进行分析,目的是进一步考察试验药物在各个亚组中疗效的一致性。如果试验药物在各亚组间的疗效差异在可接受范围,可认为试验药物在亚组间的疗效一致,并为药物适用于全人群提供进一步支持性证据。如果各亚组间的疗效差异超出了可接受的范围,特别是方向相反时,则亚组分析结果的解释可能会出现困难,需要对其做进一步的分析和研究。
(三)确证性亚组分析
确证性临床试验中,按照预先规定的亚组和多重性调整方法,考察试验药物在目标亚组和/或全人群中的疗效,其结果应同时具有临床意义和统计学意义,以支持药物说明书的撰写。确证性临床试验也可以对目标亚组进行确证性亚组分析,而对其它(非目标)亚组进行支持性或探索性亚组分析,以支持试验药物在各亚组人群或全人群中的有效性和安全性的结论,或者为进一步的亚组研究提供线索。
四、一般考虑
(一) 生物学上的合理性及临床意义
1. 病理生理学和遗传学的差异
不同患者之间潜在的病理生理学或遗传学的差异可能导致药物治疗效果的不同。一些临床综合征可能有多个潜在的病理学机制,如原发性全身性癫痫有不同的分子病理学基础,因此使用药物治疗该病的效果往往因不同的发病机制而异。另外,对于一些基础疾病,由于其可预见的生物学反应的差异,也可能促进亚组分析的使用。例如在减少肾移植排斥反应方面,对于术前免疫致敏的患者在手术期间使用抗淋巴细胞抗体,可以使其获益更多。此外,很多药物的疗效及不良反应与患者的基因型密切相关,例如对于绝经后妇女补充雌激素,可以增加血浆中高密度脂蛋白胆固醇含量,其效果与雌激素受体基因序列的变异密切相关。
2. 最佳治疗时机和合并症
亚组分析所关注的主要问题之一是在医疗实践中如何使药物的疗效在不同的亚组或疾病的不同阶段达到最优化,例如确定疾病治疗的最佳阶段、在某一临床事件发生后的最优治疗时间以及治疗时机与合并症之间的关系等。药物的疗效通常取决于疾病的严重程度或进展阶段,在医疗实践中经常据此对患者进行分组,以确定药物的适应症和最佳时机。例如,急性心肌梗死的溶栓治疗对ST段抬高的患者非常有效,而对ST段压低的患者无效甚至有害;同时,溶栓治疗的合适时机是发病6小时以内,且3小时以内效果更好。另外,治疗效果也可能与合并症有关,例如血管紧张素转换酶抑制剂对合并非肾性高血压的心衰患者非常有益,但对合并肾血管疾病的患者却有害。
3. 有效性和安全性亚组分析的差异
亚组通常是根据试验药物对亚组人群的有效性来定义的,这样的分组对安全性分析可能不合适,因为:①药物的有效性和安全性一般使用不同的临床终点或者替代终点,其机理可能不同;②定义有效性亚组的变量(例如靶点受体)和安全性亚组的变量(例如年龄等因素)往往不同;③对可能导致潜在危害的药物,不同亚组患者的耐受程度可能不同(例如病情严重的患者为了治疗获益可能更容易耐受一定程度的副反应),此时亚组的获益-风险评估非常重要。
(二)异质性
亚组分析的主要目的是为了更好地了解试验药物在各亚组和全人群中的疗效,而是否需要和如何设计亚组分析关键在于临床试验中目标人群的异质性,这与研究方案中制定的患者入排标准有关。通常,入排标准的限制条件越严格,招募的患者异质性就越小,亚组间疗效的差异也就相对较小;反之,宽松的入排标准可能导致入组患者的异质性增加,亚组间的疗效差异也会增加,不易显示试验药物在全人群中的疗效,此时进行亚组分析就显得非常必要。
(三)可信度
亚组分析结果的可信度评估包括但不限于以下几个方面:①定义亚组的变量具有生物学上的合理性,即对患者的预后或治疗应答的预测有科学依据;②亚组分析结果的可重现性,即在相同或相似条件下的其他临床研究中,具有相同或相似的亚组效应;③先验知识的可靠性,即源于外部数据和文献报告的亚组分析结果具有一定的科学依据。
在研究设计阶段,有时基于先验知识指定用于分层随机化和亚组分析的变量。这种预先指定亚组变量的方法,通常用在确证性和支持性亚组分析中,蕴含了亚组之间疗效有差异的推测,因此得到的亚组分析结果具有一定的可信度。然而,即使亚组变量不是被预先指定,也要予以重视,尤其是对在安全性亚组分析中发现的亚组之间的差异,要特别关注其生物学上的合理性和结果的可重现性。
当亚组的样本量不足、无法准确估计药物在亚组中的疗效时,应主要考察其生物学上的合理性和结果的可重现性。当亚组疗效在试验条件(如研究设计、目标人群、亚组定义、治疗方案、结局测量等)相似的一系列临床试验中一致时,即使没有明确的临床和生物学方面的解释,亚组结果也具有一定的可信度。另外,虽然随机化可以使不同治疗组间入组患者的基线变量分布趋于平衡,但由于亚组内样本量的减少,可能会存在基线不均衡,因此必须检查药物在各亚组间疗效差异是否是由于基线分布不均衡所致。
(四)主要终点指标与亚组分析
当临床试验的主要终点为复合终点时,有些情况下药物的疗效可能只反映在构成复合终点的某一或某些组成终点上,而其余的组成终点则受到试验药物以外其他因素的影响,此时,不宜用复合终点进行亚组分析。例如,在一项治疗中轻度高血压的试验中,以全因死亡率作为主要终点,但对亚组进行分析时发现,试验药物降低了男性的全因死亡率,但却增加了女性的全因死亡率,原因是女性非心血管因素导致的死亡过多,此时对性别的亚组分析采用全因死亡率这一复核终点可能并不合适,而使用心血管因素的死亡专率较为恰当。
当使用多个主要终点指标时,整体治疗效果通常是对其综合分析的结果,如果这些指标具有不同的风险因素,需要考虑这些因素在各亚组的分布,并阐述如何进行亚组分析及其结果的临床意义。
五、确证性亚组分析
确证性亚组分析是在确证性临床试验中对事先指定的目标亚组进行假设检验的分析,目标亚组可以作为主要或共同主要分析人群。亚组分析的结果提示不同亚组人群可能的获益与风险,因此直接影响决策和产品使用说明书的撰写。确证性亚组分析的临床试验需要考虑的关键问题包括但不限于以下几个方面:①亚组的选择;②试验设计类型(如固定样本设计、适应性设计或者适应性富集设计);③多重性;④亚组分析结果的解释。需要注意的是,把亚组作为主要或共同主要分析人群的试验设计应考虑亚组的样本量以及是否使用分层随机等关键问题。
(一)亚组的选择
确证性亚组分析应在方案中预先规定目标亚组。关于亚组的选择,如果是基于医疗知识或实践,例如按照疾病严重程度、人口学特征(性别、年龄等)或已知的能够精确分辨亚组的生物标志物(如基因突变)进行分类,通常具有一定的临床意义。另一方面,亚组的定义是否合理取决于亚组分类器(如标志物)是否能够可靠地识别最有可能从药物中获益的亚组人群。分类器的确定通常基于早期临床研究数据,由于样本量往往不足,因此分类器的性能有限,在研究设计时要考虑到这一问题。
(二)试验设计
在进行确证性亚组分析的样本量估计时,除了常用的试验设计参数如期望治疗效应大小及其变异度、I类和Ⅱ类错误概率之外,还必须考虑亚组分类器分辨亚组的准确度,以及亚组人群在符合入组条件的目标人群中所占的比例。
如果有可靠的证据表明试验药物在不同亚组中的疗效不同,且其具有生物学上的合理性和重要的临床意义,可以采用固定样本量设计,以验证药物的疗效。此时,临床试验的目标人群可以是亚组人群和/或总体人群,其至少有三种设计方案(以标记物举例):
①如果只有标志物阳性的患者才能从试验药物中获益,入组患者可以仅限于这个亚组。
②如果标志物阳性和阴性的患者都能从试验药物中获益,但阳性患者获益高于阴性患者,而试验的主要目的是验证药物在阳性患者中的疗效,则样本量和药物疗效的估计可以主要针对标志物阳性的亚组,但建议标志物阴性的亚组也纳入试验,以便更好地了解试验药物在该人群中的疗效,用于获益-风险评估或后续研究设计。
③如果标志物阳性和阴性的患者都能从试验药物中获益,但不能确定哪个亚组人群的获益更大,而试验的主要目的是验证药物在总体人群中的疗效,则患者可以在总体人群中招募,也可以在两个亚组人群中进行分层随机。如果是后者,则需要注意各亚组样本量的比例应与目标人群中各亚组人群患者的比例相似,以避免由于过多纳入疗效较好的亚组人群而夸大了药物在总体人群中的疗效。
如果没有充分的证据表明不同亚群间的疗效差异具有临床意义时,可以采用适应性设计的方法进行亚组的选择。例如,当不清楚试验药物在标志物阳性和阴性患者中的疗效时,可以考虑两阶段适应性设计(即适应性亚组选择和富集)。第一阶段试验的数据可用于估计药物在亚组中的疗效,然后据此调整第二阶段的入组人群及其样本量。对于适应性设计中的亚组的选择,应重点考虑试验设计和统计分析方法的有效性(如是否控制了I类错误)。
(三)多重性
多重性是确证性亚组分析中需要重点关注的问题之一。对于将亚组作为共同主要分析的临床试验,由于要对全人群和亚组的疗效进行多次检验,因此如果不进行多重性调整,会增加总I类错误。为了将总I类错误控制在预设的水平,有多种多重性调整方法,如Bonferroni单步检验法、逐步多重检验法和回退法等,多重性调整的方法应在方案和统计分析计划中事先指定。
不同的多重性调整方法各有其优缺点。如果一个亚组和全人群作为共同主要分析人群,则可以用Bonferroni法将α分配给这两个主要分析人群,即以水平检验亚组,以水平检验全人群,并且。这里也可以使用回退法。
另外,在没有足够的证据表明药物在全人群和亚组的疗效差异时,可以考虑使用逐步多重检验法(如Hochberg、Hommel和Simes法),即对多个假设按照一定的顺序进行检验。如果有足够的证据表明亚组的疗效优于全人群的疗效时,可以考虑使用固定顺序检验策略,即先检验亚组疗效,如果有统计学意义,再检验全人群的疗效,否则停止检验。
值得注意的是,由于亚组属于全人群的一部分,使用统计量的联合分布来确定检验界值,可以提高检验效能,但由于数据有限,估计统计量的相关系数往往不可靠,并可能增加I类错误。因此,使用基于统计量的联合分布来确定检验界值的多重性调整方法需要特别谨慎。
(四)结果的解释
亚组分析结果的解释必须具有临床意义,以支持药物的上市和说明书的撰写。例如,在一项临床试验中预先以某一目标亚组和全人群共同作为主要的分析人群,经过多重性调整后的统计分析可以得出下述三个结论之一:①与对照组相比,试验药物在全人群中的疗效差异有统计学意义而目标亚组的疗效差异无统计学意义;②目标亚组的疗效有统计学意义而全人群的疗效无统计学意义;③全人群和目标亚组的疗效都有统计学意义。需要注意的是,如果结论③是由于药物在目标亚组中的疗效较大所致,而其余亚组很少甚至不获益,此时,将其使用限定于该目标亚组可能更加合适。
六、支持性亚组分析
一般情况下,确证性临床试验的目的是验证药物在全人群中的有效性以及各主要亚组之间疗效的一致性,后者通过支持性亚组分析来实现。常用的支持性亚组分析方法包括:①描述性分析(如疗效的点估计)和区间估计;②图形显示(如森林图);③模型法(如在主要分析模型中加入药物与定义目标亚组变量之间的交互作用)。使用何种方法应在方案及统计分析计划书中充分考虑和说明。
需要指出的是,当各亚组的样本量较少或亚组间样本量分布不均衡时,药物与亚组变量交互作用的检验效能往往不足。为此,可以考虑选取宽松的检验水准(例如α=0.10)进行检验,同时要考虑各亚组间疗效差异的临床意义。如果交互作用显著,则提示试验药物在各亚组间的疗效可能不同。
在确证性临床试验中,如果试验药物的疗效在全人群中有统计学意义,通常需要报告亚组分析的结果,包括各亚组疗效的点估计及其置信区间。需要注意的是,如果对全人群疗效和各亚组的疗效同时进行分析,则各亚组疗效与全人群疗效的方向应该一致,否则需要进一步分析其不一致的原因。
如果各亚组间的疗效差异具有临床意义,应考虑按照以下几个步骤探索其可能的原因:
①定义亚组的变量是否与相应的预后或预测因素有关。这些因素通常从早期临床试验、文献报告或医疗实践中获知,可以是内在因素(如遇药物代谢酶相关的基因多态性等遗传因素)、外在因素(如疾病严重程度、吸烟状况和BMI等)或治疗方法(如不同剂量的合并用药)等。
②如果定义亚组的变量与相应的预后或预测因素有关,则应进行进一步分析。如首先分析预后因素是否具有预测作用,如果有预测作用说明该因素会影响患者对药物的应答或疗效;然后,分析预后因素在各亚组的试验组和对照组中的分布是否均衡,如果不均衡则其可能是亚组间疗效差异的原因。
③如果通过上述分析,亚组间疗效的差异仍无法解释,则需考虑进一步的探索性分析以识别造成此差异的其他可能因素,对试验结果给出合理的解释。
七、其他考虑
(一)非劣效试验中的亚组分析
亚组分析在只有阳性对照的双臂非劣效临床试验中要十分谨慎。当在各亚组间对试验药疗效进行非劣效评价时,其结果依赖于阳性对照药相对于安慰剂的疗效在各亚组中的一致性。若阳性对照药相对于安慰剂的效应与亚组变量有关时,则非劣效界值的选择应考虑这些特征变量在研究人群中的分布。由于非劣效界值的确定通常使用历史数据,因此,如果亚组变量在试验人群中的分布与历史数据不同,则会影响非劣效检验结论的正确性。要强调的是,非劣效界值的确定应当基于阳性对照药疗效(相对于安慰剂)的尽可能多的历史数据的meta分析结果,而不是基于主观选择部分试验数据或者部分亚组人群数据的分析结果。
(二)安全性亚组分析
安全性亚组分析主要用于研究与药物安全性相关的风险因素,即探究具有一定特征的亚组人群可能对药物产生的不良反应。
获益-风险评估是亚组安全性分析不可或缺的一部分。安全性亚组分析与有效性亚组分析略有不同。安全性亚组分析虽然可以由预后因素(如年龄、是否有并发症等)或预测因素(如疾病分期、基因分型等)定义亚组,但前者更为常见。
亚组人群的安全性分析具有一定的挑战,特别是对低发生率或者潜伏期较长的安全性事件,由于样本量较小或随访时间较短,较难在试验期间发现和验证。如果现有数据表明试验药物在特定亚组人群中与某一严重不良事件(SAE)有潜在的关联,则可以考虑有针对性地设计一个大型的具有足够检验效能的临床试验,验证试验药物在该亚组人群中是否会引起严重的不良反应。
(三)与监管机构的沟通
当临床试验设计包含确证性亚组分析时,鼓励申请人就临床试验设计中的关键问题与监管机构进行沟通。沟通的内容包括但不限于试验设计的类型、亚组的选择、I类错误控制、一致性和可信性等方面的评价策略。
八、参考文献
[1] ICH. ICH E5: Ethnic Factors in the Acceptability of foreign Clinical Data E5 (R1). ICH Harmonised Tripartite ( https://database.ich.org/sites/default/files/E5_R1 Guideline.pdf ), 1998.
[2] EMA. Guideline on the investigation of subgroups in confirmatory clinical trials. European Medicines Agency (EMA) ( https://www.ema.europa.eu/en/documents/scientific-guideline/guideline-investigation-subgroups-///confirm/i/i/iatory-clinical-trials_en.pdf ), 2019.
[3] Julien Tanniou, Ingeborg Van Der Tweel, Steven Teerenstra, and Kit CB Roes. Subgroup analyses in confirmatory clinical trials: time to be specific about their purposes. BMC Medical Research Methodology, 16(1):20, 2016.
[4] Mohamed Alosh, Mohammad F Huque, Frank Bretz, and Ralph B D’Agostino Sr. Tutorial on statistical considerations on subgroup analysis in confirmatory clinical trials. Statistics in medicine, 36(8):1334-1360, 2017.
[5] Ilya Lipkovich, Alex Dmitrienko, and Ralph D’Agostino Sr. Tutorial in biostatistics: data-driven subgroup identification and analysis in clinical trials. Statistics in medicine, 36(1):136-196, 2017.
[6] James F Burke, Jeremy B Sussman, David M Kent, and Rodney A Hayward. Three simple rules to ensure reasonably credible subgroup analyses. BMJ, 351:h5651, 2015.
[7] Wei-Yin Loh Loh, Luxi Cao, and Peigen Zhou. Subgroup identification for precision medicine: a comparative review of thirteen methods. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 9(5):e1326, 2019.
[8] Peter M Rothwell. Subgroup analysis in randomised controlled trials: importance, indications, and interpretation. The Lancet, 365(9454):176-186, 2005.
[9] Alex Dmitrienko, Christoph Muysers, Arno Fritsch, and Ilya Lipkovich. General guidance on exploratory and confirmatory subgroup analysis in late-stage clinical trials. Journal of Biopharmaceutical Statistics, 26(1):71-98, 2016.
[10] Alex Dmitrienko and Ralph D’Agostino Sr. Traditional multiplicity adjustment methods in clinical trials. Statistics in Medicine, 32(29):5172-5218, 2013.
[11] Yan D Zhao, Alex Dmitrienko, and Roy Tamura. Design and analysis considerations in clinical trials with a sensitive subpopulation. Statistics in Biopharmaceutical Research, 2(1):72-83, 2010.
[12] Lynda Anne Szczech, Jesse A Berlin, and Harold I Feldman. The effect of antilymphocyte induction therapy on renal allograft survival: a meta-analysis of individual patient-level data. Annals of Internal Medicine, 128(10):817-826, 1998.
[13] David M Herrington, Timothy D Howard, Gregory A Hawkins, David M Reboussin, Jianfeng Xu, Siqun L Zheng, K Bridget Brosnihan, Deborah A Meyers, and Eugene R Bleecker. Estrogen-receptor polymorphisms and effects of estrogen replacement on high-density lipoprotein cholesterol in women with coronary disease. New England Journal of Medicine, 346(13):967-974, 2002.
[14] Fibrinolytic Therapy Trialists. Indications for fibrinolytic therapy in suspected acute myocardial infarc-tion: collaborative overview of early mortality and major morbidity results from all randomised trials of more than 1000 patients. The Lancet, 343(8893):311-322, 1994.
[15] Morris J Brown. Matching the right drug to the right patient in essential hypertension. Heart, 86(1): 113-120, 2001.
[16] Heart Protection Study Collaborative Group . MRC/BHF Heart Protection Study of cholesterol-lowering with simvastatin in 5963 people with diabetes: a randomised placebo-controlled trial. The Lancet, 361 (9374):2005-2016, 2003.
[17] PROGRESS Collaborative Group . Randomised trial of a perindopril-based blood-pressure-lowering regimen among 6105 individuals with previous stroke or transient ischaemic attack. The Lancet, 358 (9287):1033-1041, 2001.
[18] Janet Woodcock and Lisa M LaVange. Master protocols to study multiple therapies, multiple diseases, or both. New England Journal of Medicine, 377(1):62-70, 2017.
[19] Nigel Stallard, Susan Todd, Deepak Parashar, Peter K Kimani, and Lindsay A Renfro. On the need to adjust for multiplicity in confirmatory clinical trials with master protocols. Annals of Oncology, 30(4): 506-509, 2019.
[20] Lu Cui, HM James Hung, Sue Jane Wang, and Yi Tsong. Issues related to subgroup analysis in clinicaltrials. Journal of biopharmaceutical statistics, 12(3):347-358, 2002.
[21] Dennis J Slamon, Brian Leyland-Jones, Steven Shak, Hank Fuchs, Virginia Paton, Alex Bajamonde, Thomas Fleming, Wolfgang Eiermann, Janet Wolter, and Mark Pegram. Use of chemotherapy plus a monoclonal antibody against her2 for metastatic breast cancer that overexpresses her2. New England Journal of Medicine, 344(11):783-792, 2001.
[22] Edward H Romond, Edith A Perez, John Bryant, Vera J Suman, Charles E Geyer Jr, Nancy E Davidson, Elizabeth Tan-Chiu, Silvana Martino, Soonmyung Paik, and Peter A Kaufman. Trastuzumab plus adjuvant chemotherapy for operable her2-positive breast cancer. New England Journal of Medicine, 353 (16):1673-1684, 2005.
[23] Conor A Bradley. Pembrolizumab improves os across pd-l1 subgroups. Nature Reviews Clinical Oncology, 16(7):403, 2019.
[24] Richard M Ransohoff. Natalizumab for multiple sclerosis. New England Journal of Medicine, 356(25): 2622-2629, 2007.
[25] Jie Chen, Joseph Heyse, and Tze Leung Lai. Medical Product Safety evaluation: Biological Models and Statistical Methods. Chapman & Hall/CRC Press, 2018.
[26] Robert Hemmings. An overview of statistical and regulatory issues in the planning, analysis, and inter-pretation of subgroup analyses in confirmatory clinical trials. Journal of Biopharmaceutical Statistics, 24(1):4-18, 2014.
[27] Van Cutsem, E., M. Peeters, S. Siena, Y. Humblet, A. Hendlisz, B. Neyns, J.-L. Canon, J.-L. Van Laethem, J. Maurel, and G. Richardson (2007). Open-label phase iii trial of panitumumab plus best supportive care compared with best supportive care alone in patients with chemotherapy-refractory metastatic colorectal cancer. Journal of Clinical oncology 25(13), 1658-1664, 2007.
[28] Prenen, H., S. Tejpar, and E. Van Cutsem (2010). New strategies for treatment of kras mutant metastatic colorectal cancer. Clinical Cancer Research,16(11): 2921-2926, 2010.
[29] Amado, R. G., M. Wolf, M. Peeters, E. Van Cutsem, S. Siena, D. J. Freeman, T. Juan, R. Sikorski, S. Suggs, and R. Radinsky (2008). Wild-type kras is required for panitumumab efficacy in patients with metastatic colorectal cancer. Journal of Clinical Oncology, 26(10): 1626-1634, 2008.
[30] Cappuzzo, F., T. Ciuleanu, L. Stelmakh, S. Cicenas, A. Szcz´ esna, E. Juhász, E. Esteban, O. Molinier, W. Brugger, and I. Melez´?nek (2010). Erlotinib as maintenance treatment in advanced non-small-cell lung cancer: a multicentre, randomised, placebo-controlled phase 3 study. The lancet oncology, 11(6): 521-529, 2010.
重现性(Reproducibility):临床试验的结果可在类似的研究条件下重现的能力。
分类器(Classifier):使用患者的一组特征(如基因表达)和分类标签(如药物应答或耐药)数据,拟合一个分类函数或模型,通过相应的特征对患者进行分类或定义亚组,并可对无标签的患者进行预测。
风险分数(Risk Score):将多个患者基线特征变量通过一定的方法转换成能够预测患者结局的单一变量,后者通常称为风险分数。
I类错误(Type I Error):当原假设为真而检验结果拒绝了原假设的错误,其概率通常用a表示,并用其作为检验水准。
内在因素(Intrinsic Factors):指患者个体的遗传、生理和病理特征,是一个人“内在”的生物特征,而不是由个人所在的环境决定。
确证性亚组分析(Confirmatory Subgroup Analysis):按照预先制定的计划,以特定的亚组为研究的主要目标人群,能够对I类错误进行控制的亚组分析,以确证目标亚群患者的疗效。
生物学合理性(Biological Plausibility):生物学特征与研究终点(如主要终点、不良事件等)之间因果关联推理的合理性。
适应性设计 (Adaptive Design):按照预先制定的计划,在期中分析时根据试验期间累积的数据对试验做出相应修改的临床试验设计,这种修改又称为适应性修改。适应性修改计划必须在临床试验开始前的试验方案和统计分析计划中预先设定。
适应性富集设计(Adaptive Enrichment Design):按照预先制定的计划,根据临床试验数据的期中分析结果,在保证试验合理性和完整性的前提下,允许在试验过程中适应性地更新入排标准,选择最有可能从治疗中获益的患者入组的自适应设计。
探索性亚组分析(Exploratory Subgroup Analysis):通过亚组分析探索药物对不同亚组患者可能存在的疗效或者安全性上的差异,此类分析通常不对I类错误进行控制,主要关注的是其结果在生物学或者临床上的合理性。
一致性(Consistency):在亚组分析中,不同亚组间显示出相同或相似的治疗效果。
异质性(Heterogeneity):在临床试验中,异质性体现在个体和群体两个水平,前者通常是指患者间具有不同的特征,个体性质或状态的不同可能会导致不同的患者对治疗有不同的应答;后者通常是指不同中心、种族、地域等患者群体具有不同的特征,有可能导致不同患者群体对治疗有不同的应答。
外在因素(Extrinsic Factors):指与患者居住地的环境和文化相关的因素。外在因素往往与遗传和基因无关,更多是由文化和行为决定。
亚组分析(Subgroup Analysis):将患者根据其特征变量值分成不同的亚组、并估计各亚组的疗效和/或安全性的分析策略。
支持性亚组分析(Supportivie Subgroup Analysis):通过亚组分析探讨药物的疗效和/或安全性在各亚组中的一致性,为试验全人群的研究结论提供进一步的支持。
中文 |
英文 |
安全性亚组分析 |
Safety Subgroup Analysis |
变异度 |
Variability |
病理生理学 |
Pathophysiology |
Bonferroni单步检验法 |
Bonferroni Single-step Procedure |
重现性 |
Reproducibility |
递归分割树方法 |
Recursive Partitioning Tree Method |
多重性 |
Multiplicity |
多重性调整 |
Multiplicity Adjustment |
非劣效界值 |
Noninferiority Margin |
分层随机化 |
Stratified Randomization |
固定样本量设计 |
Fixed Sample Design |
回退法 |
Fallback Procedure |
获益-风险评估 |
Benefit-risk evaluation |
I类错误 |
Type I Error |
交互树方法 |
Interaction Tree Method |
可信度 |
Credibility |
联合分布 |
Joint Distribution |
描述性分析 |
Descriptive Analysis |
内在因素 |
Intrinsic Factors |
确证性亚组分析 |
Confirmatory Subgroup Analysis |
生物标志物 |
Biomarkers |
生物学合理性 |
Biological Plausibility |
适应性设计 |
Adaptive Design |
适应性富集设计 |
Adaptive Enrichment Design |
探索性亚组分析 |
Exploratory Subgroup Analysis |
外在因素 |
Extrinsic Factors |
原假设 |
Null Hypothesis |
异质性 |
Heterogeneity |
支持性亚组分析 |
Supportive Subgroup Analysis |
逐步多重检验法 |
Stepwise Multiple Testing Procedure |
主要终点 |
Primary Endpoint |
准确度 |
Accuracy |
总I类错误 |
Familywise Error Rate (FWER) |
示例1:帕博利珠单抗免疫治疗小细胞肺癌的亚组分析
在一项PD-1免疫制剂帕博利珠单抗(Pembrolizumab)Ⅲ期临床试验中,共纳入1274名既往未经治疗的局部晚期或转移性非小细胞肺癌患者(EGFR和ALK基因均无突变),患者PD-L1表达水平TPS≥1%。将其按照1:1的比例随机分配至两组,分别接受帕博利珠单抗或铂类化疗,主要终点是预先定义的三个亚群(依次为TPS≥50%,20%≤TPS<50%和1%≤TPS<20%)的总生存率(OS)。分析结果显示,在中位随访期为12.8个月期间内,三个亚组中接受帕博利珠单抗治疗的OS均明显长于接受铂类化疗的患者(第一组: HR=0.69,95%CI=0.56-0.85,P=0.0003;第二组:HR=0.77,95%CI 0.64-0.92,P=0.0020;第三组:HR=0.81,95%CI=0.71-0.93,P=0.0018)。试验组和对照组的中位OS在三个亚组中分别为20.0 vs 12.2(月)、17.7 vs 13.0(月)和16.7 vs 12.1(月)。据此,FDA将帕博利珠单抗的适应症扩展到PD-L1表达水平TPS低至1%的非小细胞肺癌患者。
示例2:那他珠单抗治疗复发-缓解型多发性硬化症的获益-风险评估
那他珠单抗(Tysabri)是第一个由FDA批准用于治疗多发性硬化症(MS)的单克隆抗体。2004年批准后不久该药就被迫退市,其原因是两名患者在服用了该药物后发生了进行性多灶性白质脑病(PML),这是一种罕见的不可治愈且易于致命的脑部感染疾病(18个月的随访期内,约有1/1000的患者并发感染PML)。一年后,FDA咨询委员会开会,重新对患者使用该药的获益与风险进行了评估,认为与现有的其他治疗方法相比,该药更有效,患者完全可以接受用药带来的风险。于是,FDA于2006年宣布重新上市Tysabri,但只限复发-缓解型多发性硬化症(RRMS)亚型患者在其他治疗失败或不耐受时使用。这一限制主要是出于安全性考虑,即对活动性不高的非RRMS亚型患者可能受益有限但却面临发生PML的风险。
《药物临床试验亚组分析指导原则(征求意见稿)》起草说明
为进一步探索药物临床试验中不同特征患者间的疗效和安全性差异,评估不同亚组可能的获益-风险,提供亚组分析中试验设计和统计分析过程中的指导性建议,更好的支持对亚组分析结果的解释,药品审评中心组织起草了《药物临床试验亚组分析指导原则(征求意见稿)》。现将有关情况说明如下:
一、背景和目的
参与临床试验研究的患者由于受到各种因素的影响,往往具有不同程度的异质性,可能导致试验药物在不同患者中的疗效不同。亚组通常是指参与临床试验的人群的一个子集。在确证性临床试验中,科学的定义和识别亚组,验证试验药物在全人群中的有效性以及各主要亚组间疗效的一致性,将直接影响研究决策和药物使用说明书的撰写。
本指导原则侧重于确证性临床试验中的确证性和支持性亚组分析策略和方法,目的是通过对含有亚组分析的确证性临床试验的严谨设计和分析,以评价亚组人群的获益和风险,为决策提供依据。
二、起草过程
本指导原则的起草小组基于药审中心与南方医科大学战略合作建立的三方学术协调委员会,由学术界、制药工业界和监管机构代表共同组成,保证了本指导原则高效、高质量完成。
本指导原则自2020年1月正式启动,分别于2020年5-7月召开了三次线上专家研讨会,对指导原则初稿进行了充分的讨论和交流,并经药审中心内部征求意见与审核,历时7个月最终形成征求意见稿。起草过程中参考了国际其他监管机构如欧盟EMA等制定的相关指南。
参与制订本指导原则的专家名单见附录,在此一并致谢。
三、主要内容与说明
本指导原则从亚组的定义和识别、亚组分析的类型、适用范围、一般考虑等方面阐述亚组分析需要考虑的关键问题。对在确证性临床试验中如何科学的进行亚组的选择、分析和结果解释给出了指导性的建议。全文主要包括概述、亚组的识别和定义、亚组分析的类型、一般考虑、确证性亚组分析、支持性亚组分析、其他考虑以及附录等内容。
(一)概述
阐述了本指导原则的起草背景、目的和适用范围。
(二)亚组的识别和定义
主要阐述了亚组的识别应基于不同亚组间的疗效差异,一般源于早期研究或确证性临床试验的探索性分析。“亚组”通常由患者的一个或多个变量来进行定义,且应具有一定的临床意义。定义亚组的变量通常为基线变量,包括人口学特征(如年龄、性别)、实验室检查指标、基因组相关标志物、疾病的严重程度或分型、临床状况(如合并症、伴随用药)、地区(如国家、试验中心)和环境因素等。
(三)亚组分析的类型
根据不同的研究目的,可以分为探索性亚组分析、支持性亚组分析和确证性亚组分析三个类型。详细阐述了不同类型的亚组定义顺序、统计分析(包括是否需要进行多重性调整)和结果的解释。
(四)一般考虑
详细阐述了进行亚组分析时需要考虑的关键问题,包括生物学上的合理性及临床意义、目标人群的异质性程度、亚组分析结果的可信度、主要终点指标与亚组分析等方面。
(五)确证性亚组分析
阐述了在确证性临床试验中对事先指定的目标亚组进行假设检验的确证性亚组分析需要考虑的关键问题,主要包括亚组的选择、试验设计类型、多重性调整和亚组分析结果的解释等。
(六)支持性亚组分析
介绍了常用的支持性亚组分析方法,并阐述了在各亚组间的疗效差异具有临床意义时,考虑探索其可能原因的步骤。
(七)其他考虑
亚组分析中还有一些其他需要考虑的问题:包括非劣效试验设计中的亚组分析、安全性亚组分析以及在进行确证的亚组分析时,申办方应该就临床试验设计中的关键问题和监管机构进行沟通。
(八)附录
附录部分提供了参考文献、词汇表、中英文词汇对照、亚组分析的研究案例。
参与制订《药物临床试验亚组分析指导原则(征求意见稿)》的专家名单
外部专家:殷悦
三方学术协调委员会:陈平雁、王骏、狄佳宁
(其余按姓氏笔划顺序):王北琪、王秋珍、王勇、尹平、孙凤宇、田正隆、闫波、李康、何崑、陈刚、陈杰、陈峰、辛晓娜、欧春泉、赵耐青、贺佳、郭翔、谭铭、衡明莉秘书:吴莹、段重阳