美国临床肿瘤学会第50届年会

生物统计学家:临床研究的幕后高手

作者:朱廷准    2014-06-01
字体大小:

【编者按】临床研究往往少不了统计学,其在肿瘤临床研究中的地位更是举足轻重。而在现实中,生物统计学家却是一个熟悉而又陌生的名字。熟悉是因为统计的“必要性”,陌生往往是因为统计的“高深莫测”。

本文作者Daniel Sargent教授和Qian Shi教授作为梅奥肿瘤研究中心的“掌门人”,将跟大家“揭露”生物统计学家在肿瘤临床试验中所扮演的角色。

日前,Chinese Clinical Oncology杂志邀请到来自梅奥统计部门的Daniel Sargent教授和Qian Shi教授组建“Statistics in Oncology Clinical Trials”统计学专栏,希望通过组织肿瘤临床试验领域颇有贡献的著名统计学家来撰写相关文献,提高人们对生物统计学家重要作用的认识,增强肿瘤学家和统计学家间的交流,刺激更多临床试验设计方面的创新研究,并且最终在不远的将来发现抗癌治疗中有革命性的发展。

引言

在过去的十年中,尽管西方国家肿瘤患者的死亡率都在以每年至少1%的速度下降,但是癌症仍然给全世界的人们和医疗工作者带来了巨大挑战。随着对分子通路改变、疾病预后和治疗效果的认识不断增加,癌症治疗进入了靶向治疗和个体化治疗的新纪元。然而在临床肿瘤研究中,与生物标记物的快速发现相比,靶向治疗药物的发展却屡屡受挫。

临床肿瘤学研究需要多学科专家的合作,这已经成为共识。在这些专家中,有一个人们比较陌生的群体:致力于癌症治疗与多学科协作的生物统计学家。本文将针对肿瘤研究领域中生物统计学家的重要作用做一个大概的介绍。

汇聚临床推理和统计推理

现代医疗中,临床一词通常跟病人的护理息息相关。临床试验包括一系列的实验研究,旨在寻找有效的治疗方法,比较各种治疗方案的利弊,和/或制定最理想的联合治疗,或是优化各种治疗方法的先后顺序。与实验室研究的最大区别在于,临床试验研究的对象是人。

病人在遗传学、行为学和环境方面的异质性为疾病的发展和研究性治疗的效果赋予了巨大的复杂性。尽管针对单个病人的医学观察可以促进医疗的进步,但所得的结果往往难以代表更大范围的患者群体。

这赋予了临床试验的第二个特征:好的临床试验设计和实施会使得所试治疗方法具有更大的人群适用性。要实现这一点,一方面需要很好地控制和描述人与人之间已知或未知的个体差异,另一方面需要通过严格的实验设计和操作使设备误差和偏倚最小化。

在“外行人”看来,统计学主要是由几率和数学运算组成,这并不准确。Piantadosi认为“统计推理强调以数据为基础”;统计学既涉及理论性科学,又涉及基于证据推理的实际性应用。这里的“证据”不仅包括确定的数据,也包括实际情况下提供的不确定信息,更重要的是在科学推理过程中知识的更新。

统计学理论和方法使我们能够对随机因素的影响进行定量分析,区分系统影响和随机影响,控制偏倚,并且将来自试验样本的推论适用于更广泛的人群,使研究更加高效。

肿瘤学家关注的是生物学指标,然而统计学家更加重视数学模式。实际上,将来源于试验数据的推论对于临床和统计学领域具有重要意义。结合临床试验的新老数据,更新抗击癌症的知识体系,调整和制定更加科学合理的治疗方案是肿瘤学家和统计学家的共同任务。统计学家会将肿瘤学家概念性的想法转化为科学、合理且实用的临床试验。

生物统计学家眼中的临床试验设计

上世纪40年代以来,临床试验成为临床研究的核心。但是直到70年代,统计学家才因受试对象的随机性和层次性而得到重视。后来,随着政府监管部门、基金委员会和全社会对临床研究设计和实施规范性的要求日益增加,使得试验人员必须采用更加严格的、科学的方法设计指导实施临床试验。

结果,统计学家的参与达到了前所未有的高度和深入度,从临床试验的提出到完成,甚至到后续的进一步研究中,都需要有统计学家的参与。对于统计学家的作用,误解之一是将其等同于数据分析。尽管数据分析非常关键,但是好的试验设计和指导更加重要。科学严谨的设计是最终结果分析的保障。好的设计可以使分析简化和高效,控制结果的精确性,使试验方案根据研究需要进行合理调整,避免伦理问题,并且保障患者的安全。

尽管计算样本量也要求丰富的统计经验,但是临床试验并不单纯是计算样本量那么简单,尤其是在医学研究的试验设计领域。临床试验的设计需要肿瘤学家和统计学家之间反复的交流和合作。这种沟通通常以对新提出的假设进行深入的剖析开始。统计学家收集的关键信息包括:目标疾病人群,预期治疗效果,最合理的终点,以往的证据和允许的错误概率。

例如,一个肿瘤学家可能提出一个假设:新药X可以改善KRAS基因突变的晚期大肠癌患者的预后。这里的研究对象是初诊为KRAS基因第12或13外显子突变的IV期大肠癌患者。预期治疗效果为药物X可延长患者的生存时间或提高规定时间点 (如诊断后3年) 的无病生存率。

以统计概念来说,一个常用的研究终点就是中位无进展生存(PFS)时间。统计学家将上述假设改述为:跟对照组相比,X药物延长KRAS突变的转移性大肠癌(mCRC)患者的无进展生存时间。这里的对照组为接受标准化常规方案治疗的患者。通过整合分析肿瘤学家提供的信息和文献数据,统计学家可以得出一个中位PFS时间(例如在本例中,已有相关临床研究报道为10个月)作为治疗的比较标准。统计学家再与肿瘤学家讨论,确定疗效评估值。比如,中位PFS时间从10个月延长到14.3个月(相当于危险比为0.75)可以作为这样一个评估值。这样,统计学家可以用统计学语言将此假设概述为:如果将用X药物治疗与接受标准化治疗的KRAS突变型mCRC患者的PFS相比较,危险比小于或等于0.75,那么就可以认为X药物是有效的。

有的人可能会不假思索地想,统计学家可以轻而易举地找到研究的样本量。实际上,肿瘤学家和统计学家之间在试验设计方面的交流和沟通至关重要,并且这种交流也应该延伸到其他领域专家之间。与病理学家和放射学家讨论交流有助确定一些需要严密推敲的实验细节包括受试群体和研究终点。

与政府管理部门和基金提供机构的讨论有助于增加研究的可行性、可靠性和科学性。而即将参与实验的医生和患者权益代表者的意见可使具体操作过程涉及到的伦理问题考虑得更全面。以上这些方面因素,将会使研究的设计更加规范,充分体现科学的科学性、实用性和有效性。

仍然以mCRC为例,我们还有另外一个方面没有讨论,就是X药物现在所处的研发阶段。该药物的研发是否处于人体安全剂量尚未知晓早期阶段?药物的安全性和初期的药效相关数据是否有提供,以便于研究的药物被批准使用和进一步被投入到患者的常规治疗中?这就涉及到临床试验的分期。

临床试验根据药物研发过程的主要目的,可分为I、II和III期。I期试验通常以药物的毒性评估为基础,旨在确定药物的最佳剂量水平和治疗方案。这种试验样本量通常较小(20-40个患者),以相关不良事件的出现情况为终点。I期试验的受试对象入选标准通常比II和III期要低一些。

通常以不同用药剂量的自身做为对照。II期试验以I期试验的疗效评价为依据,并对所选药物剂量和用药策略的安全性做进一步的评估。与I期试验不同,II期试验的受试对象更具有针对性(比如特定肿瘤类型的特定阶段)。对照组的终点评价为治疗效果的评估提供了基础(例如对照组终点测量的差异),前者可以基于文献报道或者研究所包含的同步随机对照队列。

这时样本量增加到50-100人以上。II期试验的结果决定了是否有必要进行大规模的III期临床试验。III期试验最为关键,其结果将决定新的治疗药物或方法是否可以真正应用于临床还是最终被摒弃废除。这些研究使用随机分布的方法来防止两组治疗方案分配可能产生的偏倚,包括由预后相关因素和已知/未知(可测量/不可测量)的混杂因素引起的治疗选择的偏倚。

在临床研究的各个阶段,统计学家在过去的几十年里做了各种各样的设计。这些创新源于临床治疗的需要。由于人们认识了生物剂量-反应效应,持续重新评价方法(CRM)成为一个很好的例子,它从简单的运算搜索到熟练的I期剂量搜索研究。多重问题和有效合并内外部数据刺激了适应性设计的发展。

研究靶向药物疗效的新要求催生出了生物标识驱动的设计。终点代替物的应用在减少试验费用的同时保证了有效的研究结论,进而促进了临床试验的发展。

相较于不涉及患者的基础研究,临床研究的设计和开展比实际上要复杂得多。伦理问题在研究的设计、监管和结果分析中至关重要。清晰明确的数据收集和质量控制过程是实现研究结论的合理性和可靠性的保障。我们希望加强统计学家和肿瘤学家之间的交流与合作,促进临床试验的创新和发展。

译者| 朱廷准,Chinese Journal of Cancer Research(CJCR)沙龙委员,沈阳军区总医院神经外科工作,主治医师,博士,博士后。近几年来一直从事脑部恶性肿瘤的基础研究工作,第一作者发表SCI论文4篇,主持中国博士后科学基金一项,获专利一项。

编辑: 又又    来源:科研时间