try ai
科普
编辑
分享
反馈
  • I 期临床试验

I 期临床试验

SciencePedia玻尔百科
核心要点
  • I 期试验的主要目标是确定新药的安全性特征并确定安全的剂量范围,而非证明其有效性。
  • 首次人体试验剂量是根据临床前动物数据、通过异速生长定标法换算为人体等效剂量 (HED) 并应用显著的安全系数来保守确定的。
  • 剂量爬坡以队列形式进行,以找到最大耐受剂量 (MTD),MTD 定义为导致预先设定的、可接受的剂量限制性毒性 (DLT) 发生率的剂量。
  • 伦理行为是为参与者所承担的风险提供正当性辩护的基础,其核心是严谨的知情同意过程,该过程需明确试验的实验性质和直接获益可能性低的特点。

引言

一种新药从实验室走向药房的旅程漫长而充满不确定性。此过程中最关键、最微妙的一步便是 I 期临床试验,即研究性药物首次用于人体。这一初始阶段旨在解决一个根本性挑战:我们如何在恪守最高安全与伦理标准的同时,在人体中测试一种未经证实的新化合物?本文将作为一份全面的指南,引领读者探索这一关键阶段。第一章“原则与机制”将剖析 I 期试验的核心信条,从至关重要的安全性,到用于确定首次剂量并逐步递增以寻找最大耐受水平的科学方法。随后,“应用与跨学科联系”一章将阐释这些原则在实践中的应用,展示如何为基因疗法和免疫疗法等新型疗法量身定制试验设计,以及统计学、国际法等不同领域的知识如何共同促成这些试验的实现。

原则与机制

想象你是一位探险家,正准备首次航向一片未知领域。你手中的地图来自仅从远处观察过海岸线的前辈,还听闻过一些旅行者遭遇奇异动植物的传说。你此时的任务并非绘制整个大陆的地图或寻找宝藏。你首要且最重要的工作,是找到一个安全的登陆点——一个能让船只不会搁浅、水源可以饮用、并且能建立未来所有探索行动大本营的港湾。

这正是 ​​I 期临床试验​​ 的精神所在。它是一种新药迈向人体生物学世界的第一步,谨慎而稳健。其原则与机制是科学严谨性、统计学推理和深刻伦理承诺的完美结合。

首要指令:安全至上

在新药能够治愈疾病之前,它必须首先遵循古老的医学信条——“不造成伤害”。当一个诞生于实验室、仅在玻璃器皿和动物身上测试过的新分子即将首次用于人体时,一个问题压倒了一切:它安全吗?这便是 I 期试验的首要指令。

你或许会认为试验的目的是看药物是否有效,但并非如此。有效性的验证是后续阶段的任务。I 期试验的主要目标是了解药物的安全性特征,观察人体对其的耐受情况,并找出一个不会产生不可接受毒性的剂量范围。美国食品药品监督管理局 (U.S. Food and Drug Administration, FDA) 等监管机构是这一原则的最终守护者。他们对新试验方案的初步审查,重点并非疗法的潜在盈利能力,甚至不是其理论上优于现有治疗的方面。他们的根本任务是保护人类受试者免受不合理的风险。这种对安全性的单一关注,是整个药物研发大厦的基石。

基于原则的信念之跃

那么,我们如何选择给予人体的第一个剂量呢?这是一个充满责任的决定,绝不能凭空猜测。此时,一个巧妙的生理学统一性原则发挥了作用。虽然一个体重 707070 kg 的人与一只 202020 g 的小鼠显然大不相同,但它们的生物学特性通过“异速生长定标”规律联系在一起。一个关键的洞见是,许多生理过程,包括药物的代谢过程,与动物的​​体表面积 (BSA)​​ 的相关性比与体重的相关性更可靠。

选择起始剂量的过程是“原则性保守主义”的杰作:

  1. 首先,研究人员在至少两种不同的动物物种(例如,大鼠和狗)中进行广泛研究。他们仔细确定不会引起任何可观察到的显著毒性迹象的最高剂量。这被称为​​未观察到有害作用的水平 (No-Observed-Adverse-Effect Level, NOAEL)​​。

  2. 接着,他们利用异速生长定标法原理,将动物的 NOAEL 换算成​​人体等效剂量 (Human Equivalent Dose, HED)​​。该计算使用基于体表面积的换算因子,在物种间转换剂量。

  3. 至关重要的是,如果根据大鼠数据计算出的 HED 与根据狗数据计算出的 HED 不同,我们该选择哪一个?答案永远是较低的那个。我们听从最敏感物种的“意见”,以此增加一层谨慎。

  4. 最后,在向人体迈出这关键一步时,我们甚至不直接使用这个 HED。我们会额外应用一个显著的​​安全系数​​——通常是将 HED 除以至少 101010。所得结果即为​​最大推荐起始剂量 (Maximum Recommended Starting Dose, MRSD)​​。

例如,如果临床前研究显示,大鼠的 NOAEL 为 505050 mg/kg,狗的 NOAEL 为 202020 mg/kg,经过一系列考虑体表面积的计算,可能分别得出约 8.18.18.1 mg/kg 和 10.810.810.8 mg/kg 的 HED。遵循我们的原则,我们会选择来自大鼠的较低 HED (8.18.18.1 mg/kg),再应用 101010 倍的安全系数后,得出用于人体的起始剂量约为 0.810.810.81 mg/kg。对于一名 707070 kg 的志愿者来说,总剂量约为 575757 mg。这个数字并非凭空捏造,而是层层审慎、尊重未知的产物。

攀登剂量阶梯

一旦这个极端保守的起始剂量在第一批小型参与者群体(即​​队列​​)中被证明是安全的,探索便开始了。我们必须找到安全性的上限。试验通过​​剂量爬坡​​的方式进行:下一组队列的参与者将接受一个稍高的剂量。如此,一个队列接一个队列,沿着预先设定的剂量“阶梯”向上攀升。

但我们如何知道何时停止攀升?我们需要一个清晰、客观的信号,告诉我们正在接近不可接受的毒性边缘。这个信号就是​​剂量限制性毒性 (Dose-Limiting Toxicity, DLT)​​。DLT 不是普通的副作用,它是一种特定的、严重的、并且在研究开始前就已经在试验方案中明确定义的不良事件。

DLT 的定义非常精确,通常基于标准化的分级系统,如《不良事件通用术语标准》(Common Terminology Criteria for Adverse Events, CTCAE),该标准将严重程度从 111 级(轻度)到 555 级(死亡)进行分级。DLT 可能被定义为:

  • 任何 ≥3\ge 3≥3 级的非血液学(与血细胞无关的)毒性。
  • 特定的 444 级血液学毒性,例如中性粒细胞(一种白细胞)计数严重降低且持续超过 777 天。
  • 伴有中性粒细胞减少的 333 级发热(发热性中性粒细胞减少症)。

关键在于,DLT 是一个预先指定的、具有临床意义且被认为是不可接受的事件。如果一个队列中的一到两名参与者在规定的时间窗内(通常是第一个治疗周期,如 282828 天)经历了 DLT,剂量爬坡就会停止。

当然,自然是复杂的。有些毒性不会立即出现,而是随着时间推移缓慢累积。一种药物在第一个月可能看起来非常安全,但在几个治疗周期后却可能导致累积性神经损伤(周围神经病变)。这对试验设计者来说是一个巨大的挑战。仅仅在第一个周期设置一个 DLT 观察窗口可能会错过这些迟发性毒性,从而导致一个危险的高剂量被推荐用于后续研究。因此,现代 I 期试验设计必须是智能和适应性的,通常会包含更长期的监测和特殊规则,以捕捉这些“慢性毒药”。

定义目标:可接受风险的艺术

当我们攀登剂量阶梯,收集每个剂量水平上的 DLT 数据时,我们最终寻找的目标是什么?我们试图确定​​最大耐受剂量 (Maximum Tolerated Dose, MTD)​​。

MTD 的现代定义是一个微妙而强大的统计学概念。MTD 并不仅仅是灾难发生前的最后一个剂量。相反,它被定义为据估计能使预先设定的目标百分比的患者发生 DLT 的剂量。例如,在许多癌症试验中,MTD 是指其目标 DLT 概率 π∗\pi^*π∗ 约为 0.250.250.25 到 0.330.330.33 的剂量。

这种概率性的方法堪称一项革新。它承认,在治疗癌症等危及生命的疾病时,一种完全无毒的药物往往也是一种无效的药物。目标不是找到零风险的剂量,而是找到一个风险水平可预测且可接受的剂量,这个剂量既能被医生所管理,又足够高,有希望在后续试验中显现疗效。MTD 或其附近的某个剂量随后被选为​​II 期推荐剂量 (Recommended Phase 2 Dose, RP2D)​​——这个剂量将被带入下一阶段的测试,届时,首要问题将最终从“它安全吗?”转变为“它有效吗?”。

人类契约:迈出第一步的伦理

这整个科学事业建立在一份与志愿参与者之间深刻的伦理契约之上。在 I 期试验中尤其如此,因为直接医疗获益的机会通常很低(在许多首次人体肿瘤学试验中,肿瘤缩小的概率低于 0.10.10.1),而风险,根据其定义,是未被完全了解的。

I 期试验的伦理正当性不同于大型 III 期试验。在 III 期试验中,我们常常将数千名患者随机分组,因为存在​​临床均势​​ (clinical equipoise) 的状态——即专家界对于哪种治疗更优存在真正的不确定性。而在 I 期试验中,不存在这种均势;新药是未经证实的。其正当性转而依赖于所寻求知识的巨大社会价值,以及最重要的一点——体现在​​知情同意​​ (informed consent) 过程中的​​尊重个人​​原则。

知情同意远不止是在表格上签名。它是一个建立在诚实和透明基础上的沟通过程。一个主要挑战是​​治疗性误解​​ (therapeutic misconception),即参与者可能认为试验是一种个性化治疗,而非一项实验。为应对此问题,知情同意过程必须精心设计。它必须毫不含糊地申明:“这是一项研究。其主要目的是了解该药物的安全性……本研究并非旨在治疗您的癌症,直接获益的可能性很小”。

此外,不确定性越大,知情同意过程就必须越严格。对于像新型脑植入物这样真正新颖的干预措施,未知因素本身就成为必须披露的关键信息。该过程必须验证参与者的理解程度,或许可以通过请他们用自己的话复述试验内容(即“teach-back”方法),以确保他们真正理解试验的非治疗目的以及现有证据的局限性。这种对参与者自主权的深刻尊重——尊重他们基于对风险、获益和不确定性的清晰理解而做出知情选择的权利——是使 I 期试验这勇敢的第一步得以实现的伦理核心。

应用与跨学科联系

在了解了 I 期试验的核心原则之后,人们可能会留下一种印象,即它是一套僵硬但必要的安全检查清单。但这样看待问题无异于只见树木不见森林。一项首次人体试验不仅仅是一道需要通过的门槛,它更是一座桥梁,一座在十几个不同人类知识领域交汇处构建的动态而复杂的结构。在这里,实验室的假说首次呼吸到临床现实的空气,抽象的科学被转化为切实的希望。要领会其全部意义,我们必须探索这一过程在现实世界中如何展开,它如何将免疫学、统计学、伦理学和国际法等看似毫不相干的学科联系起来。

第一个受试者:一个伦理与生物学的问题

或许,标志着这段旅程开始的最深刻问题是:谁应成为第一个接受新型研究药物的人?答案并不简单,它位于伦理推理和药理科学的交汇点。指导原则是相称性原则:参与者承担的风险必须与潜在的获益相称。

对于某些研究性药物——例如旨在杀死癌细胞的新型细胞毒性药物、革命性的基因疗法或强效的免疫激动剂——其固有风险很高。其作用机制虽然前景广阔,但带有产生严重、不可预测伤害的巨大潜力。要求一个没有任何健康问题、也无从获益的健康人接受这样的风险,将构成伦理违规。在这些情况下,有利原则要求首批参与者必须是患有该药物旨在治疗的疾病的患者。对他们而言,直接临床获益的可能性,无论多么渺茫,都可以为这高昂的风险提供正当性辩护。

相反,对于一种作用机制明确、可逆且预计安全范围宽的药物,初始风险可能被认为是微乎其微的。在这种情况下,招募健康志愿者是合理的。他们提供了一个“更干净”的生物学背景,使研究人员能够研究药物的行为,而不受疾病的混杂因素干扰。因此,这个决定是一次审慎的权衡,证明了临床试验不仅是一项科学实验,更是一项深刻的人文和伦理事业。

安全之外的目标:原理验证

一个常见的误解是,I 期试验只关乎寻找安全剂量。虽然安全性无疑是首要关切,但它并非唯一。想象一种旨在训练患者免疫系统攻击肿瘤的新型治疗性疫苗。试验顺利进行,疫苗被发现非常安全——没有观察到严重的副作用。这算成功吗?如果该疫苗未能引发任何免疫反应,则不然。一种不能刺激免疫系统的疫苗,仅仅是一个无害的失败品。

这就引入了“原理验证”(proof of principle) 或“机制验证”(proof of mechanism) 的关键概念。对于许多通过间接生物学机制起作用的现代疗法,I 期试验具有双重目标:建立安全性并确认药物正在按预期与靶点结合。这通常通过药效学 (pharmacodynamic, PD) 生物标志物来衡量——这些分子路标告诉我们药物正在产生其预期的生物学效应。

正是对生物活性剂量的探索,真正将 I 期试验与下一发展阶段——II 期试验——连接起来。目标不仅仅是找到最大耐受剂量 (MTD),而是确定一个既安全又有望成功的 II 期推荐剂量 (RP2D)。通过整合安全性、药代动力学 (pharmacokinetics, PK,即身体对药物的作用) 和药效学 (pharmacodynamics, PD,即药物对身体的作用) 的数据,研究人员可以选择一个恰到好处的剂量:足够高,有成功的希望;又足够低,可以耐受。这确保了当药物在 II 期进行疗效测试时,能够获得最佳的展示机会。

设计追随功能:为特定风险量身打造试验

I 期试验并非一成不变的模板。它是一套量身定制的盔甲,为抵御所测试“武器”的特定危险而精心设计。对药物作用机制的深刻生物学理解直接决定了试验本身的架构。

以 T 细胞衔接器 (T-cell engager) 为例,这是一种革命性的免疫疗法,它像一个“媒人”,将患者的 T 细胞与癌细胞物理连接起来,以引发靶向攻击。这种方法的巨大威力伴随着同样巨大的风险:细胞因子释放综合征 (Cytokine Release Syndrome, CRS),这是一种由大量 T 细胞突然激活引起的、可能危及生命的全身性炎症。为了管理这一已知风险,试验方案成为主动安全工程的杰作。患者并非从完整剂量开始,而是先接受极小一部分剂量,几天后再接受稍大的剂量,以此类推。这种“递进给药”(step-up dosing) 允许免疫系统逐渐适应,避免突然的、灾难性的激活。同时,它还与预用药物以减弱细胞因子反应以及密集的院内监测相结合,以捕捉最早的危险信号。试验的设计直接反映了其底层的免疫学原理。

同样的原则也适用于蓬勃发展的基因疗法领域。一种旨在纠正肝脏中缺陷基因的腺相关病毒 (AAV) 载体,带有一种已知的风险,即可能引发免疫介导的肝脏炎症,这种炎症通常不会在数小时内出现,而是在一到两周内显现。因此,试验设计必须考虑到这个特定的生物学时钟。一名“哨兵”患者首先接受给药,然后试验暂停——不是一天,而是一周或更长时间——研究人员在此期间密切监测肝酶。只有在这段关键窗口安全度过后,下一批参与者才能接受给药。监测计划、剂量限制性毒性的定义,以及试验本身的节奏,都由 AAV 载体的分子生物学特性决定。

这种量身定制可以变得极其具体。在一项旨在通过直接向内耳递送基因疗法以治疗耳聋的试验中,研究人员面临一个深刻的困境。临床前数据显示,注射到一只耳朵的 AAV 载体可能会通过脑脊液到达另一只耳朵。这为首次人体试验带来了艰难的选择。他们应该只给一只耳朵用药(单侧),接受免疫反应可能永远阻止第二只耳朵接受治疗的风险吗?还是应该同时给两只耳朵用药(双侧),以最大化获益机会,但如果出现意外的毒性效应,则要冒着导致双耳失聪的灾难性后果?这个决定并非凭空猜测。它是一次严谨的计算,权衡了对侧传播的微小但非零的概率与已知的毒性风险,这是将解剖学、免疫学和概率论应用于改变人生的伦理抉择的一次美妙而令人敬畏的应用。

剂量探索之舞:爬坡的艺术与科学

每项 I 期试验的核心都是剂量爬坡过程——即在一个剂量水平上治疗少数患者,观察结果,然后决定是否继续提高剂量的谨慎“舞蹈”。几十年来,标准方法一直是“3+3”算法,这是一套稳健且易于实施的简单规则。这就像在黑暗中爬梯子;你让几个人测试一档梯级,如果它牢固,你就向上移动到下一档。它行之有效,但并不聪明。它无法从整体的毒性模式中学习,并且常常导致许多患者在低的、亚治疗剂量下接受治疗。

在这里,统计学和计算机科学提供了一种更优雅的解决方案:基于模型的设计,如连续重评估方法 (Continual Reassessment Method, CRM)。CRM 不使用固定的算法,而是使用一个剂量-毒性关系的数学模型。随着每个新患者结果的出现,该模型利用贝叶斯统计进行更新,从而提炼其对哪个剂量最可能是目标剂量的估计。这好比爬梯子与使用一个根据所有可用交通数据不断重新计算最佳路线的 GPS 之间的区别。其结果是一个“更智能”的试验,它学习得更快,更倾向于准确地确定正确剂量,而且最重要的是,让更大比例的患者在最佳剂量或其附近接受治疗,这不仅使其更高效,也更符合伦理。

全球舞台:驾驭法律与监管

最后,I 期试验并非凭空出现。它建立在大量前期工作的基础之上,并在一个横跨全球的严格法律和监管框架内进行。在对任何人体进行给药之前,申办方必须完成一个庞大的“IND-enabling”(支持研究性新药申报的)研究项目——这是一系列旨在提供必要保证,证明药物已准备好进行人体测试的药理学、毒理学和遗传学非临床测试。通过国际人用药品注册技术协调会 (ICH) 的努力,这些要求在发达国家之间基本实现了协调,确保了安全性的科学标准是全球性的,即使文书工作有所不同。

即使科学标准得到了协调,不同的司法管辖区也有着不同的法律理念。在美国,研究性新药 (Investigational New Drug, IND) 申请被提交给食品药品监督管理局 (FDA)。如果申办方在 303030 天内没有收到“临床暂停”的通知,他们就被法律允许继续进行。这是一个“默认继续”的系统。而在欧盟,一项临床试验申请 (Clinical Trial Application, CTA) 必须在试验开始前获得国家药品机构和伦理委员会的明确、事先授权。了解这些不同的途径对于全球药物开发的现代现实至关重要,因为一项单一的试验可能同时在多个大洲进行。

从最深层的伦理考量到国际法的细微差别,从单个蛋白质的生物学特性到统计推断的力量,I 期临床试验是多学科的交响乐。在这个过程中,人类探索的动力受到其保护同类的责任的制约;在这里,科学以其最严谨和最富同情心的形式,迈出了将一个分子转化为一种药物的关键第一步。