首次人体（FIH）试验

玻尔百科

关键要点

FIH 试验的起始剂量是通过两种方法中取其低者谨慎确定：基于毒理学的未观察到有害作用的剂量水平（NOAEL）或基于药理学的最小预期生物效应水平（MABEL）。
FIH 试验采用单次和多次递增剂量（SAD、MAD）阶段的结构，并辅以前哨给药，以便在监测预设的剂量限制性毒性的同时，精细地管理风险。
招募健康志愿者还是患者的伦理决策取决于药物的风险特征，需要在健康受试者面临的最小、可逆风险与重症患者的潜在获益之间进行权衡。
通过确保计划的人体剂量与临床前动物和实验室研究中观察到的毒性水平或脱靶效应之间存在显著的暴露安全域，来对安全性进行量化管理。
现代 FIH 试验整合了计算模型和机制验证研究，以建立一条连接剂量、药物浓度、靶点占有率和生物效应的量化证据链。

引言

将一种新药首次用于人体是医学科学中的一个关键且高风险的时刻。这个被称为首次人体（FIH）试验的关键步骤，代表着从充满希望的实验室研究到潜在的新型救生疗法之间的桥梁。然而，这一转变充满了巨大的不确定性：当引入一种从未在人体中测试过的物质时，科学家如何确保参与者的安全？本文旨在揭开为管理这种不确定性而设计的严谨过程的神秘面纱，将潜在的信仰之跃转变为经过审慎计算的科学探索。第一部分“原理与机制”将剖析 FIH 试验的核心科学和伦理框架，解释如何选择初始剂量、如何构建试验以实现最大程度的安全性，以及指导参与者选择的道德考量。随后的“应用与跨学科联系”将把这些原则置于具体情境中，通过与历史发现进行类比，并探讨从项目管理到计算模型等领域如何融合以使现代药物开发成为可能，最终确保科学有权干预人类生命。

原理与机制

将一个在实验室中构思出的分子，一种从未接触过人类生物学的物质，首次引入活生生的人体——这听起来像是一种非凡的，甚至可能是不计后果的信仰之举。然而，这是每一种现代药物都必须跨越的桥梁。这段从实验室到病床的旅程并非信仰之跃。相反，它是所有科学领域中最精心策划、智力上最严谨、伦理上最有依据的过程之一：首次人体（FIH）临床试验。这是一场与未知的共舞，受制于一条至高无上的原则：primum non nocere，即“首先，不造成伤害”。但是，当我们主要的舞伴就是不确定性本身时，我们如何恪守这一原则呢？

答案是，几十年来，我们已经开发出一个系统——一个毒理学、药理学、伦理学和统计学的优美结合体——其目的不是消除风险（这是不可能的），而是理解、管理和精细地控制风险。这是一个让我们能够以既安全又极具信息价值的方式向自然提问的框架。

第一步：如何选择一个从未给过的剂量

想象一下，你必须踏上一个你从未见过的冰封湖面。你的第一步能迈多重？你不知道冰的厚度。直接跑出去是愚蠢的。任何 FIH 研究的第一个挑战都是相同的：选择起始剂量。我们有两种基本且互补的理念来解决这个难题。

第一种是基于毒理学的“自上而下”的方法。在临床前研究中，我们给动物（如大鼠和狗）使用递增剂量的药物，直到找到产生未观察到有害作用的最高剂量。这被称为未观察到有害作用的剂量水平（NOAEL）。这就像在我们的动物模型中找到了危险区域的边缘。然后，我们使用一种称为异速生长定标法的复杂方法，该方法考虑了物种间新陈代谢和体型的差异，将该动物剂量转化为人体等效剂量（HED）。但我们并未就此止步。为了格外谨慎，我们再应用一个安全系数——通常将 HED 至少除以十——来得出我们的最大推荐起始剂量（MRSD）。这就像用一根十英尺长的杆子找到悬崖的边缘，然后在你开始考虑迈步之前，先向后退十大步。

第二种理念是基于药理学的“自下而上”。我们不是寻找危险的边缘，而是寻找效应的微弱迹象。通过实验室实验和计算机模型，我们计算出我们预测可能在人体中产生最微小、几乎无法测量的生物效应的绝对最低剂量。这就是最小预期生物效应水平（MABEL）。这种方法对于可能具有强大、即时效应的药物尤其关键，例如那些刺激免疫系统的药物。

我们选择哪一个呢？规则简单而坚定：你总是从两个计算结果中较低的一个开始。安全不容商榷。

一场有条不紊的对话：I 期试验的架构

一旦我们确定了煞费苦心制定的保守起始剂量，我们不会直接跳到我们认为的最终治疗剂量。相反，我们开始与人体进行一场缓慢而有条不紊的对话。这就是 I 期临床试验的精髓。其典型设计是风险管理下探索的杰作。

首先是单次递增剂量（SAD）阶段。一小群参与者，通常是健康志愿者，被招募入组。在这个小组中，我们使用前哨给药：最先的一两个个体接受药物（或安慰剂），并在一两天内受到密切监测。如果他们一切正常，这个小“队列”的其余成员才开始给药。在他们的所有数据——血液水平、生命体征等——经过安全委员会审查并被认为安全后，一个新的队列将被招募，以接受稍高一些的剂量。这个过程重复进行，队列接队列，谨慎地提高剂量。

这就像测试那个冰封的湖面一样。你先派一个人走出几英尺远。他没事。现在一小群人可以走到那么远。然后，你再派一个人走得更远几英尺。在整个过程中，你都在倾听冰面最微弱的裂纹声。在试验中，那个“裂纹”就是预先定义的剂量限制性毒性（DLT）——一种特定类型和严重程度的副作用，一旦观察到，就告诉研究者们停止、重新评估，甚至终止剂量递增。

在 SAD 之后，我们可能会进行多次递增剂量（MAD）研究，其中新的队列将连续数天或数周接受药物，以观察其在体内的长期表现。在整个过程中，我们不断测量两件事：药代动力学（PK），即身体对药物的作用（如何吸收、分布、代谢和排泄），以及药效动力学（PD），即药物对身体的作用。目标是找到一个安全且耐受性良好的剂量范围，并了解药物在人体中的行为，从而为未来的研究铺平道路。

倾听低语：安全科学的艺术

早在药物接触人体之前，我们就在倾听潜在问题的最细微迹象。这就是安全性药理学的工作，其重点是药物是否可能，即使在非毒性剂量下，干扰身体的重要功能：中枢神经系统、呼吸系统，以及至关重要的心血管系统。

以心脏为例。其稳定的跳动是由离子通过心肌细胞通道精确到毫秒的流动所控制的。其中最重要的通道之一是 hERG 通道。如果一种药物部分阻断了这个通道，它会延迟心跳之间心脏的电“再充电”，这种效应在心电图（ECG）上表现为“QT 间期”的延长。QT 间期延长是一个警示信号；它可能增加发生危险性心律失常的风险。

在临床前研究中，我们直接测试 hERG 通道阻断，并监测动物模型（如狗）的 QT 间期。如果我们看到一个信号——例如，在狗体内可能在人体中达到的暴露水平下，QTc（校正的 QT 间期）略有增加——这个发现不一定会停止药物的开发。但它会改变临床试验的方式。这意味着在 FIH 研究中，每位参与者都将接受持续的心电图监测。方案中将有与观察到的 QTc 间期任何变化相关的严格终止规则。这是转化原则的一个绝佳例子：临床前研究中风险的微弱低语，在人体试验中变成了明确的保护性行动。

道德罗盘：谁应先行？

FIH 试验的科学性与其伦理密不可分。也许最根本的伦理问题是：谁应该成为第一个接受这种新药剂的人？应该是健康志愿者，他们无法从中获得任何医学上的益处，还是正在遭受该药旨在治疗的疾病的患者？答案完全取决于药物的性质及其相关风险。

对于许多药物，比如一种具有众所周知、可监测、可治疗副作用的可逆性小分子抑制剂（产品 X），首次试验是在健康志愿者中进行的。为什么？因为他们的身体提供了一个“干净”的系统，没有疾病的并发症，使我们能够以最大的清晰度观察药物的效果。其伦理正当性建立在“最小风险”的特征之上。潜在的伤害是短暂且可控的。在某种意义上，我们是在“借用”志愿者的健康，并采取一切保障措施以确保其完好无损地归还。

但是，对于像基因疗法（产品 Y）这样的革命性治疗方法呢？基因疗法被设计成永久性的。其潜在益处可以是改变人生的，但其潜在风险——尽管可能很小——却可能是严重且不可逆的，例如在多年后引发癌症。要求一个健康的人接受这样的赌博，无论机会多么渺茫，在伦理上都是站不住脚的。因此，首批接受这种疗法的人必须是患有其所针对的严重、危及生命的疾病的患者。对他们来说，风险-收益的计算是完全不同的。他们面临着疾病的确定性，而治愈或显著获益的潜力，无论多么不确定，都可以成为接受新疗法风险的合理且可接受的权衡。这种在可逆风险和不可逆风险之间的深刻区别，正处于临床研究伦理的核心。

这种风险-收益演算也适用于不同的疾病背景。对于危及生命的癌症，监管框架（例如 ICH S9）允许一个更简化和快速的开发路径，认识到与患有慢性、非危及生命的疾病的患者相比，这些患者对风险有不同的承受能力。

诚实的契约：同意不确定性

这给我们带来了最后一个深刻的问题。人们如何能够同意一个其概率根据定义是未知的风险？在 FIH 试验之前，接受该药物的人类数量为零。伤害的真实概率 $p$ 是一个谜。

解决方案不是假装我们知道。解决方案是彻底的诚实。一个有效的知情同意过程不是提供一种虚假的确定性；而是清晰、完整地描述我们不确定性的状态。一份恰当的知情同意文件不会只说一种药物是“低风险”的。它会解释为什么我们相信风险低（保守的剂量选择、临床前数据），但也会诚实地说明，从未有任何人类服用过此药，意想不到的严重副作用是可能发生的。它甚至可能根据类似药物提供一个合理的风险范围。

至关重要的是，它会详细描述研究中为保护参与者而内置的所有保障措施：前哨给药、密切监测、将导致研究停止的标准，以及可获得的医疗服务。真正的自主权不是被屏蔽在困难信息之外。它是由信息赋予力量的。知情同意是建立在信任基础上的联盟，参与者授权其参与，不是因为对不确定性一无所知，而是因为充分认识到了这种不确定性。

宏伟的旅程：将首次人体试验置于背景之中

FIH 试验，即 I 期，只是漫长道路上的第一步。在此之前，甚至可能有一个探索性的 0 期研究，其中给予极微小的“微剂量”，以便在几乎没有风险的情况下，初步了解药物在人体中的行为。在成功的 I 期之后，旅程继续：

II 期： 将药物给予更大规模的患者群体，以获得关于有效性的初步真实证据：它是否有效？
III 期： 进行一项涉及数百或数千名患者的大规模、通常是全球性的试验，以最终确认药物的有效性和安全性，通常通过与当前的标准治疗进行比较。
IV 期： 在药物获批上市后，这些上市后研究会继续监测在庞大人群中的长期效应和罕见副作用。

这整个耗时数年、耗资数十亿美元的过程由像美国食品药品监督管理局（FDA）这样的监管机构监督。在申办方能够开始这段旅程之前，他们必须提交一份名为研究性新药（IND）申请的综合档案，其中列出了所有的临床前数据、生产信息和详细的临床计划，并证明他们已经将对人类受试者的风险降至最低。这个结构化、有原则且受伦理约束的过程，就是将一个充满希望的分子转变为一种值得信赖的药物的过程。这是科学通过缓慢、谨慎而宏伟的过程，赢得干预人类生命的权利。

应用与跨学科联系

一种新药从实验室的好奇之物到人类疗法的旅程，是我们这个时代最伟大的科学探险之一。这个故事并非由一位孤独的天才书写，而是由数十个学科的大规模协作完成，每个学科都为这个错综复杂的谜题贡献了关键的一块。首次人体（FIH）试验是这个故事的焦点——一种潜在的新药首次与它的预期受益者相遇的时刻。但要理解其重要性，我们必须认识到支持它的庞大的科学和伦理网络。这不是一张官僚主义的核对清单；这是一个深刻的智力过程，是对几个世纪以来推动医学进步的发现逻辑本身的现代形式化。

来自过去的教训：发现的逻辑

让我们回到 1928 年 Alexander Fleming 的实验室。他观察到一个细菌培养皿上有一小块霉菌，在它周围，有一片细菌死亡的清晰区域。一次奇怪的意外？仅仅是假象？许多人可能会丢掉这个培养皿。但 Fleming 在科学好奇心的驱使下，看到了潜在的因果关系。他迈出了下一步：他培养了霉菌，用它制成肉汤，并证明这种“霉菌汁”可以重复地杀死细菌。他克服了第一个巨大障碍：将真实现象与随机意外区分开来。

然而，Fleming 的“霉菌汁”是一种不稳定、无法量化的神秘物质。你无法在一团迷雾上建立一门科学。十年后，由 Howard Florey 和 Ernst Boris Chain 领导的牛津团队接受了下一个挑战。通过艰苦的生物化学工作，他们成功分离并稳定了活性成分，一种他们称为青霉素的棕色粉末。现在他们有了可以称重、测量和标准化的东西。他们克服了定性和定量障碍。他们现在可以问一个关键问题：需要多少才能产生效果？。

但是在玻璃皿中有效的东西，在生物体内可能就是毒药。下一步是弥合从实验室工作台到活体生物的鸿沟。牛津团队用致命细菌感染小鼠。他们用宝贵的青霉素粉末治疗其中一些，而将另一些作为对照。接受治疗的小鼠活了下来；未经治疗的小鼠死亡了。这是一次胜利。它证明了选择性毒性的原理——该化合物是微生物的敌人，却是宿主的朋友。它还表明，药物的特性（其吸收、分布以及在体内的持续时间）与产生治疗效果是相容的。从实验室到生物体的障碍被打破了 [@problem_-id:4982101]。

最后，是终极测试：一位人类患者。1941 年，一名警察因猖獗的感染而生命垂危。牛津团队用他们仅有的一点点药物，给他注射了青霉素。那名男子的烧退了，并开始康复，这似乎是一个奇迹般的转变。尽管后来在他们的药物用完后，他复发并去世了，但他们已经看到了足够多的证据。他们首次证明了这种化合物可以在人体内起作用。他们跨越了最后的障碍——将动物模型与人类现实分开的障碍。这个英勇的、一步一步的旅程——从观察到量化，从实验室到动物，从动物到人类——是支撑每一个现代首次人体试验的永恒逻辑。

现代蓝图：规划旅程

今天，这条逻辑路径被形式化为一个严谨、明确的蓝图。在招募任何一名人类受试者之前，必须完成大量的工作来规划旅程并预测其挑战。这不仅仅是法规问题；这是一个深刻的科学和伦理责任问题。

想象一下，你正在为一种慢性心脏病开发一种新的口服药物。临床计划是测试单次剂量，然后是长达 28 天的多次剂量，并最终在患者中进行为期 12 周的研究。在进行首次给药之前，你必须做什么？源于数十年经验的国际指南提供了路线图。你必须进行关键的安全性研究，其持续时间等于或超过计划的人体暴露时间。为了支持为期 28 天的人体试验，你至少需要在动物中进行为期 28 天的毒理学研究。这些研究必须在两个不同的物种中进行——通常是一种啮齿类动物如大鼠和一种非啮齿类动物如狗——因为没有任何单一的动物模型能完美预测人类的反应。这些不仅仅是普通的研究；它们必须在一种称为良好实验室规范（GLP）的严格质量体系下进行，以确保数据无可指摘。与此同时，必须完成一套核心的“安全性药理学”研究，以检查对最重要器官系统（心脏、肺和中枢神经系统）的急性影响。最后，进行一系列遗传毒理学测试，以确保该化合物不会损害 DNA。只有当这一整套证据被集齐后，你才能向监管机构提交研究性新药（IND）申请，并请求开始人类旅程的许可。

这个蓝图不仅仅是一份测试清单；它是一个庞大的后勤工程。考虑一种肿瘤药物。所需的研究——狗的心血管遥测（8 周）、大鼠的呼吸研究（4 周）、遗传毒性测试（3-4 周）等等——都需要时间和专门的资源。如果一个实验室一次只能进行两项这样的主要研究，你必须成为一名调度大师，将最长的研究与一系列较短的研究并行进行，以便尽快到达终点。在典型情况下，即使执行完美，集齐首次人体试验所需的完整安全数据包也至少需要三到四个月不间断的工作。这说明了一个关键的跨学科联系：药物开发不仅关乎生物学和化学，也关乎项目管理、资源分配和经济学。

首次剂量的艺术：多小才算足够？

有了安全蓝图在手，也许最令人畏惧的问题出现了：什么是正确的起始剂量？我们正踏入未知。指导原则必须是安全。我们需要从低剂量开始——但多低呢？

弥合动物与人类之间差距的最古老、最优雅的思想之一是*异速生长定标法*。其洞见在于，许多生理过程（如药物代谢）并不与体重成比例，而是与体表面积（ $BSA$ ）成比例。一只小老鼠的代谢率相对于其体重要比一个大的人高得多。通过将动物中未显示出不良反应的最高剂量——未观察到有害作用的剂量水平（NOAEL）——转换为基于 $BSA$ 的人体等效剂量（HED），我们可以对人体剂量做出合理的初步估计。例如，大鼠的 $60\, \mathrm{mg/kg}$ 的 NOAEL 可能会转化为大约 $9.7\, \mathrm{mg/kg}$ 的 HED。然后我们会应用一个安全系数，通常至少为 10 倍，以得出第一个人类队列的最大推荐起始剂量（MRSD）。这是一个将简单的生理学定律应用于解决复杂安全问题的绝佳范例。

然而，对于当今高度特异性和强效的生物药物，如免疫调节抗体，这种简单的定标法可能还不够。这些药物被设计成具有强大的生物效应。在这里，需要一种更精细、基于机制的方法：最小预期生物效应水平（MABEL）。其思想是利用探索性的、非 GLP 的概念验证研究的数据——这些研究旨在了解药物的活性，而不仅仅是其毒性——来找到产生最小但可测量的生物效应的最低暴露量。对于一种免疫调节剂，我们可能会关注在小鼠模型中达到靶标生物标志物最大效应的 20% 所需的浓度。然后我们计算出预计能在人体中达到同样低水平生物活性的剂量。这个剂量就成为我们的起点。这种方法确保我们不仅在基于毒性推断安全的剂量下开始试验，而且是在我们知道处于药物预期作用阈值的剂量下开始，为这些强效药物提供了额外的谨慎。

穿越人体疆域：实时安全与发现

第一剂药物已经给予。旅程正在进行中。现在，任务转向密切监测和学习。我们如何确保安全并确认药物的行为符合我们的预期？

现代药理学的一个核心宗旨是，给药剂量可能不是身体实际经历的良好指标。真正重要的是暴露量——药物在血液中随时间变化的浓度。此外，通常只有未结合或“游离”的药物具有生物活性；附着在血液蛋白上的那部分药物只是随波逐流。因此，我们的安全计算必须基于暴露安全域。我们测量动物在其 NOAEL 水平下的未结合药物暴露量，并将其与我们计划的临床剂量下人体的预测未结合暴露量进行比较。一个健康的安全域，比如说 10 倍或更大，给了我们信心。我们对特定风险也做同样的处理；例如，我们测量药物在体外阻断名为 hERG 的心脏离子通道的效力，并确保人体血液中的浓度将远低于（例如，低 30 倍）这个危险区域。这就是药理学、化学和毒理学交织在一起，为安全创建一个量化框架的地方。

首次人体试验中最大的潜在危险之一是非线性药代动力学的可能性。对于大多数药物在大多数剂量下，身体清除药物的机制（例如，肝脏中的代谢酶）有足够的备用能力。剂量加倍，暴露量也加倍。系统是线性和可预测的。但是，如果剂量高到足以使该机制饱和呢？想象一个收费站，收费亭数量有限。只要交通稀疏，汽车就能按比例通过。但一旦交通拥堵超过了收费亭的容量，系统就饱和了。现在，到达的汽车数量小幅增加，就会导致交通堵塞长度出现巨大、不成比例的增长。

药物也可能发生同样的情况。如果我们将剂量增加到代谢酶饱和的区域，一个小的剂量增量可能导致药物暴露量突然、急剧且可能有毒的飙升。这就像在雾中走向悬崖；一切似乎都很好，直到你多走了一步。这种风险是如此根本，以至于它决定了 FIH 试验的设计。我们“从低剂量开始，缓慢进行”，从一个安全处于线性范围内的剂量开始，并以小而谨慎的步伐递增。我们使用前哨给药，即一两个受试者先用药，我们等待看到他们的数据后再给队列的其他人用药。我们在早期几个小时内密集采集血样，以及时捕捉任何饱和的迹象，并预设停止规则，以便在暴露量开始不成比例地增加时中止试验。

但 FIH 试验不仅仅是为了规避危险；它是一场发现之旅。药物是否真的按设计工作？这就是机制验证的问题。我们试图建立一个连接剂量与最终生物效应的“证据链”。我们测量血液中的药物浓度（药代动力学，PK），并使用正电子发射断层扫描（PET）等先进技术，有时可以直接观察到药物在体内与其靶点结合，并量化靶点占有率。然后我们测量一个近端生物标志物——药物击中其靶点的直接生化结果。最后，我们观察更远端的、下游的临床效应。通过建立一个连接 $Dose \rightarrow Concentration \rightarrow Engagement \rightarrow Biomarker Effect$ 的数学模型，我们可以定量地测试在临床前实验中精心研究出的药物机制在人体中是否成立。

这种学习和确认的过程正在被另一个跨学科联系所革新：计算模型。科学家现在可以建立一个*基于生理的药代动力学（PBPK）*模型——一个计算机上的“数字孪生”人。该模型整合了药物特性（如溶解度和渗透性）的数据与人体生理学的详细地图（器官大小、血流量、酶的位置）。有了这个虚拟人，我们可以进行在真实人群中过于复杂、昂贵或危险的模拟。例如，我们可以预测随餐服用药物是否会影响其吸收，或者如果与另一种常用药物一起服用其水平可能会如何变化。这些模型并不能消除进行人体研究的需要，但它们使我们能够设计出更智能的研究。一个模型可能预测某种药物没有食物效应。然后我们可以在我们的 FIH 试验中进行一个小型的、有针对性的实验来证实这一预测。如果得到证实，我们或许可以豁免之后一个更大规模的、独立的食物效应研究，从而节省时间和金钱，同时增加我们的科学理解。

人文背景：为何以及为谁？

最后，我们必须从技术细节中抽身，提出所有问题中最重要的那几个：我们为什么要做这件事，以及为谁而做？这门科学的应用并不仅限于实验室或诊所；它们与我们全球社会的结构紧密相连。

有时，进行首次人体试验的动力并非来自长期的研究项目，而是来自全球性危机。“同一健康”框架认识到，人类健康与动物和环境的健康密不可分。当一种新病毒从动物（比如蝙蝠）“宿主跳跃”到人类时，就可能引发大流行病。病毒基因组学和分子系统发育学等领域是我们的第一道防线。通过对来自不同物种的病毒进行测序，科学家可以构建一个进化树，识别近期跨物种传播的特征性标记，并估计溢出事件发生的时间。这些知识是开发新疫苗或抗病毒药物竞赛的发令枪。该应对措施的后续 FIH 试验，正是对这一全球健康威胁的直接回应，是转化科学在紧急情况下的关键应用。

这种全球视角迫使我们面对所有跨学科联系中最深刻的一个：科学与正义之间的联系。想象一下，一家美国公司为一种罕见的先天性疾病开发了一种突破性的基因疗法。他们选择在一个低收入国家进行高风险的首次人体试验，因为在那里，由于遗传上的奠基者效应，这种疾病更为常见。试验顺利进行，当地社区承担了这项新颖、未经证实的技术的直接风险。而该疗法如果成功，预计定价为每剂数十万美元——这对于使其开发成为可能的那个群体来说是完全无法企及的。

这个场景凸显了一个根本性的伦理失误。研究伦理中的公正原则要求研究的负担和惠益得到公平分配。要求一个弱势群体承担他们没有合理前景从中受益的实验风险，是一种剥削形式。这不是科学的失败，而是伦理和社会责任的失败。它提醒我们，一种新药的旅程，并非在证明其安全有效时就已完成。只有当它到达需要它的人们手中时，才算真正完成。这个道德维度并非与科学分离；它是赋予科学意义的框架，提醒我们，在这漫长而复杂的发现之旅的尽头，是一个期盼着更好生活的人。