需治数 (NNT)

玻尔百科

定义

需治数 (NNT) 指的是为使一名患者获得预期临床结果而平均需要接受特定干预措施的人数，其数值等于绝对风险降低率的倒数。该指标是临床决策、公共卫生和政策制定中的重要工具，常与需损数结合使用以权衡治疗收益与潜在副作用。需治数与患者的基线风险成反比，这意味着干预措施在高风险群体中通常具有更低的数值和更高的效率。

核心要点

需治数 (NNT) 是绝对风险降低的倒数，代表为使一名患者获得预期结果而必须接受干预的患者数量。
知情决策要求在治疗获益的需治数 (NNT) 与其潜在不良反应的需伤数 (NNH) 之间进行权衡。
NNT 不是一个恒定值；它与患者的基线风险成反比，这意味着治疗在高风险人群中效率更高（NNT 更低）。
NNT 框架是一种多功能工具，可应用于临床实践中的共同决策、公共卫生领域的资源分配，以及政策和伦理学中的循证分析。

引言

在评估医疗方法时，简单地问“它有效吗？”往往是不够的。更精细的理解需要我们问：“它的效果如何？对谁有效？成本是多少？”为了回答这些问题，临床医生和研究人员需要一个既具有统计学严谨性又直观清晰的指标。“需治数 (NNT)”正是这样的工具，它将抽象的风险百分比和复杂的试验数据转化为一个单一、具体的数字，传达了在现实世界中实现单个有益结果所需的努力。它弥合了“知道一种疗法有效”与“理解其在个体层面上的实际影响”之间的鸿沟。本文将深入探讨 NNT，首先解释其核心原理、计算方法和局限性，然后探讨其在医学、公共卫生和政策领域的广泛应用。

原理与机制

需治数 (Number Needed to Treat, NNT) 将抽象的百分比转化为一个具体的、人性化尺度的计数，揭示了为取得一次成功所需付出的努力。

一个简单而优美的想法：为治愈而计数

让我们从一个思想实验开始。假设在一个群体中，一年内每 100 人中有 10 人会患上某种心脏病。基线风险，即对照组事件率 (Control Event Rate, CER)，为 $0.10$ 。现在，一种新的预防性药物被引入。一项大型临床试验显示，在服用该药的 100 人中，只有 6 人会患上该病。治疗组的风险，即试验组事件率 (Experimental Event Rate, EER)，现在是 $0.06$ 。

这种药显然有效。但我们如何以一种医生和患者都能轻易理解的方式来量化它呢？我们可以从风险差异入手。风险从 $0.10$ 下降到 $0.06$ 。这种 $0.04$ （即 4 个百分点）的降低被称为绝对风险降低 (Absolute Risk Reduction, ARR)。

$\text{ARR} = \text{CER} - \text{EER} = 0.10 - 0.06 = 0.04$

这个数字告诉我们一些强有力的信息：每治疗 100 人一年，我们就能预防 4 例本会发生的心脏病。但我们可以让这个概念更具个体化。如果治疗 100 人能预防 4 例事件，那么要预防一例事件需要治疗多少人呢？一个简单的除法就能告诉我们答案：

$\frac{100 \text{ 人}}{4 \text{ 例预防事件}} = 25 \text{ 人/例预防事件}$

这就是 NNT。我们需要治疗 25 人一年，以预防一例心脏病的发生。这里有一个优美而直接的数学关系。NNT 就是绝对风险降低的倒数。

$\text{NNT} = \frac{1}{\text{ARR}}$

用我们的例子来说： $NNT = \frac{1}{0.04} = 25$ 。这个简洁的公式将群体层面的风险差异与一个感觉上扎根于临床实践现实的数字联系起来。为了精确并避免夸大治疗效果，标准惯例是总是将 NNT 向上取整。例如，如果计算得出的 NNT 是 66.7，我们会报告为 67，因为平均而言，仅治疗 66 名患者所预防的事件会略少于一例。

硬币的另一面：需伤数

自然界没有免费的午餐，医学也不例外。一种疗法在预防一个问题的同时，可能会引起另一个问题。我们用来量化获益的逻辑同样可以用来量化伤害。

让我们回到心脏病药物的例子。假设试验还追踪了一种已知的副作用，如症状性低血压（危险的低血压）。在对照组中，这种副作用的风险是 $0.01$ (1%)，但在服药组中上升到 $0.03$ (3%)。在这里，治疗没有降低风险，反而增加了风险。这种差异被称为绝对风险增加 (Absolute Risk Increase, ARI)。

$\text{ARI} = \text{EER}_{\text{harm}} - \text{CER}_{\text{harm}} = 0.03 - 0.01 = 0.02$

和之前一样，我们可以问：需要治疗多少人，才会额外有一人经历这种伤害？这就得出了需伤数 (Number Needed to Harm, NNH)。

$\text{NNH} = \frac{1}{\text{ARI}} = \frac{1}{0.02} = 50$

现在我们有了一幅关于权衡的完整图景。为预防一例心脏病，我们需要治疗 25 人一年。这样做，我们预计每治疗 50 人，就会有一人出现一次低血压。获益的 NNT 是 25，而伤害的 NNH 是 50。由于 NNT 小于 NNH，预期获益的发生频率高于特定伤害。这并不自动意味着该治疗是值得的——必须权衡心脏病的严重性与低血压的严重性——但它为那场关键的临床对话提供了一个清晰的量化基础。

基线的“专制”：为何 NNT 是个变动的数字

现在我们来探讨 NNT 的一个微妙但至关重要的特性。它是一种药物固定、普适的属性，就像其分子量一样吗？答案是响亮的“不”。NNT 对患者的起点——即他们的基线风险——高度敏感。

许多治疗是以相对方式起作用的。例如，一种药物可能被证明能将一个人的风险降低 25%。这是一个衡量相对风险降低 (Relative Risk Reduction, RRR)的指标。这种相对效应在不同人群中可能惊人地稳定。然而，NNT 是一个绝对的衡量标准，你获得的绝对益处完全取决于你开始时所面临的风险。

可以把它想象成一张折扣券。无论你是在一家普通咖啡馆还是一家米其林星级餐厅，一张“七五折”优惠券提供的相对折扣是相同的。但你节省的绝对金额却大相径庭。同样，一种能将风险降低 25% 的药物，为高风险患者带来的绝对益处远大于低风险患者。

让我们把这一点形式化。决定 NNT 的 ARR 可以用基线风险（ $p_C$ ）和相对风险（ $RR = p_T/p_C$ ）来表示：

$\text{ARR} = p_C - p_T = p_C - (p_C \times RR) = p_C \times (1 - RR)$

这意味着 NNT 是：

$\text{NNT} = \frac{1}{\text{ARR}} = \frac{1}{p_C \times (1 - RR)}$

这个方程式具有启发性。它表明，对于一个具有恒定相对效应（固定的 $RR$ ）的治疗，NNT 与基线风险（ $p_C$ ）成反比。随着基线风险的上升，NNT 会下降。

考虑一种 $RR$ 为 $0.75$ （相对风险降低 25%）的药物：

在一个基线风险为 $p_C = 0.20$ (20%) 的高风险组中， $ARR = 0.20 \times (1 - 0.75) = 0.05$ 。 $NNT = 1/0.05 = 20$ 。
在一个基线风险为 $p_C = 0.04$ (4%) 的低风险组中， $ARR = 0.04 \times (1 - 0.75) = 0.01$ 。 $NNT = 1/0.01 = 100$ 。

药物是相同的，但其实际效率却发生巨大变化。你只需要治疗 20 名高风险患者就能看到一个益处，但却需要治疗 100 名低风险患者才能达到同样的结果。这一原则是预防医学和风险分层的基石——我们将最有效的干预措施集中在那些获益最大的人群身上。

附加说明：NNT 用户指南

就像任何强大的工具一样，使用 NNT 必须理解其局限性和假设。它远不止一个简单的数字；它是一个特定情境的总结。

时间范围

若无时间框架，25 的 NNT 毫无意义。一年内 NNT 为 25 是一个强大的效果；而一生中 NNT 为 25 可能微不足道。由于风险是在给定时期内发生事件的概率，NNT 总是与该时间范围相关联。对于随时间发生的结局，如癌症或心脏病生存研究，NNT 甚至可以使用 Kaplan-Meier 估计等方法计算特定时间点的数值（例如，5 年 NNT）。

从连续量表到二元事件

对于那些并非简单的“是/否”事件的结果，如慢性疼痛、残疾或抑郁症，该怎么办呢？这些通常是在一个连续量表上测量的。要计算 NNT，我们必须首先定义什么是“成功的结果”。临床医生通过建立一个最小临床重要差异 (Minimal Clinically Important Difference, MCID)——即患者会认为是“有益”的最小得分变化——来做到这一点。然后我们可以计算每组中达到这个“有效”状态的患者数量，并计算产生一个额外有效病例的 NNT。这是一种有效且强大的技术，但前提是 MCID 必须基于可靠证据预先指定，而不是为了让结果更好看而在事后精心挑选的。

不确定性的阴影

如果一项试验显示有益，但结果不具有统计学显著性，会发生什么？在这种情况下，绝对风险降低的 95% 置信区间将跨越零点（例如，从 -0.01 到 +0.03）。当我们取倒数计算 NNT 时，这个区间会“爆炸”。它将从某个 NNH（例如，NNH 为 100），穿过无穷大，延伸到某个 NNT（例如，NNT 为 33）。这不是一个数学错误；这是对我们不确定性的深刻表达。它告诉我们，根据数据，该治疗可能有害，可能有益，也可能根本没有效果。在这种情况下，NNT 的点估计值极不稳定，如果没有其伴随的无界置信区间，则会产生误导。

独立性假设

最后，简单的 NNT 计算依赖于一个默认的假设：治疗一个人不会影响另一个人的结果。这被称为稳定单位治疗价值假设 (Stable Unit Treatment Value Assumption, SUTVA)。对于心脏病发作或中风，这个假设成立。我服用他汀类药物不会改变你心脏病发作的风险。但对于疫苗呢？为一个孩子接种疫苗可以降低他们生病的风险，但同时也减少了社区中病毒的传播量，从而降低了其他所有人的风险——这种效应被称为群体免疫。这种“干涉”违反了 SUTVA。在这种情况下，一次疫苗接种的真正益处分散在个人和社区之间，简单的 NNT 公式无法完全衡量疫苗对公共卫生的总体影响。

需治数是医学统计学的杰作——一个简单、优雅且直观的指标。它讲述了一个关于临床努力和患者获益的故事。但要真正理解这个故事，我们必须阅读附加说明，总是追问：在多长的时间内？针对哪一群患者？以及其基本假设是否有效？只有这样，NNT 才能从一个单纯的数字转变为真正的智慧。

应用与跨学科联系

既然我们已经探讨了需治数 (NNT) 背后的原理，真正的乐趣才刚刚开始。就像任何深刻的科学思想一样，其真正的美不在于公式本身，而在于其应用所触及的广阔且常常令人惊讶的领域。NNT 不仅仅是一个计算；它是一个观察世界的新视角，一个能为复杂选择带来清晰度的思维工具，其影响范围从私密的医患诊室延伸到广阔的公共政策和伦理辩论舞台。

临床医生的指南针：从试验到床边

想象你是一名医生。一位病人带着一种使人衰弱的疾病来找你，而你的武器库中有一种新的治疗方法。临床试验报告称该药“有效”。但这到底意味着什么？这时，NNT 就成了指导临床决策不可或缺的指南针。

考虑一种用于治疗严重银屑病 (psoriasis) 的现代生物疗法。一项大型临床试验可能显示，72% 的患者皮肤状况得到显著改善（即所谓的 PASI-90 反应），而在使用安慰剂的患者中，只有 5% 观察到类似改善。这里的 NNT 低得惊人，仅为 1.49。这个数字有着实实在在的意义：每治疗三名患者，你就可以预期其中两人会体验到若不治疗则无法获得的、足以改变生活的益处。这是一个治疗上的“本垒打”。

现在，将其与一种治疗急性偏头痛的药物进行对比。也许 25% 的服药患者在两小时内疼痛消失，而服用安慰剂的患者中这一比例为 10%。NNT 大约是 7。这虽然不是“本垒打”，但仍是一次非常稳固的“安打”。每治疗七名偏头痛发作的患者，你就可以预期为其中一人提供完全的缓解，否则他将继续受苦。

然而，NNT 并非一个普适常数。它是一个有特定情节的故事，我们必须始终阅读其细节。它的数值与所测量的结局以及观察的时间范围密不可分。一种治疗特应性皮炎 (atopic dermatitis) 的药物，其 NNT 可能为 2.5，对应的是在 16 周内实现 75% 的皮肤状况改善。对于一种用于治疗儿童注意缺陷多动障碍 (ADHD) 的兴奋剂药物，NNT 为 2.5 可能对应的是在 10 周内实现症状的显著减轻。

这种精确性不是弱点，而是优点。它使临床医生能够超越模糊的保证，与患者或其家人进行透明的对话。与其说一种治疗“有效”，不如说：“根据一项为期 10 周的研究证据，如果我们用这种药物治疗大约五个孩子，我们预计会比什么都不做多出两个孩子在症状上看到有意义的改善。”这把抽象的概率转化为直观的频率，从而使患者能够成为自身医疗保健的积极参与者——这正是共同决策的精髓。

双刃剑：平衡获益与伤害

当然，任何强有力的干预措施都伴随着代价。能摧毁堡垒的大炮也可能打偏目标。医学中充满了这样的双刃剑，而 NNT 框架优雅地扩展，帮助我们驾驭这种基本的权衡。

让我们看一种严重的自身免疫性疾病，如 Behçet’s disease，其眼部（葡萄膜炎 uveitis）的复发性炎症可导致失明。一种像 infliximab 这样的强效药物可以将一年的复发风险从可怕的 60% 降低到更易于管理的 30%。这得出的 NNT 约为 3.3——意味着我们每年只需治疗三到四名患者，就能预防一例可能威胁视力的炎症。

这听起来很棒。但这些药物是强效的免疫抑制剂。它们有自身的风险，比如增加严重感染的机会。这就引出了一个并行的概念：需伤数 (NNH)。如果假设使用这种药物导致严重感染的 NNH 为 50，那么临床医生和患者必须进行一次深刻的考量。为了每治疗三名患者预防一例葡萄膜炎，是否值得每治疗五十名患者导致一例严重感染？

在这种情况下，考虑到失明的严重性，答案可能是一个响亮的“是”。由低 NNT 量化的益处，远远超过了由高得多的 NNH 所体现的风险。但在其他情况下，NNT 和 NNH 可能非常接近，使得决策变得更加困难。这种 NNT/NNH 的二元性不仅仅是一个统计上的奇趣现象；它是希波克拉底誓言中“首先，不造成伤害”的量化心跳，为平衡获益与风险的天平提供了一个理性的框架。

超越个体：公共卫生与政策中的 NNT

NNT 的力量远远超出了个体患者的护理。如果我们把视野拉远，会发现同样的逻辑可以指导整个群体的健康。从某种意义上说，公共卫生官员是整个城市或国家的医生，而 NNT 是他们最重要的工具之一。

思考一下吸烟这个巨大的公共卫生挑战。与安慰剂相比，像 varenicline 这样的药物每治疗九到十名吸烟者，就能额外帮助一人戒烟。或者想一想一个旨在阻止传染病传播的新社区项目，每 33 名参与者就能预防一例病例。这些 NNT 值是效率的度量。对于一个预算有限的卫生部门来说，比较不同项目——如疫苗接种、健康教育或戒烟——的 NNT 和成本，为合理分配宝贵资源以实现最大多数人的最大利益提供了理性依据。

这种思维方式甚至渗透到了法律和政府领域。想象一下，一个州议会正在辩论一项提案，旨在扩大受过高度训练的护士的执业范围，允许他们独立管理慢性病患者。支持者声称这将改善护理，而反对者则担忧安全问题。辩论很容易退化为观点和传闻之争。但如果另一司法管辖区的一项研究表明，这样的变革每 33 名在新模式下管理的患者中，就能预防一例住院治疗？突然之间，辩论就有了证据的支撑。NNT 成了一项硬数据，一项衡量政策现实世界效益的量化指标，帮助监管者在可及性、安全性和有效性之间取得平衡。

伦理的标尺：NNT 与选择的道德性

也许 NNT 最深刻的应用是当它被用作衡量我们伦理选择的标尺时。一个简单的数字能为我们的道德演算提供信息吗？

让我们以毁灭性的阿片类药物过量危机为例。一个城市卫生部门实施了一项减少伤害策略：向高风险人群分发纳洛酮急救包。分析显示，在该项目中，每年每 71 人参与，就能预防一例药物过量。与我们前面的一些例子相比，71 的 NNT 可能显得很高。但所预防的后果是死亡。

从行善 (beneficence)——为他人利益行事的责任——这一伦理原则来看，这个项目是明确的成功。它在拯救生命。但公共卫生是在公正 (justice)——公平分配有限资源——的原则下运作的。纳洛酮项目是花费一百万美元的最公正的方式吗？也许另一个项目，比如扩大药物辅助治疗的可及性，在预防药物过量方面有更低的 NNT，并能以同样的成本拯救更多的生命。NNT 并不给出最终答案，但它迫使我们提出正确的问题。它将一种“做好事”的模糊愿望转变为具体的、可比较的分析，将我们最关键的伦理辩论根植于我们所能实现的现实之中。

从用于从真实世界数据中估计效应的严谨因果推断方法，到最私人的对话和最宏大的政策辩论，需治数证明了一个清晰理念的力量。它是一条统一的线索，一种共同的语言，通过一个除以一个差值的优雅简约，将实验室、诊所、议会和我们自己的良知联系在一起。