质量调整生命年

玻尔百科

核心要点

QALYs通过将生命长度与生活质量的效用权重相结合，提供了一个标准化的度量指标，使得对不同类型的健康结局进行比较成为可能。
成本效果分析使用增量成本效果比（ICER）来计算一项新干预措施每获得一个QALY所带来的额外成本。
QALY框架通过期望值考虑了现实世界中的不确定性等复杂因素，并通过贴现考虑了健康的时间价值。
尽管QALYs十分有用，但它也面临着重大的伦理挑战，尤其是在评估已有残障人士的生命价值方面。

引言

在复杂的医疗保健领域，决策者们常常面临着两难的选择。我们应如何将有限的预算分配给一种能拯救少数人生命的药物，还是一种能改善多数人生活质量的疗法？这不仅仅是财务问题，更是深刻的伦 lý 问题，需要在看似无法比较的结局之间做出权衡。这一挑战凸显了一个根本性的空白：即需要一种标准化的健康效益衡量标准。如果没有一种通用的衡量尺度，资源分配就可能变得武断和不公。

本文旨在探讨为填补这一空白而设计的最具影响力的工具：质量调整生命年（Quality-Adjusted Life Year, QALY）。QALY框架提供了一个单一、连贯的度量标准，它同时结合了生命的“数量”与“质量”，从而使理性、透明的决策成为可能。在接下来的章节中，我们将剖析这一强大的概念。首先，在“原理与机制”一章，我们将探讨QALY的理论基础，从其基本计算到其在成本效果分析中的作用。然后，在“应用与跨学科联系”一章，我们将考察QALYs在现实世界中如何被用于评估新技术、为临床选择提供信息和塑造国家卫生政策，同时我们也会思考其伦理边界。

原理与机制

我们应如何在医疗保健领域做出决策？想象一下，你负责一家医院的预算。你有一笔资金，既可以购买一台今年能拯救10条生命的新机器，也可以资助一个能显著改善500名慢性疼痛患者生活质量的项目。你该如何选择？这感觉就像在比较苹果和橘子。一个提供的是生命的长度，另一个则是生活的质量。这正是医疗服务提供者和政策制定者每天都要面对的那种令人困惑的挑战。为了理性、公平地 navigating 这些选择，他们需要一种共同的语言，一种能够衡量不同健康结局的“通用货币”。对这种通用货币的探求，催生了现代卫生经济学中最强大——也最具争议的——工具之一：质量调整生命年（Quality-Adjusted Life Year），简称QALY。

探求健康的通用货币

让我们试着从基本原理出发构建这种货币。一项健康效益最直接的衡量标准是它为某人带来的额外生命。如果一种治疗方法能让人比原本多活5年，我们可以说它产生了5个生命年（Life-Years）。这很简单直观，但也很粗糙。在完美健康中度过的一年，与在 debilitating illness 中度过的一年是相同的吗？我们大多数人会本能地回答“不”。生命的质量与它的数量同等重要。

这就是QALY中“质量调整”部分的由来。我们引入一个简单而深刻的概念：一个健康相关生活质量权重（health-related quality of life weight），或称效用权重（utility weight），我们称之为 $u$ 。这是一个从0到1的全方位量表上的数字，其中1代表完美健康的一年，0代表与死亡等同的状态。在效用为 $u=0.8$ （例如，在有轻微症状的情况下管理一种慢性病）的状态下度过的一年，“价值”为0.8个QALYs。而在限制更严重的状态下度过的一年，其效用可能为 $u=0.5$ ，产生0.5个QALYs。

对于健康状况恒定的时期，其计算方法异常简洁：

\text{QALYs} = \text{健康状态下的时间（年）} \times \text{效用权重 } (u)

例如，一项中风预防策略让一个人在平均质量权重为 $0.82$ 的情况下多活了12.5年，这将产生 $12.5 \times 0.82 = 10.25$ 个QALYs。

当然，一个人的健康状况很少是恒定不变的，它会随时间变化。那么，我们该怎么办呢？QALY的基本定义非常巧妙：它是效用函数随时间变化的曲线下面积。如果我们将一个人的健康效用（ $u$ ） plotted on the vertical axis and time ( $t$ ) on the horizontal axis, the total QALYs they experience is the integral of that function:

\text{QALYs} = \int u(t) \, dt

对于一位健康状况在4年内有所改善的患者——例如，第一年效用为0.6，接下来两年为0.8，最后一年为0.9——我们可以简单地将每个时期的QALYs相加： $(1 \times 0.6) + (2 \times 0.8) + (1 \times 0.9) = 3.1$ 个QALYs。QALY提供了一个单一的数字，捕捉了一个人在一段时间内经历不同健康状态的整个过程。

选择的逻辑：权衡成本与后果

既然我们有了自己的货币，我们该如何用它来做出那些艰难的决定呢？医疗资源总是有限的。选择资助一种治疗，往往意味着选择不资助另一种。这就是机会成本（opportunity cost）的概念。为了最好地利用有限的预算，我们需要用我们花的钱获得尽可能多的健康。这就是成本效果分析（Cost-Effectiveness Analysis, CEA）的精髓。

在比较一项新干预措施与当前的标准疗法时，我们关心的是它以额外的成本带来的额外的健康效益。这个比率被称为增量成本效果比（Incremental Cost-Effectiveness Ratio, ICER），它是卫生经济学的主力工具。

\text{ICER} = \frac{\Delta C}{\Delta E} = \frac{\text{Cost}_{\text{New}} - \text{Cost}_{\text{Old}}}{\text{QALYs}_{\text{New}} - \text{QALYs}_{\text{Old}}}

ICER告诉我们每增加一个QALY的“价格”。例如，如果一个新项目额外花费500,000美元，比旧项目多产生50个QALYs，那么ICER就是 $500,000 / 50 \text{ QALYs} = \$ 10,000$每QALY。这意味着社会为获得的每一年完美健康支付了10,000美元。

这划算吗？要回答这个问题，我们需要一个基准。这个基准是支付意愿（willingness-to-pay, WTP）阈值，这个值代表了社会愿意为获得一个QALY而支付的最高金额。这不是在实验室里发现的数字；这是一个社会价值判断。在许多国家，这个阈值通常在每QALY 50,000美元到150,000美元的范围内。如果一项干预措施的ICER低于这个阈值，它就被认为是“具有成本效益的”。在我们的例子中，由于10,000美元远低于50,000美元，这个新项目将是明显的赢家。

有时，选择甚至更简单。如果一种新疗法既比替代方案更有效（产生更多QALYs）又成本更低，它被称为占优（dominant）。占优策略总是首选。相反，如果一种疗法效果更差且成本更高，它就是被占优（dominated）的，应该总是被拒绝。ICER只在介于两者之间的有趣情况下才需要——即当我们必须支付更多以获得更多健康时。

现实世界的复杂性：接纳不确定性与时间

现实世界很少像我们简单的例子那样整洁。医疗干预的 outcomes are not certain; they are probabilistic. 例如，一个筛查项目有很小的机会带来巨大的好处（早期发现致命疾病），但同时也伴随着伤害的风险，比如假阳性导致的焦虑或后续程序的并发症。QALY框架通过期望值（expected value）的概念完美地处理了这一点。

要找出一个项目的净效益，我们计算每种可能结果——无论是好是坏——的期望QALYs，然后将它们相加。一个期望QALY就是某个结果的QALYs乘以该结果发生的概率。一个绝佳的例子是对筛查项目的评估，我们必须遵守四级预防（quaternary prevention）的原则——保护个体免受可能弊大于利的医疗干预。

想象一个项目，它有极小的概率（ $0.001$ ）能给一个人带来8个额外的QALYs。期望收益是 $0.001 \times 8.0 = 0.008$ 个QALYs。但它也有 $5\%$ 的几率引起焦虑，导致微小的QALY损失（负效用 (disutility)），比如说0.0083个QALYs，以及 $2\%$ 的几率发生轻微并发症，导致0.0012个QALY的损失。来自伤害的总期望QALY损失是这些概率加权负效用的总和。该项目的净效益则是期望收益减去期望损失。然后使用这个净期望QALY值计算ICER。这使得在潜在利益和不可避免的伤害之间进行理性权衡成为可能。

另一个现实世界的复杂因素是时间。今天获得的健康一年，与20年后获得的一年价值相同吗？大多数经济学理论认为并非如此。个人和社会倾向于偏好即时而非未来的利益，这一概念被称为时间偏好（time preference）。为了说明这一点，未来的QALYs通常会被“贴现”以计算其现值。一个常见的年贴现率约为 $3\%$ 。计算未来 $t$ 年收到的QALY的现值的公式是：

\text{Present Value} = \frac{\text{QALY}}{(1+r)^{t}}

其中 $r$ 是贴现率。贴现的影响可能是深远的。在一个20年的时间范围内，使用 $3\%$ 的贴现率，贴现后QALYs的总价值可能比未贴现的总和少约 $25\%$ 。这种做法仍然存在争议，尤其是在应用于健康领域时，但它是大多数正式经济评估中的标准组成部分。

一种工具，而非暴君：QALY的边界与伦理

在构建了这台精密的机器之后，我们现在必须退后一步，问一个至关重要的问题：它的局限性是什么？QALY是一个模型，是对现实的抽象，和所有模型一样，它有盲点。

首先，将QALY与其近亲伤残调整生命年（Disability-Adjusted Life Year, DALY）区分开来至关重要。虽然它们听起来相似，但它们的目的恰恰相反。DALY衡量的是因疾病和残疾而损失的健康；它是一个“健康差距”指标，用于量化人口的疾病负担。QALY衡量的是从干预中获得的健康；它是一个“健康效用”指标，用于评估治疗的成本效益。DALY告诉我们一个问题有多大；QALY帮助我们决定该如何应对。

QALY框架面临的最深刻的伦理挑战出现在我们考虑已有残疾的人时。设想两个救生项目，每个项目都以相同的成本将生命延长10年。一个项目服务于基线效用为 $u=0.9$ 的人群，而另一个项目服务于有稳定残疾且基線效用為 $u=0.6$ 的群體。严格的QALY计算将为第一组得出 $10 \times 0.9 = 9.0$ 个QALYs，而为第二组仅得出 $10 \times 0.6 = 6.0$ 个QALYs。一个被迫最大化QALYs的决策者将不得不优先考虑非残疾人群体，这意味着残疾人士的一年生命本质上价值较低。这是一个令人深感不安的结论，许多人认为这是歧視性的。

这不是一个可以轻易忽略的缺陷；它是对该框架公平性的根本挑战。作为回应，伦理学家和经济学家提出了有原则的调整方案。其中最连贯的一个是所获生命年价值相等（Equal Value of Life Years Gained, EVLYG）原则。该原则主张，对于仅延长生命（影响死亡率）的干预措施，获得的每一年生命都应被视为等值，计为1，无论该人的基线生活质量如何。质量加权（ $u$ ）应仅用于实际改变个人生活质量（影响发病率）的干预措施。这一修改解决了歧视风险，同时保留了QALY用于比较不同类型干预措施的逻辑结构。

QALY不是一个完美、无所不知的神谕。它是一种工具。它迫使我们明确我们的价值观和我们面临的权衡。它为原本不透明、凭直觉的决策提供了一个透明的框架。通过将成本、效益、危害和不确定性整合到一个单一、连贯的画面中，它提升了辩论的层次。但它的结果必须始终用智慧、同理心和对其伦理局限性的敏锐意识来解释。QALY没有给我们最终答案，但它为对话提供了一个宝贵且不可或缺的起点。

应用与跨学科联系

在掌握了质量调整生命年（QALY）的精巧机制后，我们现在可以踏上一段旅程，去看看它在实践中的应用。科学中一个强大概念的真正魅力不仅在于其内在的一致性，还在于它能够连接不同的世界，在曾经充满无法比较的价值的嘈杂声中提供一种共同的语言。QALY正是这样一个概念。它就像物理学家的千克或米，但是是为健康世界量身定做的——一个让我们能够衡量一片阿司匹林与一次心脏移植、一次心理治疗师的会谈与一把外科医生的手术刀影响力的标准。让我们来探讨这个简单而深刻的概念如何从个人层面到国际层面，照亮决策过程。

衡量无形之物：量化疾病负担

在解决问题之前，我们必须首先了解其严重程度。像青少年糖尿病或慢性疼痛这样的疾病每年从我们的孩子身上偷走了多少健康？我们可以计算患病人数，但这并不能告诉我们他们痛苦的深度——持续的疲劳、缺课的日子、从生活中流失的快乐。

QALY提供了一种衡量这种无形负担的方法。通过将标准化的生活质量问卷转化为通用的效用量表（其中 $1$ 为完美健康， $0$ 与死亡等同），我们可以估算一种状况造成的“效用损失”。例如，我们可以量化慢性疼痛对一群青少年的影响。如果我们知道他们生活质量得分的平均下降幅度——比如，在效用量表上从 $0.90$ 降至 $0.75$ ——我们就可以计算出整个群体一年内损失的总QALYs。这个计算将一组个人痛苦的故事转化为一个公共卫生官员可以掌握并采取行动的单一、具体的数字。它为我们提供了一张人类痛苦的地图，向我们展示了哪里需求最大，哪里我们的资源可能发挥最大作用。

医生的困境：临床微积分

QALY的力量并不仅限于庞大的人群。它可以被直接带入诊室，帮助厘清单个患者面临的选择。想象一位患者正在考虑一种治疗方法，比如更年期激素疗法，这种疗法能显著缓解日常症状，但伴随着发生严重不良事件（如血栓）的小风险。

在这里，QALY框架允许我们进行一种“个人效用演算”。在账本的一边，我们有一个近乎确定的收益：症状的消除转化为几年内生活质量的直接提升，我们可以将其计算为一个具体的QALY增益（例如，在时间 $T$ 内效用改善 $\delta$ 会产生 $\delta T$ QALYs的增益）。在另一边，我们有一个概率性风险：一个小的概率 $p$ ，会发生一个导致特定QALY损失 $L$ 的不良事件。这个风险的“期望”损失是其概率乘以其后果，即 $p \times L$ 。

通过权衡确定的QALY增益与期望的QALY损失，患者和医生可以就治疗是否对他们有意义进行更结构化的对话。它不提供神奇的答案，但它将模糊的“利弊”讨论转变为量化比较，使权衡变得明確。这是一个在利害攸关时进行清晰思考的工具。

进步的代价：评估新干预措施

QALY最广泛和最有影响力的应用或许是在卫生技术评估（HTA）领域，我们必须决定一种新的药物、设备或程序是否“值得”。新的干预措施几乎总是比旧的更有效，但也几乎总是更昂贵。我们如何决定额外的效益是否 justifies 额外的成本？

为了回答这个问题，我们使用一个极其简单的指标，称为增量成本效果比（ICER）。其定义为：

\text{ICER} = \frac{\Delta C}{\Delta E} = \frac{\text{Cost}_{\text{new}} - \text{Cost}_{\text{old}}}{\text{QALYs}_{\text{new}} - \text{QALYs}_{\text{old}}}

ICER为我们提供了一个单一的数字：每增加一个质量调整生命年的“价格”。这个比率是现代卫生经济学的基石，其应用极为广泛。

它可以用来评估一种新的外科手术与标准药物治疗的对比，一个心理健康项目与常规护理的对比，或者一个新的群体筛查策略与旧策略的对比。在每种情况下，ICER都提供了一个共同的尺度。然后，卫生系统将这个ICER与一个“支付意愿”阈值进行比较——这是一个社会共识，关于愿意为获得一年健康生命而支付的最大金额。如果ICER低于该阈值，新的干预措施就被认为是具有成本效益的。

这个框架对于 navigating 现代医学的复杂景观至关重要。它帮助我们评估用于治疗牛皮癣等慢性病的昂贵生物疗法，并指导关于尖端癌症药物的决策，这些药物可能提供几个月的高质量生命，但成本惊人。这些新的癌症疗法的ICER可能达到数十万美元每QALY，引发了关于创新价格的激烈社会辩论。分析甚至延伸到数字前沿，帮助我们评估一种能够改善中风预后的AI驱动诊断工具，是否为其许可和整合成本提供了良好的价值[@problemid:4847339]。在这些分析中，至关重要的是要记住，成本是以美元衡量的，但效益是以QALYs衡量的——这是两个根本不同的单位，绝不应混淆或不当等同。

警示之言：提出正确问题的艺术

物理学家知道，如果不了解实验的设置和局限性，实验结果就毫无意义。QALY分析也是如此。这个框架功能强大，但并非无懈可击；它是一个透镜，如果指向错误的方向，它将显示一幅扭曲的画面。

考虑对HPV疫苗的评估。如果一位分析师狭隘地只关注疫苗预防肛门生殖器疣的能力，他们会计算出某个ICER。这个计算在数学上可能是完美的，但它会产生深刻且危险的误导。为什么？因为它忽略了疫苗最大的单一好处：预防多种类型的癌症。

通过排除预防致命癌症所带来的巨大QALY收益，该分析将严重低估疫苗的真实 effectiveness。这将导致ICER分数的分母（ $\Delta E$ ）被人为地缩小，使得最终的ICER看起来比实际值大得多（从而显得“成本效益”更低）。这就像仅仅通过测试其计算器功能来评判一部现代智能手机的价值。教训是明确的：成本效益分析的有效性取决于其范围的全面性。所有相关的健康后果——無論好壞——都必须被包括在内，结果才有意义。

从计算到对话：现实世界中的QALY

QALY的旅程并不以一个计算出的数字结束。那个数字仅仅是一场对话的开始——一场在科学、经济学、伦理学和政治学交叉点上进行的复杂的、充滿价值判断的对话。不同的社会选择以截然不同的方式来构建这场对话。

在英国，国家卫生与临床优化研究所（National Institute for Health and Care Excellence, NICE）明确使用一个成本每QALY的阈值来提出关于国家医疗服务体系（National Health Service）应覆盖哪些治疗的建议。ICER被 squarely 地摆在桌面上供公众辩论。

相比之下，美国采取了不同的方法。美国医疗保险和医疗补助服务中心（Centers for Medicare & Medicaid Services, CMS）是该国最大的医疗支付方，法律禁止其在覆盖决策中使用正式的成本每QALY阈值。其任务是覆盖“合理且必要”的治疗，这是一个主要基于临床有效性证据而非成本效益的标准。

这并不意味着成本在美国被忽略，但对话不那么直接。像临床与经济评论研究所（Institute for Clinical and Economic Review, ICER）这样的独立机构会进行成本效益分析，并发布“基于价值的价格基准”，影响药品制造商和保险公司之间的谈判，但没有像NICE这样的实体的监管强制力。

这种有趣的差异表明，QALY不是一个简单的技术官僚解决方案。它是一种工具，不同文化以不同方式使用它，来处理将有限资源分配给无限健康需求的普遍且不可避免的问题。它没有消除这些选择的困难，但它使它们更透明、更明确，并最终更理性。它挑战我们超越价格标签，去问一个更深层次的问题：一个更健康的生活价值何在？我们如何共同努力，为每个人实现更多这样的生活？