比例风险模型

玻尔百科

定义

比例风险模型是一类生存分析模型，它将个体的风险分为未指定的基准风险和被称为风险比的恒定相对风险乘数。该模型是医学研究中量化治疗效果和构建预后模型的核心工具，利用偏似然方法在无需估计底层基准风险的情况下评估风险因素的影响。除了预测相对风险，比例风险模型还可用于计算特定时间范围内的绝对风险，并提供诸如分层等灵活扩展手段以处理不符合比例性假设的情况。

核心要点

Cox 模型将个体的风险分为一个共同的、未指定的基线风险和一个称为风险比的恒定相对风险乘数。
其革命性的偏似然方法允许在不需要定义或估计潜在基线风险的情况下，估计风险因素的效应。
该模型是医学研究的基石，用于量化治疗效果和创建用于个性化风险评估的多变量预后模型。
核心的比例风险假设可以被检验，并且模型提供了灵活的扩展方法（如分层）来处理违规情况。
除了相对风险，该模型的框架还可用于计算特定时间范围内的绝对风险预测，例如 10 年心血管风险。

引言

在从医学到工程的许多科学领域中，关键不仅在于事件是否会发生，还在于何时发生。分析这种“事件时间”数据带来了独特的挑战，尤其是在处理现实世界的复杂性时，例如当受试者在事件发生前离开研究的这类不完整观测。核心问题是如何量化各种因素——如医疗、基因标记或生活方式选择——对这些关键生命事件发生时间的影响。

本文旨在揭开为解决此问题而设计的最优雅、应用最广泛的统计工具之一的神秘面纱：比例风险模型，其最著名的实现是 Cox 模型。您将学习到该模型如何为理解风险随时间变化的动态提供一个强大的框架。接下来的章节将引导您了解其核心概念和实际应用能力。“原理与机制”部分将解析风险函数、巧妙的比例风险假设以及使模型得以运作的偏似然魔法等基础概念。随后，“应用与跨学科联系”一章将展示该模型的巨大影响，展示其在临床试验、预后建模，乃至基因组学和人工智能前沿领域的应用。

原理与机制

想象一下听一首音乐。体验不仅仅在于弹奏了哪些音符，还在于它们何时被弹奏。节奏、速度、持续时间——这些赋予了音乐生命和意义。对生命中关键事件的研究，无论是疾病的发生、对治疗的反应，还是新技术的采用，都非常相似。这不仅仅是事件是否会发生的问题，更是其时机的问题。在统计学世界里，这就是生存分析的宏大主题。

风险的节奏：风险函数

为了讨论事件的时机，我们需要一种语言。例如，我们可以讨论在某个时间 $t$ 之前事件未发生的概率。统计学家称之为生存函数， $S(t) = \Pr(T > t)$ ，其中 $T$ 是事件发生的时间。它从 1 开始（在开始时每个人都“无事件”），并随着时间的推移优雅地下降到 0。这是一个美丽、直观的图像，但它是一个累积的图像。它告诉我们到目前为止的旅程，而不是现在正在发生什么。

为此，我们需要一个不同的、更即时的概念。想象一下汽车的速度计。它不告诉你已经行驶的总距离；它告诉你此时此刻的速度。在生存分析中，“风险速度计”是一个叫做风险函数的概念，表示为 $h(t)$ 。它代表在时间 $t$ 事件尚未发生的情况下，事件在该时刻发生的瞬时潜力。数学上，它被定义为一个速率：

h(t) = \lim_{\Delta t \to 0} \frac{\Pr(t \leq T t + \Delta t \mid T \geq t)}{\Delta t}

这可能看起来令人生畏，但想法很简单：它是事件在下一个微小时间片 $\Delta t$ 内发生的概率，再除以该时间片的长度。它本身不是一个概率——它可以大于 1——它是一个速率。高风险意味着高的即时风险。生存函数和风险函数是同一枚硬币的两面，通过微积分的语言优雅地联系在一起：时间 $t$ 的生存概率就是截至该时间累积风险的负值的指数。

比例性假设：天才之举

现在，核心问题来了：不同的因素——一种新药、一个基因标记、一种生活方式选择——如何影响这种风险的节奏？一种新疗法是立即大幅降低风险，但其效果随时间减弱？还是它提供一种稳定、持续的益处？

正是在这里，英国统计学家 Sir David Cox 提出了一个极其简单而强大的想法。1972 年，他提出了比例风险模型。他建议，一个个体的风险函数可以分为两部分：一个所有人共有的、潜在的风险节奏，以及一个基于其独特特征的个人缩放因子。

著名的Cox 模型方程如下：

h(t \mid \mathbf{x}) = h_0(t) \exp(\mathbf{x}^\top \boldsymbol{\beta})

让我们来解析这个公式。左边是在给定协变量集合 $\mathbf{x}$ （例如年龄、性别、治疗组）的情况下，特定个体在时间 $t$ 的风险。右边，我们有两个组成部分：

$h_0(t)$ ：这是基线风险。它是一个“基线”个体（即 $\mathbf{x}$ 中所有协变量都为零的个体）的风险速度计读数。这个函数可以有任何形状——它可以上升、下降或跳跃。它捕捉了事件随时间推移的自然历史。
$\exp(\mathbf{x}^\top \boldsymbol{\beta})$ ：这是个体的相对风险，通常称为风险比（HR）。它是一个单一的数字，由个体的协变量 $\mathbf{x}$ 和我们想要发现的一组系数 $\boldsymbol{\beta}$ 决定。这个数字充当一个恒定的乘数。如果你的 HR 是 2，那么你在任何时间点的瞬时风险都恰好是基线个体的两倍。如果你的 HR 是 0.5，你的风险就始终是基线个体的一半。

这就是比例风险中的“比例性”。任意取两个人，1 号和 2 号。他们的风险比率为：

\frac{h(t \mid \mathbf{x}_1)}{h(t \mid \mathbf{x}_2)} = \frac{h_0(t)\exp(\mathbf{x}_1^\top \boldsymbol{\beta})}{h_0(t)\exp(\mathbf{x}_2^\top \boldsymbol{\beta})} = \exp((\mathbf{x}_1 - \mathbf{x}_2)^\top \boldsymbol{\beta})

注意到神秘的基线风险 $h_0(t)$ 是如何被抵消的！任意两个个体之间的风险比率随时间保持恒定。他们的风险曲线可能一起上升和下降，但他们的相对风险保持不变。这就像两个跑步者即使在都加速冲向终点线时，彼此之间也保持着相同的相对速度。这是一个深刻而强大的假设。需要记住的是，这并不意味着他们的生存曲线是成比例的；实际上，关系是 $S(t|\mathbf{x}) = S_0(t)^{\exp(\mathbf{x}^\top \boldsymbol{\beta})}$ ，这意味着生存曲线会汇合或发散，但绝不会交叉。

偏似然的魔力

Cox 的模型很优美，但仍有一个难题。如果我们不知道，也不想知道基线风险 $h_0(t)$ 的形状，我们究竟如何能估计系数 $\boldsymbol{\beta}$ 呢？这似乎像是试图解一个有两个未知数的方程。真正的魔力就发生在这里。

考虑一个典型的临床研究。我们随访一组患者。有些人会经历我们感兴趣的事件。其他人可能会失访，或者研究在他们发生事件之前就结束了。后一种情况被称为右删失。我们知道他们“存活”到某个时间点，但我们不知道之后发生了什么。这并非无用信息；它至关重要。丢弃这些个体会像在解谜时扔掉线索一样，会使我们的结论产生偏倚。

Cox 的绝妙洞见是忽略事件之间的具体时间，只关注事件实际发生的时刻。想象一下，时间冻结在一个病人（我们称她为 Alice）中风的确切时刻。在这一瞬间，我们环顾研究中所有尚未中风的其他人——这个群体被称为风险集。然后 Cox 提出了一个聪明的问题：鉴于此时风险集中的某人发生了中风，这个中风者是 Alice 的概率是多少？

直观上，这个概率应该是她的“风险分数”除以风险集中所有人的风险分数之和。她在时间 $t$ 的风险（hazard）是 $h_0(t)\exp(\text{她的风险因素})$ 。风险集中的总风险是他们所有个体风险之和。所以，概率是：

P(\text{Alice fails} \mid \text{one person fails}) = \frac{h(t \mid \text{Alice's covariates})}{\sum_{j \in \text{Risk Set}} h(t \mid \text{covariates of person } j)} = \frac{h_0(t)\exp(\mathbf{x}_{\text{Alice}}^\top \boldsymbol{\beta})}{\sum_{j \in \text{Risk Set}} h_0(t)\exp(\mathbf{x}_j^\top \boldsymbol{\beta})}

奇迹就在这里：未知的基线风险 $h_0(t)$ ，作为分子中的一个因子和分母中每一项的因子，完全被抵消了！

P(\text{Alice fails} \mid \text{one person fails}) = \frac{\exp(\mathbf{x}_{\text{Alice}}^\top \boldsymbol{\beta})}{\sum_{j \in \text{Risk Set}} \exp(\mathbf{x}_j^\top \boldsymbol{\beta})}

我们得到了一个只依赖于风险集中人们的已知协变量和未知系数 $\boldsymbol{\beta}$ 的表达式。我们可以为研究中发生的每一个事件写下这样的项。通过将它们全部相乘，我们构建了所谓的偏似然。然后，我们可以使用计算机找到使该似然最大化的 $\boldsymbol{\beta}$ 值——也就是说，找到使观测到的事件序列最可能发生的那些值[@problem_gid:5189366]。我们找到了信号（ $\boldsymbol{\beta}$ ）而无需指定背景噪声（ $h_0(t)$ ）。

从数字到洞见

一旦我们有了 $\beta$ 的估计值，比如 $\hat{\beta}$ ，我们就可以计算风险比， $\text{HR} = \exp(\hat{\beta} X)$ 。对于一个比较新药（ $X=1$ ）和安慰剂（ $X=0$ ）的简单研究，HR 就是 $\exp(\hat{\beta})$ 。这个数字是解释的核心。

如果 $\text{HR} > 1$ ，药物增加了风险（它是有害的）。
如果 $\text{HR} 1$ ，药物降低了风险（它具有保护作用）。
如果 $\text{HR} = 1$ ，药物对风险没有影响。

例如，一项临床试验可能报告一种新型抗凝剂的估计 $\hat{\beta} = -0.3011$ 。风险比为 $\text{HR} = \exp(-0.3011) \approx 0.74$ 。这意味着在任何给定时间点，服用新药的患者发生中风的瞬时风险仅为接受标准治疗患者的 74%。当然，我们也会计算这个估计值的置信区间。如果 95% 的置信区间是，比如说，[0.58, 0.95]，这告诉我们，我们非常有信心真正的效果是保护性的，因为整个范围都在 1.0 以下。

压力下的优雅：一个灵活的框架

比例风险假设是模型的灵魂，但如果它错了怎么办？如果一种药物的效果确实随时间变化怎么办？Cox 模型的美妙之处在于其适应性。我们不必盲目接受这个假设；我们可以检验它。通过检查特殊类型的残差（称为 Schoenfeld 残差）的模式，或通过观察对数累积风险图，我们可以检查我们的比例性假设是否成立。

如果假设被违反，模型不会崩溃；它会调整。

分层：如果一个变量，比如患者的疾病分期，具有非比例效应，我们可以进行分层。这允许每个分期有自己独特的基线风险曲线，有效地让它们的风险剖面交叉，同时仍然为其他协变量（如正在测试的治疗）估计一个单一、统一的效应。
时依效应：我们可以通过在模型中包含一个像 treatment $\times \log(t)$ 这样的项来明确地让效应随时间变化。这将恒定的风险比转变为时变的风险比。
非线性关系：如果一个生物标志物的风险不是线性的怎么办？我们可以通过对协变量使用灵活的样条来模拟复杂的曲线关系，让数据告诉我们风险关系的形状。
竞争风险：如果患者可能经历不同类型的事件怎么办？例如，在一项癌症研究中，患者可能会出现肿瘤进展（感兴趣的事件）或死于不相关的原因（竞争风险）。我们可以调整 Cox 模型，只关注特定原因风险，这使我们能够分离驱动某一特定结果的生物学机制，而将其他结果视为删失事件。

这种非凡的灵活性，源于一个简单而深刻的想法，正是 Cox 比例风险模型五十年来一直是医学和社会科学支柱的原因。它在做出简化假设和提供工具来在需要时检查和放宽该假设之间取得了完美的平衡。虽然现代深度学习模型可以通过学习一个完全任意的时间和协变量的风险函数来提供更大的灵活性，但它们往往以牺牲风险比的优雅可解释性为代价。Cox 模型仍然是统计推理力量的证明，揭示了支配我们生命时机的、富有节奏的美丽风险之舞。

应用与跨学科联系

在了解了 Cox 比例风险模型的原理和机制之后，我们构建了一台优美的数学机器。我们理解它的齿轮和杠杆——基线风险、指数关联以及偏似然的巧妙之处。但是，一台机器的好坏取决于它能做什么。现在，我们走出工作室，进入现实世界，见证这个优雅想法的实际应用。这个模型存在于何处？它解决了哪些问题？您将看到它的影响范围极其广泛，从病床边延伸到基因组学的前沿，不仅展示了其作为统计工具的力量，也揭示了其作为理解生命、疾病和时间变化动态的透镜的威力。

问题的核心：医学与公共卫生

对于一个关于生存的模型来说，最自然的家园当然是医学。在这里，它的主要作用是回答一个最基本的问题：一种治疗是否有效，或者某个因素是否会增加风险？

想象一下，一项临床试验正在测试一种用于治疗严重呼吸系统疾病的再利用药物。患者被随机分配接受新药或安慰剂，我们随时间跟踪他们，看谁存活得更长。Cox 模型可以将这个复杂、不断展开的故事提炼成一个单一而有力的数字：风险比（HR）。如果模型返回的药物系数为 $\beta = -0.35$ ，那么风险比就是 $\exp(-0.35) \approx 0.70$ 。这意味着什么？这意味着在任何时刻，服用该药物的患者的风险——即瞬时死亡风险——仅为服用安慰剂患者的 70%。我们可以反过来说，该药物与相对风险降低 $1 - 0.70 = 0.30$ 或 30% 相关。这一个数字，源自数百名患者的命运，为药物的保护作用提供了清晰、可量化的证据。

该模型对于风险因素同样优雅有效。考虑一项关于戒烟的研究。我们可能会问：日常压力是否会使戒烟变得更难？通过跟踪刚刚戒烟的个体，我们可以对“首次复吸时间”进行建模。如果高日常压力与一个正系数相关，比如 $\beta = 0.5$ ，那么风险比就是 $\exp(0.5) \approx 1.65$ 。这告诉我们，一个人的压力分数每增加一个单位，他们复吸的瞬时风险就增加约 65%。该模型量化了压力是戒烟的巨大障碍这一直观概念，这一发现对设计吸烟者支持项目具有深远的影响。

这些简单的例子背后隐藏着模型优雅处理的巨大实际复杂性。现实世界的研究是混乱的。患者可能会搬家而“失访”，或者研究可能在所有人都发生事件之前就结束了。这被称为右删失。Cox 模型的偏似然方法是一场革命，因为它正确地利用了这些被删失个体的信息——它知道一个在失访前两年都无事件的患者确实存活了两年——而没有对之后发生的事情做出危险的假设。这种非信息性删失假设是有效生存分析的基石。

构建更丰富的图景：从单一因素到预后模型

当我们从单一的治疗或风险因素转向描绘预后的多维图景时，Cox 模型的真正威力才得以显现。像癌症这样的疾病不是由单一因素驱动的，而是多种因素共同作用的结果。

在一项关于尤文氏肉瘤（一种罕见的骨癌）的研究中，肿瘤学家想知道哪些患者风险最高。他们可以建立一个多变量 Cox 模型，其中不仅包括一个变量，而是许多变量：肿瘤是在骨盆还是在四肢？它有多大？是否已转移？化疗后有多少肿瘤坏死？模型为每个因素分配一个系数，告诉我们其对总风险的贡献权重。

也许骨盆肿瘤位置相比于四肢，其风险比为 1.42，而存在转移的风险比高达 2.18。对治疗反应良好（广泛坏死）可能具有 0.60 的保护性风险比。通过结合这些因素，模型可以为任何给定的患者计算个性化的风险评分。它允许医生看待两位患者——一位患有小的、局限性肿瘤，另一位患有大的、转移性肿瘤——并精确量化第二位患者的风险高出多少。这是现代预后建模的基础，将医学从群体平均水平推向了个性化风险分层。

从相对比率到绝对预测

到目前为止，我们谈论的都是风险比率。这是一种相对度量：“你的风险是他的两倍。”但患者和医生通常想知道一些更直接的东西：“我在未来 10 年内心脏病发作的绝对风险是多少？”这正是 Cox 模型的两部分结构——基线风险和个体风险评分——发挥作用的地方。

让我们将其与一个更简单的工具——逻辑回归——进行比较。要预测 10 年风险，你可以简单地将 10 年内发生事件的每个人编码为“1”，其他人编码为“0”，然后拟合一个逻辑模型。但这种方法丢弃了关于时间的关键信息。它将第一年心脏病发作的人和第九年发作的人同等对待。而且它错误地处理了在第五年被删失的人，将他们视为完整的 10 年幸存者。

Cox 模型要复杂得多。它对整个事件时间过程进行建模。为了得到一个 10 年绝对风险，我们需要两个要素：

患者的个人风险比， $\exp(\boldsymbol{\beta}^\top \mathbf{x})$ ，根据其特定风险因素（如胆固醇、血压等）计算得出。
10 年时的基线累积风险， $H_0(10)$ 。这代表一个具有基线特征的“普通”人在那十年中累积的总风险。

通过将这两部分相乘， $H(10|\mathbf{x}) = H_0(10) \times \exp(\boldsymbol{\beta}^\top \mathbf{x})$ ，我们得到了患者的个性化累积风险。一个简单的最终转换， $\text{Risk} = 1 - \exp(-H(10|\mathbf{x}))$ ，就给了我们 10 年的绝对风险。这个优雅的过程正确地利用了所有的事件时间信息，是全球诊所使用的主要心血管风险计算器背后的引擎。

前沿领域：从“大数据”到模型检验

Cox 模型的多功能性使其成为科学前沿不可或缺的工具，其应用远远超出了其最初的范围。随着我们收集数据能力的爆炸式增长，该模型也随之扩展。

基因组学和系统生物学： 在“大数据”时代，生物学家可以从单个患者样本中测量数千种基因、蛋白质和代谢物。Cox 模型可用于筛选这堆积如山的数据，以找到预测疾病进展的分子特征。想象一个用于心脏病的模型，它不仅包括临床因素，还将来自患者 DNA、RNA 表达和蛋白质水平的数据——整个生物学中心法则——整合到一个强大、统一的预测框架中。
影像组学和人工智能： 我们现在可以使用计算机分析医学图像（如 CT 扫描），并提取成千上万种人眼无法察觉的细微纹理和形状特征。这些“影像组学”特征可以输入到 Cox 模型中，以构建一个例如从基线扫描预测癌症复发的特征。然后可以使用一致性指数（c-index）等指标来评判模型的性能，该指标衡量模型正确地根据两位患者的生存时间对他们进行排序的概率。
自我修正的科学： 负责任地使用一个强大的工具意味着了解并检验其假设。“比例风险”假设并非理所当然；它是一个必须被检验的假说。一项治疗的效果在最初几个月和几年后真的相同吗？研究人员使用 Schoenfeld 残差检验等工具来检查这一点。该检验得出的不显著的 p 值让我们相信比例风险假设成立，从而验证了模型的结论。这种严格的自我检查实践，如在关于衰老中认知能力下降的研究中所见，是良好科学的标志，并确保模型被深思熟虑地、正确地应用。

了解局限：超越比例性的生活

尽管 Cox 模型功能强大，但其核心的比例风险假设终究只是一个假设。有时，自然界并非如此简单。如果一项手术前期风险高，但能带来长期的生存益处，该怎么办？风险比会随时间变化，从而违反了该假设。

这不是模型的失败，而是邀请我们从不同视角看待问题。其他工具，如生存树，采取了完全不同的方法。生存树不是构建一个单一的方程，而是建立一套简单的、由数据驱动的决策规则（例如，“如果年龄 > 65 且肿瘤分级 = 3...”），将患者划分到不同的风险组。每个组都有自己独特的生存曲线，它们之间没有比例性的假设。这种方法更侧重于经验性的、局部的发现，而非一个全局的、优雅的公式。

这些替代方法的存在，以及 Cox 模型本身允许时变效应的扩展，突显了一个深刻的真理。Cox 比例风险模型并非最终定论，而是在我们持续探索时间与风险动态过程中的一个关键篇章。它从一个理论上的好奇心发展成为现代数据驱动科学的基石，这一历程证明了一个单一、优美的数学思想的力量。