try ai
科普
编辑
分享
反馈
  • 竞争风险分析

竞争风险分析

SciencePedia玻尔百科
核心要点
  • 传统的生存分析,如 Kaplan-Meier 方法,会因错误地将竞争事件视为非信息性删失而高估事件发生的概率。
  • 竞争风险分析提供两种不同的度量:用于衡量瞬时风险率的特定原因风险(CSH)和用于衡量随时间变化的绝对风险的累积发生函数(CIF)。
  • 累积发生函数(CIF)通过考虑个体可能因其他竞争事件而脱离风险池,计算出事件发生的真实、现实世界中的概率。
  • 某一事件风险的变化会影响所有其他竞争事件的累积发生率,因为它改变了风险人群的总体生存概率。
  • 该框架对于医学中的准确预后、评估公共卫生干预措施以及在肿瘤学和心脏病学等领域制定个性化治疗策略至关重要。

引言

在医学和公共卫生研究中,理解某一事件发生前的时间是一个核心目标。我们通常依赖生存分析来预测疾病复发或死亡等结局。然而,当现实中存在多种可能结局时,标准方法可能会失效。例如,一个患者可能面临移植物衰竭的风险,但同时也可能发生心脏病发作;一项公共卫生干预措施可能会减少持枪自杀事件,但个体仍然面临通过其他方式自杀的风险。这些并非孤立的可能性,而是相互竞争的命运,分析其中之一而忽略其他,可能会导致错误的结论。

本文旨在解决传统事件发生时间分析中的一个关键缺陷:竞争风险问题。被广泛使用的 Kaplan-Meier 方法将竞争事件视为简单的“删失”,常常高估事件的真实概率,从而描绘出一幅扭曲的风险图景。为了纠正这一点,我们将探讨竞争风险分析这一稳健的框架。

本次探索分为两个部分。首先,在“原理与机制”部分,我们将剖析特定原因风险和累积发生函数的核心概念,揭示它们为何能回答根本不同的问题,以及它们如何为患者的诊疗路径提供更准确的图景。其次,在“应用与跨学科联系”部分,我们将看到这些原理的实际应用,展示它们在临床决策、公共卫生政策和个性化医疗前沿中不可或缺的作用。读完本文,您将不仅理解这种方法的机制,更能领会其在一个复杂世界中提供更清晰、更真实风险理解的力量。

原理与机制

在探索世界的过程中,我们常常会简化问题。我们想象一条从原因到结果的单一路径,一条从 A 到 B 的直线。但生命,尤其是在生物学和医学领域,很少沿着单一轨道展开。它是一个充满分叉路径的景观,一个由可能性和死胡同组成的网络。要在这片景观中导航,我们需要一张更复杂的地图。这便是竞争风险分析的精髓。

单一路径的错觉

想象一下,您是一名医生,正在为一位刚接受肾移植的患者提供咨询。患者最迫切的问题简单而深刻:“我的新肾在五年内衰竭的几率有多大?”表面上看,这似乎是一个标准的事件发生时间问题。我们可以跟踪一组相似的患者,记录他们的移植物何时衰竭,并使用经典的生存分析技术,如著名的 ​​Kaplan-Meier 估计​​,来绘制随时间变化的“无移植物衰竭”生存概率曲线。

但这里有一个复杂之处。在我们这组患者中,有些人可能会死于心脏病或中风,而他们的新肾直到生命最后一刻都功能完好。我们该如何处理这些患者?传统方法可能会将他们“删失”——即视他们在其死亡时点就从研究中消失了,并假设他们发生移植物衰竭的风险与那些仍然在研究中的患者没有区别。

这就是单一路径错觉的破灭之处。死亡不同于患者搬到另一个城市而失访。死于心脏病的患者已不再有移植物衰竭的风险。他们的旅程在另一条不同的路径上结束了。忽视这一事实——将一个竞争性的终点事件视为简单的删失——是一个根本性的错误。这就像试图通过只观察仍在航行的船只,而忽略那些因无关原因沉没的船只,来计算一艘船到达目的地的几率一样。这会导致对现实的扭曲认知。

十字路口:两个基本问题

为了构建一张更好的地图,我们必须认识到,在任何时刻,患者都站在一个十字路口。对我们的移植患者而言,一条路通向移植物衰竭,另一条路通向带着功能正常的移植物死亡。竞争风险分析为我们提供了两种不同的工具来描述这些分叉路径:​​特定原因风险​​和​​累积发生函数​​。这两个概念回答了两个截然不同但同等重要的问题。

分歧的速率:特定原因风险

想象一下,您正站在一个特定的时间点,比如说移植后三年。您观察的是所有仍然存活且移植物功能正常的患者。您可能问的第一个问题是:“就在此刻,在这一瞬间,将这些患者拉向移植物衰竭路径的风险之力有多大?”这个瞬时失败率就是​​特定原因风险(Cause-Specific Hazard, CSH)​​。

形式上,对于一个特定的失败原因 kkk(如移植物衰竭),其特定原因风险 λk(t)\lambda_k(t)λk​(t) 是指在时间 ttt 之后的一个极小时间区间内,因原因 kkk 而失败的瞬时概率,前提是您到时间 ttt 为止尚未经历任何事件。

λk(t)=lim⁡Δt→0P(t≤T<t+Δt,Cause=k∣T≥t)Δt\lambda_k(t) = \lim_{\Delta t \to 0} \frac{\mathbb{P}(t \le T \lt t+\Delta t, \text{Cause}=k \mid T \ge t)}{\Delta t}λk​(t)=limΔt→0​ΔtP(t≤T<t+Δt,Cause=k∣T≥t)​

这里,TTT 是首次事件发生的时间,T≥tT \ge tT≥t 是关键条件:个体仍然“无事件”。这是一个病因学问题。它关乎疾病过程的潜在机制。临床研究者可能会问这个问题,以了解某个风险因素,如高血压,如何影响当前健康人群中发生移植物衰竭的即时风险。当我们计算这个风险时,任何经历竞争事件(如因其他原因死亡)的患者都会立即并永久地从后续所有计算的“风险”人群中移除。他们已经完全离开了这条道路。

最终目的地:累积发生率

第二个问题则不同。它不关心瞬时速率,而关心全局。 “从移植那一刻起展望未来,到五年期满时,经历过移植物衰รวจ的患者总比例是多少?”这是一个关于累积概率或​​绝对风险​​的问题。回答这个问题的函数是​​累积发生函数(Cumulative Incidence Function, CIF)​​,通常表示为 Fk(t)F_k(t)Fk​(t)。

形式上,CIF 就是在时间 ttt 前因原因 kkk 而失败的概率。

Fk(t)=P(T≤t,Cause=k)F_k(t) = \mathbb{P}(T \le t, \text{Cause}=k)Fk​(t)=P(T≤t,Cause=k)

请注意,这里没有以生存为条件。这是一个预后问题。这是大多数患者、家属和卫生系统规划者想知道的。它告诉我们一个结局在现实世界中的负担,并考虑了有些人会因竞争事件而脱离风险。所有可能事件的 CIF 之和告诉我们到时间 ttt 为止发生任何事件的总概率。

为何旧地图会让你误入歧途

现在让我们用清晰的数字来看看,为什么旧的 Kaplan-Meier 方法如此具有误导性。想象一个针对老年人的研究中的假设场景,其中患上某种疾病(事件1)的风险与因其他原因死亡(事件2)的风险相竞争。为简单起见,我们假设特定原因风险随时间恒定:疾病风险为 λ1=0.04\lambda_1 = 0.04λ1​=0.04 每年,死亡风险为 λ2=0.08\lambda_2 = 0.08λ2​=0.08 每年。我们想知道患上该疾病的5年风险。

一个幼稚的分析,将死亡视为非信息性删失,会只关注 λ1\lambda_1λ1​。估计的5年风险将是 1−exp⁡(−λ1×5)=1−exp⁡(−0.04×5)=1−exp⁡(−0.2)≈0.1811 - \exp(-\lambda_1 \times 5) = 1 - \exp(-0.04 \times 5) = 1 - \exp(-0.2) \approx 0.1811−exp(−λ1​×5)=1−exp(−0.04×5)=1−exp(−0.2)≈0.181,即 18.1%18.1\%18.1%。

但这忽略了有相当一部分人因死亡这一竞争风险而被移出风险人群。正确的方法是计算 CIF。任何事件的总风险是 λtotal=λ1+λ2=0.12\lambda_{total} = \lambda_1 + \lambda_2 = 0.12λtotal​=λ1​+λ2​=0.12。在时间 ttt 保持无事件的概率是 S(t)=exp⁡(−0.12t)S(t) = \exp(-0.12t)S(t)=exp(−0.12t)。该疾病的真实累积发生率是通过对由该生存概率加权的特定原因风险进行积分得到的:

F1(5)=∫05λ1S(u) du=∫050.04exp⁡(−0.12u) duF_1(5) = \int_0^5 \lambda_1 S(u) \, du = \int_0^5 0.04 \exp(-0.12u) \, duF1​(5)=∫05​λ1​S(u)du=∫05​0.04exp(−0.12u)du

这个积分的结果是 λ1λ1+λ2(1−exp⁡(−(λ1+λ2)×5))=0.040.12(1−exp⁡(−0.6))≈0.150\frac{\lambda_1}{\lambda_1 + \lambda_2} (1 - \exp(-(\lambda_1 + \lambda_2) \times 5)) = \frac{0.04}{0.12} (1 - \exp(-0.6)) \approx 0.150λ1​+λ2​λ1​​(1−exp(−(λ1​+λ2​)×5))=0.120.04​(1−exp(−0.6))≈0.150,即 15.0%15.0\%15.0%。

这个差异不容小觑。幼稚的方法高估了真实风险超过3个百分点。它给出了关于疾病负担的错误图景,因为它未能承认死亡“夺走”了那些本可能患上该疾病的个体。Kaplan-Meier 估计告诉你的是一个死亡不存在的虚构世界中的风险;而 CIF 告诉你的是我们实际生活的世界中的风险。

风险的微妙之舞

这让我们得出一个优美而反直觉的观点。竞争风险并非舞台上独立的演员;他们是在一场精心编排的表演中跳舞的舞者。连接它们的纽带是总体生存概率 S(t)S(t)S(t)。改变一个事件的发生率会通过整个系统产生涟漪,并影响其他事件的累积概率。

让我们回到我们的疾病例子,其中康复(λ1\lambda_1λ1​)、残疾(λ2\lambda_2λ2​)和死亡(λ3\lambda_3λ3​)是三个竞争性结局。假设我们引入一种强大的新疗法,它能显著将死亡风险 λ3\lambda_3λ3​ 减半,但对康复或残疾的风险没有直接影响。那么,五年内残疾的累积发生率 F2(5)F_2(5)F2​(5) 会发生什么变化?

我们的第一直觉可能是,什么都不会变。将人们引向残疾的“力量” λ2\lambda_2λ2​ 并未改变。但这是错误的。残疾的累积发生率由积分给出:F2(t)=∫0tλ2(u)S(u) duF_2(t) = \int_0^t \lambda_2(u) S(u) \, duF2​(t)=∫0t​λ2​(u)S(u)du。通过将死亡风险减半,我们降低了总体风险。这意味着总体生存概率 S(t)S(t)S(t) 在每个时间点都会更高。更多的人存活下来并保持无事件状态的时间更长。

由于在任何给定时间,有更多的人存活并处于发生残疾的“风险”中,最终走上残疾路径的人将会更多。因此,反直觉的是,一种降低死亡率的治疗方法反而会增加观察到的残疾累积发生率。这不是一个悖论;它深刻地展示了风险的相互关联性。你无法改变系统的一部分而不影响整体。这对公共卫生来说是一个至关重要的概念:解决一个问题可能会揭示甚至增加另一个问题的负担。

何时简单的路径是可行的?

在经历了这次复杂性之旅后,我们有理由问:简单的、单一路径的观点是否曾是正确的?答案是肯定的,但仅在特定的、明确定义的情况下。

  • ​​总体生存​​:如果您感兴趣的终点是“任何原因导致的死亡”,那么就不存在竞争风险。所有路径最终都通向这一个结局。标准的 Kaplan-Meier 分析是回答这个问题的完美工具。

  • ​​复合终点​​:在临床试验中,研究人员通常会定义一个复合终点,例如“无事件生存期”,其中事件是复发、新发恶性肿瘤或死亡的首次发生。在这种情况下,分析的不是复发的风险,而是这些事件中任何一个发生的风险。对于这个合并的终点,不存在竞争风险,Kaplan-Meier 再次成为合适的方法。

然而,一旦您将焦点缩小到该复合终点中的一个组成部分——比如只关注复发——而其他事件如死亡仍可能发生,您就回到了竞争风险的世界,我们讨论过的原则就变得至关重要。选择正确的分析工具不是要找最复杂的那个;而是要诚实地使您的工具与您问题的性质和现实的结构相匹配。

应用与跨学科联系

在上次的讨论中,我们揭示了一个关于时间和机遇的基本真理:当多种未来皆有可能时,若不考虑所有其他可能性,就无法理解其中之一的概率。事件并非在真空中发生;它为自己的发生机会而竞争。这听起来可能像一个抽象的哲学观点,但其后果却非常实际。它改变了我们预测患者未来的方式、评估公共卫生政策的方法,甚至影响我们设计下一代个性化药物。现在,让我们离开纯粹的原理世界,去看看这个理念在实践中如何运作,塑造着影响我们健康和日常生活的决策。

医生的困境:预测患者的命运

想象你是一名医生。一位50岁的患者坐在你面前,担心自己在未来五年内因心脏病发作而死亡的风险。你如何给他们一个现实的答案?你可以查阅关于心血管疾病(CVD)的研究并引用一个风险数字。但这位患者,和我们所有人一样,面临着许多风险——癌症、意外、感染。明年发生的一次致命中风,将以一种非常终极的方式,使两年后心脏病发作的风险变得毫无意义。非心血管死亡原因与心血管死亡原因处在一场持续的竞赛中。

为了给出一个真实的估计,我们必须承认这场竞赛。我们必须计算在所有其他竞争性死亡方式存在的情况下,因CVD死亡的概率。这不仅仅是学术上的吹毛求疵。利用竞争风险分析的工具,我们发现,CVD死亡的真实5年风险是CVD事件的瞬时风险的累积结果,这个结果被患者截至那一刻从所有事件中存活下来的概率不断地折现。例如,在一个大型队列中,如果CVD死亡的瞬时风险(特定原因风险)为 λcvd=0.018\lambda_{\text{cvd}} = 0.018λcvd​=0.018 每年,非CVD死亡的风险为 λnoncvd=0.012\lambda_{\text{noncvd}} = 0.012λnoncvd​=0.012 每年,那么实际的5年CVD死亡风险并不仅仅与 0.0180.0180.018 相关。它是通过对CVD风险随时间进行积分来计算的,同时考虑到仍然处于“风险中”的人群因两种原因在不断减少。

当处理面临高竞争事件率的人群(如老年人)时,这一原则变得尤为重要。考虑一位被诊断患有 Merkel 细胞癌(一种皮肤癌)的老年患者。研究者可能会天真地试图通过跟踪一组患者,并简单地将因其他原因(如中风或心力衰竭)死亡的案例视为那些患者只是“退出”了研究——这是一种被称为右删失的统计技术——来估计死于此种癌症的概率。

但这是一个逻辑上的重大错误。死于中风的患者与搬到另一城市而失访的患者在“缺失”的意义上是不同的。他们的死亡是一个确定性事件。它以确定无疑的方式告诉我们,他们死于 Merkel 细胞癌的几率现在是零。将这一信息性事件作为非信息性删失处理,违反了标准 Kaplan-Meier 生存分析的核心假设,并且总是会导致对癌症特异性死亡率的高估。竞争风险框架通过恰当地划分各种可能性来纠正这一点:患者可能死于癌症,死于其他原因,或者存活。通过这样做,它提供了一个对疾病真实负担的现实且通常较低的估计。

这场竞赛中的“事件”并不总是死亡。在肿瘤学中,一个常见的问题是,一种生长缓慢的癌症是否会转变为更具侵袭性的形式。对于患有滤泡性淋巴瘤的患者来说,未来有几种可能性:他们的疾病可能发生转化,他们可能在转化发生前因其他原因去世,或者他们可能维持现状。这些是相互竞争的命运。知道5年累积转化概率为 0.150.150.15 且5年内未发生转化而死亡的累积概率为 0.100.100.10 告诉了我们很多信息。这意味着5年后,发生某种事件的总概率是 0.15+0.10=0.250.15 + 0.10 = 0.250.15+0.10=0.25。因此,患者保持存活且未转化的概率是 1−0.25=0.751 - 0.25 = 0.751−0.25=0.75。我们也可以说,在那些确实经历了事件的人中,事件为转化的比例是 0.150.25=0.60\frac{0.15}{0.25} = 0.600.250.15​=0.60。没有将这些结局视为竞争者,就不可能达到这种细致入微的理解。

这个框架是许多高风险医疗领域的日常语言。在针对白血病的造血细胞移植中,医生会追踪患者是否出现移植物抗宿主病(GVHD)这一毁灭性并发症。但患者也面临着原发癌症复发或因治疗相关毒性而死亡的风险。这些都是竞争事件。要了解GVHD的真实风险,诊所必须计算发生GVHD的患者数量,并将其除以开始治疗的总患者数,而不仅仅是除以那些没有复发或先死的患者。这种简单而严谨的核算是在面对竞争风险时计算累积发生率的精髓。

诊所之外:公共卫生与人类行为

竞争风险的逻辑超越了单个患者,延伸到整个人群的健康,并且可以揭示关于人类行为的微妙真相。

考虑一项旨在通过推广安全存储等方式减少枪支自杀的重大公共卫生运动。假设该运动成功,枪支自杀的瞬时风险(风险率)显著下降。这是否保证了自杀总数的下降?怀疑论者可能会主张“方法替代”:即被阻止使用一种方法的人会简单地转向另一种方法。

竞争风险分析提供了以惊人的清晰度剖析这个问题的工具。让我们想象一个世界,在这个世界里,运动奏效了,枪支自杀的内在危险减少了一半。我们还为了论证而假设,其他方式自杀的内在危险完全没有改变——也就是说,没有发生行为替代。会发生什么?枪支自杀的数量如预期般骤降。但其他方式的自杀呢?意外之处就在这里:通过其他方式死亡的人的数量可能会略有增加。

这怎么可能呢?这并不是因为人们在转换方法。而是因为通过防止枪支自杀,该运动使得更多的人得以存活更长时间。通过存活,他们在更长的时间内仍然对所有其他死因“处于风险之中”,包括其他方式的自杀。其他方法自杀的累积发生率的这种微小增加,并非运动失败的标志,而是其在预防主要目标方面成功的数学回声。关键在于认识到其他方法的特定原因*风险率*保持不变,这才是衡量行为替代是否发生的真正标准。在这种情景下,最终结果是总自杀人数的大幅、挽救生命的减少。这是一个绝佳的例子,说明该框架如何保护我们免于从原始数据中得出错误结论。

类似的逻辑也适用于评估阿片类药物使用障碍的治疗方法。患者可能会被提供美沙酮(methadone)、丁丙诺啡(buprenorphine)或纳曲酮(naltrexone)。我们想知道哪种治疗方法最能预防致命的过量服用。然而,这些疗法的一个主要挑战是治疗中断。过量服用和治疗中断是相互竞争的命运。像长效纳曲酮这样的疗法,对于坚持使用的患者来说,过量服用的风险可能非常低,但它在早期也有着众所周知的高中断率。另一种疗法,如美沙酮,可能过量服用的风险率较高,但患者留存率要好得多。

哪一个更好?你不能简单地比较过量服用的风险率。纳曲酮的高中断率意味着许多患者很快就脱离了其保护作用,再次变得脆弱。竞争风险分析整合了在治疗期间过量服用的风险和中断治疗的风险。它可能会揭示一个与直觉相反的结果:一种“在治疗期间”过量服用风险稍高的疗法,实际上可能在一个真实世界的人群中导致更低的总过量发生率,因为它在让人们持续接受治疗方面做得更好。最好的治疗方法不仅仅是理论上效果最好的那一个,而是人们能够真正坚持下去的那一个。

前沿:个性化医疗与大数据

今天,我们站在一个新的前沿,竞争风险分析正在与基因组学和数据科学融合,开启个性化医疗的时代。

想象一位刚经历心脏病发作的患者。他们需要抗血小板药物来预防再次形成血栓,但这些药物也会增加大出血的风险。这里存在一个权衡。现在,再增加一层复杂性:最常用的药物氯吡格雷(clopidogrel)在携带CYP2C19基因特定变异的30%人群中效果不佳,使他们面临更高的凝血风险。另一种替代药物对所有人都有效,但出血风险略高。

我们应该怎么做?是所有人都用氯吡格雷(策略U)?还是我们进行基因测试,只给携带者使用替代药物(策略G)?竞争风险分析使我们能够精确地模拟这一选择。对于每个亚组(携带者和非携带者)和每项策略,我们可以将两个竞争事件——血栓形成和出血——的风险率相加,以找到任何不良事件的总风险率。通过计算整个人群事件概率的加权平均值,我们可以看到哪项策略能带来更好的总体结果。分析表明,尽管基因型指导的策略增加了携带者亚组的出血风险,但它在降低其凝血风险方面带来了巨大的益处,以至于人群中不良事件的总发生率下降了。我们可以量化个性化医疗策略的确切益处。

同样的逻辑也正在推动癌症治疗的突破。接受现代免疫检查点抑制剂治疗的患者面临着危及生命的免疫相关不良事件(irAEs)的风险,但他们也可能因其他原因(如癌症进展)而停止治疗。为了估计irAE的真实概率,必须使用一个恰当的竞争风险估计器,例如 Aalen-Johansen 方法。

此外,如果我们想建立一个基于患者生物标志物(如他们的肿瘤突变负荷, TMB)来预测irAE风险的模型,我们需要更复杂的工具。我们不能简单地对irAE的特定原因风险进行建模,并假设它能告诉我们关于该事件概率的全部情况。生物标志物对最终概率的影响取决于它如何影响所有竞争事件。为了直接对概率本身——即累积发生函数(CIF)——进行建模,统计学家们开发了优雅的 Fine-Gray 子分布风险模型。这个模型专门用于告诉我们像TMB这样的协变量如何影响患者最终经历irAE的机会,同时正确地考虑了各种竞争可能性的复杂网络。

最终的挑战来自于我们从少数几个生物标志物转向成千上万个,就像在基因组学(RNA-seq)数据中那样。想象一下,当非癌症死亡是一个主要的竞争风险时,试图从20,000个基因中找出哪些基因能预测患者死于癌症的风险。特征的数量(ppp)远远大于患者的数量(nnn)。这是一个“高维”问题。解决方案是新旧方法的完美结合:我们将 Fine-Gray 模型的原则性逻辑(以靶向正确的量,即CIF)与现代机器学习技术(如 LASSO 惩罚)相结合,后者可以从成千上万的潜在预测因子中筛选出少数真正重要的因子。为了确保我们最终模型的准确性,我们使用先进的验证技术,如针对删失调整的 Brier 分数,来衡量我们预测的概率与现实的匹配程度。这是绝对的前沿:将经典的生物统计学推理与高维数据科学无缝集成,而所有这一切都建立在那个简单而强大的理念之上:你必须尊重竞争。

从一个关于患者五年风险的简单问题,到从海量数据中构建基因组预测模型的复杂任务,竞争风险的原则提供了一个清晰而诚实的视角。它迫使我们看到世界并非一系列孤立的因果链,而是一个相互关联的可能性系统。通过拥抱这种复杂性,我们对生命、疾病和健康的动态获得了更真实、更强大的理解。