try ai
科普
编辑
分享
反馈
  • 归因风险

归因风险

SciencePedia玻尔百科
核心要点
  • 归因风险量化了人群中由特定暴露导致的疾病负担比例,超越了简单的关联,用以衡量影响。
  • 关键指标包括用于评估暴露者风险的暴露人群归因分数(AFe),以及用于评估总体公共健康负担的人群归因分数(PAF)。
  • 这一概念的有效性依赖于可交换性的因果假设,即非暴露组可作为暴露组的有效反事实。
  • 归因风险的原则具有普遍适用性,应用于从流行病学和法学到基因组学和气候变化归因等各个领域。

引言

一个城市的疾病有多大比例能归咎于单一污染物?肺癌病例中有多大比例是由吸烟引起的?这些问题超越了简单的相关性,直击公共健康的核心:量化影响。虽然识别风险因素是第一步,但政策制定者、临床医生和科学家需要衡量某项暴露给人群带来的实际负担,才能做出有效的决策。这正是归因风险概念旨在解决的核心问题。本文将对这个强大的框架进行全面概述。在第一部分“原理与机制”中,我们将剖析其核心计算,从简单的风险差到强大的人群归因分数,并探讨支撑这些计算的因果逻辑。随后,在“应用与跨学科联系”部分,我们将探讨真实世界的例子,从John Snow对抗霍乱的斗争,到其在法学、遗传学乃至气候科学中的现代应用,揭示归因风险在连接原因与结果方面的普遍效用。

原理与机制

想象一下,你是一座城市的首席卫生官。一种神秘的疾病正在蔓延。你的调查员们注意到了一个模式:不成比例的病患居住在旧工业运河附近。会是运河水是罪魁祸首吗?这不仅仅是一个学术问题。你的决策——是封锁运河,发起大规模清理,还是无所作为——将影响成千上万人的生命,并耗费数百万美元。你不仅需要知道运河是否危险,还需要知道它有多危险,以及最重要的是,这个城市的痛苦有多少可以归咎于它。

这就是归因风险的核心问题。它是一套工具,或者说是一种思维方式,让我们能够从简单的关联转向对公共健康影响的量化。它是将原始数据转化为拯救生命的政策的机制。要理解这个机制,我们必须从最简单的比较开始,而不是复杂的公式:一个关于两种风险的故事。

两种风险的故事:效应与影响

假设我们进行了一项研究。我们跟踪了一组暴露于某个潜在风险因素的人——我们称之为“暴露”组——以及另一组未暴露的人,即“非暴露”组。一年后,我们统计每组中有多少人患上了某种特定疾病。我们可以计算出每组的风险:暴露者的风险 (p1p_1p1​) 和非暴露者的风险 (p0p_0p0​)。

例如,在一项针对工厂工人的研究中,我们可能发现,暴露于某种溶剂的工人(p1p_1p1​)患上某种呼吸系统疾病的一年期风险为0.150.150.15,而未暴露的工人(p0p_0p0​)的风险为0.050.050.05。 我们如何比较这两个数字?有两种直接、直观的方法。

首先,我们可以将它们相减。这得到了​​风险差 (RDRDRD)​​。 RD=p1−p0=0.15−0.05=0.10RD = p_1 - p_0 = 0.15 - 0.05 = 0.10RD=p1​−p0​=0.15−0.05=0.10 这个数字有非常具体的含义:该暴露使风险额外增加了0.100.100.10。对于每100名暴露工人,相比于100名非暴露工人,我们预计在一年内会多出10个额外的疾病病例。这是一个绝对的超额风险度量。

其次,我们可以将它们相除。这得到了​​风险比 (RRRRRR)​​。 RR=p1p0=0.150.05=3RR = \frac{p_1}{p_0} = \frac{0.15}{0.05} = 3RR=p0​p1​​=0.050.15​=3 这告诉我们,暴露工人的患病可能性是非暴露工人的3倍。这是一个相对的风险度量。

请注意这里一个根本性的区别。RDRDRD是有单位的——它是一个风险,一个比例。而RRRRRR作为两个风险的比值,是一个纯粹的、无量纲的数字。 两者都至关重要,但它们讲述了不同的故事。RRRRRR为3听起来很惊人,但如果基线风险 (p0p_0p0​) 极低(比如百万分之一),那么风险的绝对增加值 (RDRDRD) 可能微不足道。反之,一个较小的RRRRRR(比如1.2)如果对应于一个非常高的基线风险,则可能意味着一个巨大的公共健康问题。

这两个度量,RDRDRD和RRRRRR,我们称之为​​效应量度​​。它们告诉我们暴露与疾病之间关系的强度。它们是系统生物学的属性。关键在于,它们不依赖于在更广泛的人群中实际有多少人暴露。但要做出真实世界的决策,我们必须考虑这一点。这就使我们从衡量效应转向衡量影响。

归责游戏:将病例归因于病因

让我们回到那位风险为p1=0.15p_1 = 0.15p1​=0.15的暴露工人。我们知道,未暴露者的基线风险仅为p0=0.05p_0 = 0.05p0​=0.05。所以,对于这位工人来说,他的总风险由两部分构成:一个任何人都可能有的0.050.050.05的“背景”风险,以及一个似乎由暴露额外增加的0.100.100.10的“超额”风险。

这个超额风险就是​​暴露人群归因风险 (AReAR_eARe​)​​。它在数值上与风险差相同,但它的名字揭示了一种新的、因果层面的雄心。 ARe=p1−p0AR_e = p_1 - p_0ARe​=p1​−p0​ 在一项假设性研究中,该值被计算为p1=0.24p_1 = 0.24p1​=0.24和p0=0.08p_0 = 0.08p0​=0.08,得出0.16。 这个0.160.160.16就是对于暴露者而言,可归因于暴露的绝对风险量。

现在我们可以问一个更强大的问题。对于一个生病的暴露者来说,他的风险中有多大比例是由于该暴露造成的?我们只需用超额风险除以总风险。这就是​​暴露人群归因分数 (AFeAF_eAFe​)​​。

AFe=超额风险总风险=p1−p0p1AF_e = \frac{\text{超额风险}}{\text{总风险}} = \frac{p_1 - p_0}{p_1}AFe​=总风险超额风险​=p1​p1​−p0​​

使用来自同一项研究的数据(p1=0.24,p0=0.08p_1 = 0.24, p_0 = 0.08p1​=0.24,p0​=0.08),计算如下: AFe=0.24−0.080.24=0.160.24=23≈0.667AF_e = \frac{0.24 - 0.08}{0.24} = \frac{0.16}{0.24} = \frac{2}{3} \approx 0.667AFe​=0.240.24−0.08​=0.240.16​=32​≈0.667

这是一个惊人的结果。它表明,对于任何一位生病的暴露工人,有三分之二的可能性,如果他们从未暴露,他们本不会生病。这个指标对于暴露的个人或工厂管理者来说非常有用。它告诉他们危险中有多少是由特定的工作环境造成的。

从个体到人群:公共卫生视角

AFeAF_eAFe​很强大,但它只讨论了暴露组。作为城市的卫生官,你关心的是整个城市。一项暴露可能风险很高(AFeAF_eAFe​高),但只影响一个微小、孤立的群体。另一项暴露可能风险仅轻度增加,但却极为普遍,比如覆盖全市的空气污染物。为了优先分配你的资源,你需要一个群体层面的视角。

你整个群体的总体风险ppp,是暴露和非暴露亚组风险的加权平均。如果你的人群中有30%30\%30%是暴露的,那么: p=(0.30×p1)+(0.70×p0)p = (0.30 \times p_1) + (0.70 \times p_0)p=(0.30×p1​)+(0.70×p0​)

这个总体风险ppp,是你当前在城市医院中观察到的。如果你能神奇地完全消除这项暴露,最好的情况是城市里的每个人都只经历背景风险p0p_0p0​。当前现实与这个理想世界之间的差异就是​​人群归因风险 (PAR)​​。

PAR=p−p0PAR = p - p_0PAR=p−p0​

这告诉你,如果该暴露被移除,你整个群体的风险绝对会降低多少。例如,在一项针对农药施用者的研究中,总体风险为0.13750.13750.1375,背景风险为0.100.100.10,则PAR为0.03750.03750.0375。消除农药暴露将在总队列中每1000人中预防约38个病例。

就像我们对暴露组所做的那样,我们可以将这个绝对数值转化为一个比例。在整个城市的所有病例中,有多大比例可归因于该暴露?这就是​​人群归因分数 (PAF)​​,公共健康影响量度中的皇冠上的明珠。

PAF=人群超额风险人群总风险=p−p0pPAF = \frac{\text{人群超额风险}}{\text{人群总风险}} = \frac{p - p_0}{p}PAF=人群总风险人群超额风险​=pp−p0​​

让我们使用我们其中一个问题中的空气污染物例子。该城市的总体风险 (ppp) 为0.0090.0090.009,没有污染物时的风险 (p0p_0p0​) 为0.0050.0050.005。PAF为: PAF=0.009−0.0050.009=0.0040.009≈0.444PAF = \frac{0.009 - 0.005}{0.009} = \frac{0.004}{0.009} \approx 0.444PAF=0.0090.009−0.005​=0.0090.004​≈0.444 这意味着城市中高达44.4%44.4\%44.4%的呼吸系统病例可以归咎于这单一的污染物。这个数字就是你要带到市政厅去的。它为一个全市范围的法规提供了正当理由,因为它关系到整个社区的负担。请注意PAF如何同时依赖于风险比和暴露的普遍率。如果暴露变得更普遍,即使潜在的危险 (RRRRRR) 保持不变,PAF也会上升。

有时,我们无法消除一项暴露,只能减少它。同样的逻辑也适用。我们可以计算一个​​广义影响分数 (GIF)​​,它告诉我们,如果我们将暴露普遍率从30%30\%30%降低到10%10\%10%,病例的比例会减少多少。 这就是公共卫生的现实演算。当我们有一个有益的暴露,比如疫苗,逻辑就会反过来。我们计算“预防分数”和​​需治数 (NNT)​​——你需要为多少人接种疫苗才能预防一例疾病。

点金石:“因果”的真正含义

在整个讨论中,我们使用了诸如“归咎于”、“由于”和“可归因于”等带有感情色彩的词语。但我们凭什么这么说?我们所做的只是对一些观察到的数字进行减法和除法。这里我们触及了问题的哲学核心。

神奇的成分是一个叫做​​可交换性​​的假设。 想象两个平行宇宙。在宇宙1中,你暴露于该溶剂。在宇宙2中,你没有。你在宇宙1中的健康结局是Y1Y^1Y1,在宇宙2中是Y0Y^0Y0。溶剂对你的真正因果效应是Y1Y^1Y1和Y0Y^0Y0之间的差异。但可惜的是,你只能生活在一个宇宙中;我们永远无法观察到同一个人的两种潜在结局。

这就是因果推断的基本问题。那么我们如何解决它呢?我们使用群体。我们假设我们的非暴露组能够很好地代表暴露组在未暴露情况下的状态。我们假设这两个群体在平均水平上是可交换的。一个设计良好的随机对照试验强制实现了这一点。在观察性研究中,我们尝试通过仔细的统计调整来达到这个目的。

当我们假设可交换性时,非暴露组的风险p0p_0p0​就成为我们对反事实风险E[Y0∣A=1]E[Y^0 \mid A=1]E[Y0∣A=1]的最佳猜测——即暴露组在未暴露情况下的平均风险。现在我们简单的公式获得了它们的因果力量。风险差p1−p0p_1 - p_0p1​−p0​成为了E[Y1−Y0∣A=1]E[Y^1 - Y^0 \mid A=1]E[Y1−Y0∣A=1]的估计值,即暴露人群的平均因果效应。

这个框架也澄清了一个微妙但至关重要的区别。我们可以提出两个主要的“群体层面”的因果问题。

  1. ​​人群归因风险 (PAR=E[Y]−E[Y0]PAR = E[Y] - E[Y^0]PAR=E[Y]−E[Y0]):​​ 我们当前的现实与一个没有暴露的完美世界相比如何?这取决于当前暴露的普遍程度。
  2. ​​人群风险差 (PRD=E[Y1]−E[Y0]PRD = E[Y^1] - E[Y^0]PRD=E[Y1]−E[Y0]):​​ 这个暴露的总可能影响是什么?一个所有人暴露的世界与一个无人暴露的世界会有多大不同?这是一个关于暴露生物学效力的“纯粹”度量,与其当前的普遍率无关。

理解这种差异是关键:PRD是毒物固有的属性,而PAR则告诉你这种毒物今天在你的城市造成了多大的麻烦。

原因的交响曲:复杂世界中的风险

当然,世界很少如此简单。如果有两种暴露,比如吸烟 (AAA) 和石棉暴露 (BBB) 同时存在,情况会怎样?我们不能简单地将它们的效果相加。它们可能会相互作用,产生一个远大于各部分之和的综合风险。

我们这个优雅的框架可以处理这种情况。我们可以对一个同时暴露于两者的人的总超额风险进行划分。一部分仅归因于吸烟,一部分仅归因于石棉,还有一个关键的第三部分归因于它们之间的​​交互作用​​。 我们可以计算​​交互作用所致相对超额风险 (RERI)​​,这是一个隔离这种协同效应的度量。然后,我们可以对双重暴露者的归因分数,甚至对人群归因分数进行同样的划分。我们可以告诉市议会:“在我们所有的肺癌病例中,21%21\%21%是由于吸烟的主效应,13%13\%13%是由于石棉的主效应,另外还有15%15\%15%是特别由于这两者的致命组合造成的。”

这就是归因风险概念的美妙和统一之处。它始于比较两个数字的简单行为。但通过仔细定义我们的问题并坦诚我们的假设,我们建立了一个强大的逻辑结构。这个结构使我们能够审视一个患病的人群,解开复杂的因果网络,并为那个最重要的问题赋予一个数字:这些痛苦中有多少是我们可以预防的?

应用与跨学科联系

我们已经探讨了归因风险的原理和机制,学习了它的定义以及如何计算它的各种形式。但一个工具的好坏取决于它能解决的问题。现在,我们离开公式的整洁世界,进入混乱、复杂而又迷人的现实世界。在这里我们将看到,这套简单的思想不仅仅是统计上的奇闻,而是一个理解和改变我们世界的强大透镜——从医学和法律到我们的遗传密码,甚至地球的气候。它是一个统一的概念,让我们能够提出,并常常回答那个最基本的问题之一:“这个结果有多大程度是由那个暴露引起的?”

泵柄中的幽灵:一个想法的诞生

我们的故事始于1854年伦敦烟雾弥漫的街道,当时正值一场可怕的霍乱爆发。虽然当时流行的理论将其归咎于“瘴气”或污浊的空气,但一位名叫John Snow的医生有不同的看法。他怀疑是水的问题。通过艰苦的侦查工作,他绘制了死亡病例的地图,并注意到在宽街(Broad Street)水泵周围出现了令人不寒而栗的聚集现象。他识别出了一个“暴露”群体——那些从这个水泵饮水的人——和一个“非暴露”群体——那些从别处获取水的人。

让我们用现代的视角,使用当时一项类似的自然实验数据来审视这个问题。Southwark and Vauxhall公司从泰晤士河抽取受污染的水,而Lambeth公司则使用更清洁的上游水源。

  • 由受污染的Southwark and Vauxhall公司供水的家庭(“暴露者”)死于霍乱的风险为RE=140R_{E} = \frac{1}{40}RE​=401​。
  • 由更清洁的Lambeth公司供水的家庭(“非暴露者”)的风险为RU=1300R_{U} = \frac{1}{300}RU​=3001​。

​​风险差​​,RD=RE−RURD = R_{E} - R_{U}RD=RE​−RU​,为13600\frac{13}{600}60013​。这个数字不仅仅是一个抽象概念;它是量化了的、萦绕在受污染水源中的霍乱死亡的“幽灵”。它告诉我们,每600个饮用脏水的人中,就发生了13例本可通过饮用清洁水而避免的超额死亡。​​风险比​​,RR=RE/RURR = R_{E} / R_{U}RR=RE​/RU​,达到了惊人的7.57.57.5,意味着风险高出7.5倍。

最有力的是,我们可以计算​​人群归因分数(PAFPAFPAF)​​。对于由这两家公司共同供水的总人口,惊人地有2633\frac{26}{33}3326​(约79%79\%79%)的霍乱死亡可归因于受污染的水源。通过简单地移走宽街水泵的泵柄,John Snow不只是在进行一个象征性的行为;他一举证明了通过移除单一暴露源来消除绝大多数疾病负担的原则。这就是现代流行病学的诞生。

从工作场所到子宫:归因风险在现代医学中的应用

John Snow用来对抗霍乱的逻辑,现在已成为现代公共卫生和临床实践的基石。它帮助我们识别危害,为患者选择提供信息,并使医疗保健更安全。

想象一个工厂,引入了一种新的粘合剂后不久,工人们开始出现湿疹性皮炎。是这种粘合剂的错吗?通过比较暴露工人的发病率(Rexposed=0.15R_{exposed} = 0.15Rexposed​=0.15)与非暴露的行政人员的发病率(Runexposed=0.05R_{unexposed} = 0.05Runexposed​=0.05),我们发现风险差为0.100.100.10。但对工人们来说,更有说服力的数字是​​暴露人群归因分数​​,AFe=Rexposed−RunexposedRexposed=0.100.15≈0.67AF_{e} = \frac{R_{exposed} - R_{unexposed}}{R_{exposed}} = \frac{0.10}{0.15} \approx 0.67AFe​=Rexposed​Rexposed​−Runexposed​​=0.150.10​≈0.67。这可以转化为一个强有力的陈述:“对于三分之二患有这种痛苦皮疹的工人来说,粘合剂是病因。”这不是一个学术练习;这是用来要求更安全工作条件、证明为预防肌肉骨骼损伤而购买人体工程学辅助设备的成本合理性,以及追究雇主责任的证据。

在临床医学中,这些问题变得更加个人化和微妙。考虑一位孕妇决定是否接受像羊膜穿刺术这样的侵入性产前检查。她想知道这个操作本身导致流产的风险——这是一种由医疗干预引起的伤害,称为医源性风险。要回答这个问题,我们必须极其小心。我们计算风险差,比较接受该操作的女性与一个匹配的未接受操作的群体的流产率。但只有当两组的“风险”时钟在完全相同的胎龄开始计时时,这种比较才是公平的,因为自然流产的背景风险每周都在变化。我们还必须严格定义我们的结局:我们只计算自然流产,而不包括因检查信息而导致的选择性终止妊娠。结果是一个归因风险,可能只有百分之零点几,但对于一个做出知情选择的准父母来说,这是世界上最重要的数字之一。

从个体伤害到公共政策

归因风险为影响数百万生命的政策提供了定量支柱,弥合了科学证据、法律正义和公共卫生战略之间的鸿沟。

在法庭上,归因风险可以成为伸张正义的工具。想象一下,一个暴露于某种溶剂的工人群体患上一种呼吸系统疾病的比率为pexposed=0.03p_{\text{exposed}} = 0.03pexposed​=0.03,而未暴露的工人患病率为punexposed=0.01p_{\text{unexposed}} = 0.01punexposed​=0.01。被告律师可能会辩称,这种疾病无论如何都会发生。但原告专家可以计算出在一个暴露个体中,由暴露引起的风险比例:这就是暴露人群归因分数,pexposed−punexposedpexposed=0.03−0.010.03=23\frac{p_{\text{exposed}} - p_{\text{unexposed}}}{p_{\text{exposed}}} = \frac{0.03 - 0.01}{0.03} = \frac{2}{3}pexposed​pexposed​−punexposed​​=0.030.03−0.01​=32​。这个在法律背景下被称为“因果关系概率”的值表明,对于任何一位患病工人,他们的疾病有三分之二的概率是由该溶剂引起的。这为分摊损害赔偿提供了理性的、科学的基础。

更强大的是,这些概念使我们能够展望未来并设计有效的干预措施。假设公共卫生官员希望遏制艾滋病病毒的传播。他们知道,其他有症状的性传播感染(STI)引起的炎症会使艾滋病病毒更容易传播(风险比 RR>1RR \gt 1RR>1)。一个提供治疗以缩短这些其他STI持续时间的项目会产生什么影响?通过模拟干预措施如何降低风险因素(有症状的STI)的总体流行率,我们可以计算出一个新的、更低的因这些合并感染所致的艾滋病人群归因分数。PAF的降低量化了该项目将预防的新增艾滋病病例的比例,从而使政策制定者能够进行成本效益分析,并将资源投向能拯救最多生命的地方。

基因彩票:我们DNA中的归因风险

追溯疾病到水泵或化学溶剂的逻辑,同样可以用来追溯到我们自己遗传密码的字母。

在基因组学时代,科学家们进行全基因组关联研究(GWAS)以寻找与疾病相关的基因变异。考虑一个与克罗恩病相关的ATG16L1基因变异。这个风险等位基因的单个拷贝可能只会使一个人的患病几率适度增加,比如说比值比为OR=1.5OR = 1.5OR=1.5。但如果这个等位基因在人群中非常常见,它的总体影响可能是巨大的。通过使用等位基因频率作为“暴露流行率”,我们可以计算人群归因分数。我们可能会发现,这一个看似微不足道的遗传因素,却对人群中5−10%5-10\%5−10%的克罗恩病病例负责,从而使其成为新疗法的主要靶点。

这种方法在个性化医疗中得到了极致的体现。艾滋病药物阿巴卡韦和基因变异HLA-B*57:01\text{HLA-B*57:01}HLA-B*57:01的故事是现代医学的一大胜利。在携带这种变异的个体中,该药物可引起危及生命的超敏反应;其相对风险巨大(RR>40RR \gt 40RR>40)。在这个亚组中,归因分数接近100%100\%100%。而对于其他人来说,该药物是安全有效的。计算总体PAF显示,这一个基因就解释了所有此类不良反应的80%80\%80%以上。结论是显而易见的,并已成为标准医疗实践:在开具药物前进行基因筛查。在这里,归因风险从描述人群转向保护特定个体,通过理解他们独特的基因彩票来拯救生命。

归因风暴:一种普适逻辑

一个在伦敦街头锻造出的概念,能帮助我们理解我们时代最大的挑战吗?我们能将一场特定的热浪或洪水归因于气候变化吗?令人惊讶的是,答案是肯定的。其逻辑完全相同。

气候科学家们进行大规模的计算机实验来解开这个难题。他们创造了两个虚拟的地球。一个是我们的事实世界,包含我们排放的所有人为温室气体(“暴露”组)。另一个是反事实世界,一个从未发生过工业革命、只有自然气候强迫的世界(“非暴露”组)。通过为每个世界运行数千次模拟,他们可以计算出在每种情景下发生极端事件(如破纪录的热浪)的概率。

  • P1(E)P_1(E)P1​(E) 是在有气候变化的世界中发生热浪的概率。
  • P0(E)P_0(E)P0​(E) 是在没有气候变化的世界中发生热浪的概率。

然后科学家们计算​​归因风险分数 (FAR)​​: FAR=P1(E)−P0(E)P1(E)=1−P0(E)P1(E)FAR = \frac{P_1(E) - P_0(E)}{P_1(E)} = 1 - \frac{P_0(E)}{P_1(E)}FAR=P1​(E)P1​(E)−P0​(E)​=1−P1​(E)P0​(E)​ 这与暴露人群归因分数的公式完全一样!它回答了这个问题:“在我们当前气候下发生这次热浪的风险中,有多大比例是由于人类活动造成的?”这一惊人的相似之处揭示了归因风险深邃的美感和统一性。它是一种因果推理的基本工具,同样适用于评估一个病人、一个群体,乃至整个星球。从泵柄中的幽灵到未来风暴的热浪,它提供了一种清晰、量化的语言来连接因果,使我们不仅能理解世界,更能创造一个更美好的世界。