try ai
科普
编辑
分享
反馈
  • 人群归因分值

人群归因分值

SciencePedia玻尔百科
核心要点
  • 人群归因分值(PAF)量化了整个人群中可归因于特定风险因素的疾病病例所占的比例。
  • 一个风险因素对人群的总体影响取决于其效力(相对风险)与在社区中的流行率之间的相互作用。
  • 与个体风险衡量指标不同,PAF提供了一个人群层面的视角,这对于确定公共卫生干预措施的优先次序和资源分配至关重要。
  • PAF可以跨学科应用,将遗传标记、环境暴露和社会结构与人群健康结果联系起来。

引言

在公共卫生这个复杂领域,决策者面临着一个持续的挑战:在资源有限的情况下,应将精力集中在何处,才能对社区的福祉产生最大影响?比较各种不同的威胁——从不良饮食等普遍习惯到罕见的遗传易感性——需要一个标准化的衡量指标来评估它们在人群层面的影响。人群归因分值(PAF)正是提供了这样一种基本工具,它将复杂的风险数据转化为一个单一而有力的度量标准,用以估算如果某个特定风险因素被移除,可以消除的疾病比例。本文旨在揭开PAF的神秘面纱,为其逻辑和功能提供一份清晰的指南。首先,“原理与机制”一章将分解其核心概念,解释PAF的计算方法,以及它如何巧妙地将风险的强度与其流行率结合起来。随后,“应用与跨学科联系”一章将探讨真实世界的例子,展示PAF如何被用来揭示疾病原因、指导政策,甚至量化社会不公。

原理与机制

设想您是一座大城市的卫生专员。您的办公桌上堆满了关于各种公共卫生威胁的报告:空气污染、吸烟、不良饮食、职业危害。每份报告都充斥着大量的数字——风险、率和比。您的预算有限,时间也有限。您如何决定将精力集中在何处,才能为最多的人带来最大的益处?这不仅仅是一个管理问题,更是一个深刻的科学问题,是公共卫生的核心所在。为了回答这个问题,我们需要一个工具,一种能够权衡和比较不同危险的思维方式,不仅要看它们对个体的危害程度,还要看它们对整个社区的总影响。这个工具就是​​人群归因分值​​(​​Population Attributable Fraction​​),简称​​PAF​​。

两种风险的故事:个体与人群

让我们从一个简单的观察开始。风险的故事可以在两种不同的尺度上讲述。首先,是个体的故事。吸烟者患肺癌的可能性比不吸烟者要高。我们可以使用​​相对风险​​(RRRRRR)等指标来量化个体面临的这种增加的风险,它告诉我们暴露者的风险是不暴露者的多少倍;或者使用​​风险差​​(RDRDRD),它告诉我们他们面临的绝对超额风险。这是医生在给病人提供建议时可能采取的视角。

但是,公共卫生专员必须采取不同的视角。您关心的是整个城市的健康状况——这是一个由个体组成的马赛克,有些人暴露于风险因素,有些人则没有。您所在城市的总体风险是一种混合体,是这两个群体风险的加权平均值。假设暴露者的发病风险为 R1R_1R1​,非暴露者的发病风险为 R0R_0R0​。如果人群中有一部分比例(我们称之为流行率 pep_epe​)的人暴露于风险因素,那么剩下的一部分比例 1−pe1-p_e1−pe​ 的人则没有。整个群体的总体风险 RpR_pRp​ 就可以用一个优美而简单的混合公式来表示:

Rp=peR1+(1−pe)R0R_p = p_e R_1 + (1 - p_e) R_0Rp​=pe​R1​+(1−pe​)R0​

把它想象成混合两罐油漆。如果您有一罐深红色的油漆(R1R_1R1​)和一罐白色的油漆(R0R_0R0​),最终的颜色(RpR_pRp​)不仅取决于红白两色的深浅,还取决于您往桶里倒了多少(流行率 pep_epe​)。在一加仑的白漆中滴入一小滴红漆,即使红色很深,也不会对颜色产生太大改变。这个简单的想法是接下来所有内容的基础。

“假如”的力量:量化可预防的负担

这才是真正神奇之处的开始。我们可以利用对人群风险的理解来提出一个强有力的反事实问题:“如果这个风险因素从未存在过会怎样?”如果我们能挥动魔杖,将这种暴露从我们的城市中彻底消除,会发生什么?

在这个假设的、无暴露的世界里,人群中的每个人都将经历非暴露者的基线风险 R0R_0R0​。城市的总体风险将从目前的水平 RpR_pRp​ 下降到这个新的、更低的水平 R0R_0R0​。现状与可能之间的差异,就代表了可归因于该暴露的总疾病负担。从这一个想法中,衍生出两个关键的衡量指标。

首先,我们有​​人群归因风险​​(PARPARPAR)。这是整个人群风险率的绝对差异:

PAR=Rp−R0PAR = R_p - R_0PAR=Rp​−R0​

将我们的混合公式代入 RpR_pRp​,我们可以看到一些非凡的东西:

PAR=(peR1+(1−pe)R0)−R0=peR1+R0−peR0−R0=pe(R1−R0)PAR = (p_e R_1 + (1 - p_e) R_0) - R_0 = p_e R_1 + R_0 - p_e R_0 - R_0 = p_e(R_1 - R_0)PAR=(pe​R1​+(1−pe​)R0​)−R0​=pe​R1​+R0​−pe​R0​−R0​=pe​(R1​−R0​)

PARPARPAR 就是个体的风险差(R1−R0R_1 - R_0R1​−R0​)乘以暴露的普遍程度(pep_epe​)。它告诉我们分布在整个人群中的绝对超额风险量。

其次,也是可能更直观的,我们有​​人群归因分值​​(PAFPAFPAF)。这个指标告诉我们,人群中总的疾病风险有多大比例或部分是由于该暴露造成的。为了计算它,我们将归因风险(PARPARPAR)除以总的人群风险(RpR_pRp​):

PAF=PARRp=Rp−R0RpPAF = \frac{PAR}{R_p} = \frac{R_p - R_0}{R_p}PAF=Rp​PAR​=Rp​Rp​−R0​​

这个值通常以百分比表示,直接回答了卫生专员的问题:“在我们城市看到的所有该疾病病例中,如果我们消除了这一个特定的暴露,本可以预防的病例百分比是多少?”。例如,吸烟与肺癌的 PAFPAFPAF 为 0.440.440.44,意味着人群中所有肺癌病例的 44%44\%44% 可归因于吸烟。

危害的衡量:流行率与效力的交汇

从这个框架中得出的最深刻的见解之一是,一个危害对人群的影响并不仅仅取决于它对个体的危险程度。相反,它是其​​效力​​(其效应的强度,通常用 RRRRRR 衡量)和其​​流行率​​(其普遍程度,pep_epe​)的结合。

让我们想象两个不同城市中的两种不同危害,就像一个经典的流行病学难题一样。

  • 在A市,危害X很罕见,只影响了 10%10\%10% 的人口(pe=0.10p_e = 0.10pe​=0.10)。
  • 在B市,危害Y很常见,影响了 50%50\%50% 的人口(pe=0.50p_e = 0.50pe​=0.50)。

对于任何暴露的个体来说,这两种危害的效力是相同的:它们都使个体的患病风险增加一倍(RR=2RR=2RR=2)。从个体的角度来看,它们是相同的。但从人群的角度来看呢?

使用一个稍作调整的、PAFPAFPAF 的公式,该公式使用了相对风险,我们可以清楚地看到差异:

PAF=pe(RR−1)1+pe(RR−1)PAF = \frac{p_e(RR - 1)}{1 + p_e(RR - 1)}PAF=1+pe​(RR−1)pe​(RR−1)​

对于A市(罕见但效力强的危害): PAFA=0.10(2−1)1+0.10(2−1)=0.101.10≈0.091, or 9.1%PAF_A = \frac{0.10(2 - 1)}{1 + 0.10(2 - 1)} = \frac{0.10}{1.10} \approx 0.091 \text{, or } 9.1\%PAFA​=1+0.10(2−1)0.10(2−1)​=1.100.10​≈0.091, or 9.1%

对于B市(常见且效力相同的危害): PAFB=0.50(2−1)1+0.50(2−1)=0.501.50≈0.333, or 33.3%PAF_B = \frac{0.50(2 - 1)}{1 + 0.50(2 - 1)} = \frac{0.50}{1.50} \approx 0.333 \text{, or } 33.3\%PAFB​=1+0.50(2−1)0.50(2−1)​=1.500.50​≈0.333, or 33.3%

结果是惊人的。尽管两种危害对暴露个体的危险程度相同,但危害Y在其所在城市造成了超过三分之一的疾病病例,而危害X造成的病例不到十分之一。为什么?因为它的影响虽然不更强,但作用于了更大部分的人群。一个微弱但非常普遍的风险因素(如久坐不动的生活方式)可能比一个非常强烈但极其罕见的风险因素(如暴露于某种特定的工业化学品)具有更大的群体负担。PAFPAFPAF 巧妙地捕捉了流行率和效力之间这种至关重要的相互作用。

区分参与者:风险分值实地指南

将人群的故事与个体的故事混淆是万万不可的。这引出了一个重要的区别。

​​暴露人群归因分值​​(AFEAFEAFE)提出了一个截然不同的问题:“对于一个暴露者来说,其个人风险有多大比例是由于该暴露造成的?”。其公式为:

AFE=R1−R0R1=RR−1RRAFE = \frac{R_1 - R_0}{R_1} = \frac{RR - 1}{RR}AFE=R1​R1​−R0​​=RRRR−1​

请注意,这里完全没有流行率(pep_epe​)的踪影。AFEAFEAFE 仅取决于暴露的效力(RRRRRR)。在我们两个城市的例子中,危害X和危害Y的 AFEAFEAFE 是相同的:(2−1)/2=0.50(2-1)/2 = 0.50(2−1)/2=0.50,即 50%50\%50%。这告诉医生,他们遇到的任何暴露患者,其风险的一半来自于该暴露。

  • ​​AFE​​ 是针对暴露个体的临床衡量指标。
  • ​​PAF​​ 是针对整个人群的公共卫生衡量指标。

无法区分它们,就像混淆了对单艘船的天气预报(“你有50%的几率会遇到巨浪”)与对整个船队的报告(“在整个船队中,巨浪将造成今天所有损失的9%”)。

从分值到面孔:归因人数

分数和百分比仍然是抽象的。公共卫生的最终目标是预防真实的人群中出现真实的疾病病例。这就是我们将分数转化为面孔的地方。通过计算人群归因风险(PARPARPAR)——即整个人群的绝对超额风险——并将其乘以总人数(NNN),我们得到​​归因人数​​(ANANAN)。

AN=N×PAR=N×(Rp−R0)AN = N \times PAR = N \times (R_p - R_0)AN=N×PAR=N×(Rp​−R0​)

这个数字代表在给定时期内因暴露而患病的总人数。例如,在一项关于一个百万人口城市中医疗成像辐射暴露的研究中,计算出的 PARPARPAR 为 0.00250.00250.0025 可能看起来很小。但是当我们计算归因人数时,我们发现 AN=1,000,000×0.0025=2,500AN = 1,000,000 \times 0.0025 = 2,500AN=1,000,000×0.0025=2,500 例。这不是一个抽象的百分比;这是2,500个受影响的生命。这个数字真正指导着资源分配,告诉卫生专员一个成功的预防项目可以避免数千例癌症病例,从而证明了在人员、设备和公众意识宣传方面的投资是合理的。

警示之言:单一数字的局限性

最后,我们必须认识到,虽然 PAFPAFPAF 很强大,但没有哪个单一的数字能说明全部问题。想象一下,社区X和社区Y有完全相同的暴露流行率(pep_epe​)和相同的相对风险(RRRRRR)。它们的 PAFPAFPAF 值将是相同的。这是否意味着预防项目在两个社区中具有同等价值?

不一定。假设社区X的疾病基线风险(R0R_0R0​)很高,而社区Y的基线风险很低。即使 RRRRRR 相同,社区X的绝对风险差(RD=R1−R0RD = R_1 - R_0RD=R1​−R0​)也会大得多。由于可预防病例数是由绝对风险降低量(AN=N×pe×RDAN = N \times p_e \times RDAN=N×pe​×RD)驱动的,社区X的干预措施将预防更多的实际疾病病例。仅仅依赖 PAFPAFPAF 会产生误导。

真正明智的公共卫生策略师会理解整个指标仪表盘。他们使用像 PAFPAFPAF 和 RRRRRR 这样的相对指标来理解负担的比例和关联的强度。但他们也使用像 PARPARPAR、RDRDRD 和 ANANAN 这样的绝对指标来掌握干预措施具体的、真实世界的影响。流行病学的美妙之处不在于单一的魔法公式,而在于当我们通过这些不同但互补的视角看待问题时所浮现出的微妙故事。

应用与跨学科联系

现在我们已经摸清了人群归因分值(PAFPAFPAF)这个引擎的原理并了解了它的工作方式,让我们开上它去兜兜风。这个巧妙的工具会带我们去向何方?您会发现,PAFPAFPAF 不仅仅是一个公式,它还是一个镜头,一种看待健康与疾病世界的新方式。它让我们能够从“为什么这个人会生病?”这个问题,转向更宏大的问题:“塑造我们整个社会健康的背后力量是什么?” 在这个旅程中,我们将看到,从我们DNA的细微变化到我们社区广阔而无形的结构,同一个优雅的原则统一了我们对所有事物的理解。

公共卫生领域的伟大侦探故事

每个领域都有其经典的发现故事,而在公共卫生领域,许多最伟大的侦探故事都取决于 PAFPAFPAF 提供的线索。其中最著名的就是针对烟草的案例。几十年来,医生们注意到吸烟与各种癌症之间存在着密切的联系。在个体层面上,证据是明确的:吸烟者患肺癌或口腔癌的风险远高于不吸烟者。但对于公共卫生而言,关键问题在于规模。人群的癌症负担中有多少是由这一个习惯造成的?

通过将吸烟者的癌症相对风险与人群中的吸烟流行率相结合,流行病学家可以计算出 PAFPAFPAF。在历史上可信的情景中,当吸烟流行率约为 0.250.250.25,口腔癌的相对风险高达惊人的 3.53.53.5 时,PAFPAFPAF 的计算结果超过 0.380.380.38。想想这意味着什么:整个人群中超过三分之一的口腔癌病例都归因于吸烟。这不仅仅是一个“风险因素”;它是主要的元凶。这个单一的数字改变了整个辩论。它为决策者提供了一个清晰、量化的估计,即如果能够控制吸烟,可以赢得怎样的回报。PAFPAFPAF 将一个临床观察转变为一项公共行动指令,从而启动了大规模的反吸烟运动,这些运动已经拯救了数百万人的生命。

小风险的悖论

这里有一个 PAFPAFPAF 帮助我们解决的绝妙难题。想象一个风险因素,坦率地说,并不那么可怕。比方说,暴露于该因素只会使您患某种疾病的个人风险增加区区10%,相对风险(RRRRRR)为 1.101.101.10。您可能会不屑一顾地说:“嗯,那还不算太糟。我愿意冒这个险。” 这正是我们在思考人群问题时,专注于个体危险的直觉可能误导我们的地方。

考虑环境细颗粒物污染(PM2.52.52.5)及其与动脉粥样硬化(动脉硬化)的联系。与长期暴露相关的相对风险适中,可能就在那个 1.101.101.10 左右。但问题在于:在许多城市环境中,暴露的流行率非常高——假设80%的人口都在呼吸这种空气(pe=0.80p_e=0.80pe​=0.80)。当您将这些数字代入我们的公式时,得到的 PAFPAFPAF 大约为 0.0740.0740.074。

突然之间,那个“小”风险看起来不再那么小了。这意味着该市所有新增的动脉粥样硬化病例中,超过7%可归因于空气污染。一个对任何单个人来说似乎可以忽略不计的风险,当几乎每个人都暴露其中时,就成了一个重大的公共卫生问题。这就是 PAFPAFPAF 的微妙力量:它揭示了普遍存在的、低级别威胁在人群层面的专制性。它教导我们,要改善一个群体的健康,我们往往必须专注于为每个人改变环境,而不仅仅是为那些因特定、强效暴露而处于最高风险的少数人提供咨询。

两个人群的故事:遗传、地理与疾病

PAFPAFPAF 还讲述了关于我们的祖先和地理如何塑造我们集体健康的迷人故事。以乳糜泻的一个强有力的遗传风险因素——HLA-DQ2.5单倍型为例。如果您携带这个遗传标记,您患乳糜泻的风险会显著升高——假设其相对风险(RRRRRR)为 666,无论您的背景如何。

现在,让我们看看两个人群。在一个欧洲人群中,这种风险单倍型相当常见,其频率导致大约26%的人至少携带一个拷贝。而在一个东亚人群中,它则罕见得多,只有大约2%的人是携带者。对于任何一个地方的携带者来说,个体风险(RR=6RR=6RR=6)是相同的。但这种疾病对整个群体的影响如何呢?

使用 PAFPAFPAF 计算,我们看到了巨大的差异。在欧洲人群中,该基因的高流行率导致 PAFPAFPAF 约为57%。这个人群中超过一半的乳糜泻病例都可归因于这一个遗传因素!然而,在东亚人群中,低流行率产生的 PAFPAFPAF 仅为9%左右。这是同一个基因,具有相同的个体层面风险,但它对整个社区健康的重要性却截然不同。这表明 PAFPAFPAF 如何在群体遗传学和公共卫生之间架起一座桥梁,解释了为什么一种疾病在世界某个地区可能是一个主要的遗传负担,而在另一个地区则相对罕见,并由其他因素驱动。

揭示因果之网

也许人群归因分值最深刻的应用在于它能够帮助我们描绘导致疾病的复杂因果网络,从最直接的诱因到最深层的社会根源。

我们可以从有形的、可衡量的事物开始。在职业健康领域,我们可以量化因人体工程学设计不良的工作条件所导致的肌肉骨骼疾病的负担,帮助公司看到投资于更好的工具和工作实践所带来的回报。在像隐孢子虫病这样的食源性疾病暴发期间,调查人员可以使用病例对照数据来计算食用特定食物(如生牛奶)的 PAFPAFPAF,以估计有多少病例与该特定来源有关,甚至考虑到不同年龄组的差异。同样,我们可以估计像隐睾症这样的发育性疾病有多大比例可归因于特定的遗传变异,或者作为1型糖尿病前兆的胰岛自身免疫有多大比例可能与肠道病毒感染等环境诱因有关。

但我们可以更深入。许多疾病受到一些因素的影响,这些因素并非单一暴露,而是慢性病或生活方式模式。以中年高血压与晚年痴呆症之间的联系为例。风险因素和疾病都很常见。PAFPAFPAF 使我们能够估算控制血压对整个人群的益处。如果中年高血压在人群中的流行率为35%,并且它使痴呆症的风险增加60%(RR=1.6RR=1.6RR=1.6),那么超过17%的晚年痴呆症病例可归因于此。这个数字为将血压控制作为保护认知健康的策略而开展的公共卫生运动提供了强有力的论据。

再往上游追溯,我们可以问:是什么导致了高血压?是什么导致了不良饮食或缺乏锻炼?通常,线索会指向我们所说的“健康的社会决定因素”。以受教育程度低为例。研究表明,它与心血管疾病(CVD)的风险较高有关,可能通过健康素养、收入和压力等途径。如果低教育程度很普遍(pe=0.35p_e=0.35pe​=0.35),并且其对CVD的相对风险为 1.61.61.6,那么 PAFPAFPAF 同样约为17%。这一计算具有深远的政策意义。它告诉我们,仅仅针对个体的干预措施(“吃得更好,多锻炼”)可能是不够的。要显著降低CVD,可能需要一个群体层面的策略:对教育进行长期投资。PAFPAFPAF 为这些“上游”社会政策提供了量化论据。

最后,PAFPAFPAF 可以作为一种伸张正义的工具。想象一下,我们正在研究“结构性暴力”——即社会结构系统性地伤害或使个人处于不利地位的方式——对健康结果的影响。我们可以将暴露定义为生活在一个历史上资源不足、被隔离的社区。我们很可能会发现,这种暴露在边缘化群体中比在特权群体中更常见。此外,由于劣势的复合效应,该暴露的危害(相对风险)对边缘化群体可能也更大。

当我们分别为每个群体计算 PAFPAFPAF 时,我们所做的不仅仅是流行病学研究,我们正在量化不平等。我们可能会发现,在边缘化群体中,某一特定不良健康结果的很大一部分可归因于结构性暴力,而在特权群体中,这一比例要小得多。这两个 PAFPAFPAF 值之间的差异,是一个鲜明的、数字化的衡量标准,反映了不公正的社会制度所施加的不成比例的疾病负担。因此,PAFPAFPAF 成为了一面映照社会的镜子,将结构性不平等的抽象概念转化为具体、可衡量的健康差距。

从基因到病菌,从习惯到危险的工作场所,从社会决定因素到不公正的制度——人群归因分值提供了一种单一、统一的语言来理解和比较它们的影响。这是一个简单的想法,但其应用却如人类社会本身一样广阔而复杂。这是一个微不足道的分数,却承载着一个深刻的信息:个体的健康与社区的健康密不可分。