自然直接效应

玻尔百科

定义

自然直接效应是因果推断中的一个度量指标，用于量化起因在绕过特定中介变量的情况下对结果产生的影响。该定义依赖于“跨世界”反事实概念，旨在将总因果效应分解为自然直接效应与自然间接效应之和。自然直接效应广泛应用于医学、公共卫生以及公平人工智能系统的开发，用于精确分析事物的作用机制。

核心要点

自然直接效应（NDE）量化了原因在绕过特定中间变量（即中介变量）后对结果产生的影响。
总因果效应可以完美地分解为自然直接效应和自然间接效应（NIE）之和。
NDE的定义依赖于“跨世界”反事实，这是一个强大的理论概念，用于提出关于机制的精确问题。
其应用范围广泛，从理解医学和公共卫生领域的疾病机制，到开发公平无偏的 AI 系统。

引言

在任何科学探究中，确定一个原因产生了某种效应仅仅是个开始。随之而来的更深层次的问题是“如何”或“为什么”。要真正理解一个现象，我们必须超越简单的相关性，剖析产生该现象的复杂因果路径。一种新药或许能降低心脏病发作的风险，但它是通过降低胆固醇来实现的，还是对动脉本身有独立的保护作用？回答这类问题需要一种清晰的方法，来区分原因的直接影响与它通过改变路径上其他变量而产生的间接影响。这正是中介分析和自然直接效应概念旨在解决的核心挑战。

本文为这种剖析提供了概念工具，为理解因果机制提供了一个清晰的框架。文章分为两个主要部分。第一章，原理与机制，将介绍强大的反事实框架，定义自然直接效应和自然间接效应，并解释它们分解总效应的精妙方式。它还将直面从真实世界数据中识别这些效应的重大挑战以及所需的强假设。第二章，应用与跨学科联系，将展示这些看似抽象的概念如何应用于解决从医学、公共卫生到社会正义和人工智能伦理等领域的关键问题。读完本文，您不仅能深入理解一个原因“是否”有效，还能掌握其发挥影响的具体路径。

原理与机制

当我们确定了一个原因具有某种效应——例如，新药能降低胆固醇，或新的教学方法能提高考试成绩——一个更深、更令人满意的问自然而然地题出现了：为什么？机制是什么？它是如何起作用的？是药物本身直接保护了动脉，还是完全通过降低胆固醇来起作用？是教学方法直接传授了某种新的思维方式，还是仅仅鼓励学生更努力地学习？科学不仅仅是观察相关性，更是理解产生我们所见现象的复杂因果路径。

要剖析这些路径，将原因的直接效应与其通过改变沿途其他变量而产生的间接效应分离开来，我们需要一种极其精确的语言。我们需要一种方法来谈论在不存在的世界里本会发生什么。这就是因果推断的世界，而我们的主要工具是反事实（counterfactuals）的概念。

“如果”的世界：反事实的力量

让我们想象正在研究一种处理，我们称之为 $A$ 。为简单起见，假设一个人要么接受处理（ $A=1$ ），要么不接受（ $A=0$ ）。我们关心它对结果 $Y$ 的影响。反事实的概念很简单：对于任何给定的人，存在一个潜在结果 $Y(1)$ ，即如果他们接受了处理，他们本会得到的结果；以及一个潜在结果 $Y(0)$ ，即如果他们没有接受处理，他们本会得到的结果。对该个体的总因果效应就是两者的差值： $Y(1) - Y(0)$ 。当然，对于任何个体，我们永远只能观察到其中之一，这就是因果推断的基本问题。

现在，我们引入一个中介变量（mediator）， $M$ 。这是我们怀疑与故事相关的一个中间变量——比如生物标志物水平、学习时长。中介变量本身也受到处理的影响。因此，我们可以定义一个潜在中介变量 $M(1)$ ，即如果此人接受处理，中介变量将会取的值；以及 $M(0)$ ，即如果他们没有接受处理，中介变量将会取的值。

此外，最终结果 $Y$ 不再仅仅依赖于处理 $A$ ；它同时依赖于处理 $A$ 和中介变量 $M$ 的值。所以我们需要扩展我们的符号。令 $Y(a, m)$ 为如果处理被设为水平 $a$ 且中介变量被以某种方式设为水平 $m$ 时将会被观察到的结果。有了这个优雅的符号，我们现在可以陈述一个基本规则，通常称为一致性（consistency）或复合性（composition）：一个人在处理 $A=1$ 下本会有的结果，我们称之为 $Y(1)$ ，必须与我们将他们的处理设为 $A=1$ 并让他们的中介变量自然变为 $M(1)$ 时他们本会有的结果相同。用符号表示就是 $Y(1) = Y(1, M(1))$ 。这可能看起来像一个微不足道的规则，但它正是连接总效应与底层中介路径的纽带。

隔离直接路径：“受控”与“自然”之分

我们的目标是将 $A$ 对 $Y$ 的直接效应与通过 $M$ 的间接效应分离开来。直观上，我们想要区分路径 $A \to Y$ 和路径 $A \to M \to Y$ 。

我们如何隔离直接路径呢？一个直接的想法是保持中介变量 $M$ 恒定。想象一个宏大的实验，我们不仅可以给人们处理（ $A=1$ ）或控制（ $A=0$ ），还可以强制每个人的中介变量水平为某个特定的固定值，比如 $m^*$ 。如果我们这样做，两组之间结果 $Y$ 存在差异的唯一原因必然是 $A$ 的直接效应。我们称之为在水平 $m^*$ 下的受控直接效应（Controlled Direct Effect, CDE）：

\text{CDE}(m^*) = E[Y(1, m^*) - Y(0, m^*)]

这里的 $E[\cdot]$ 表示我们取整个群体的平均效应。这是一个定义明确且可能有用的量。我们可以问，“如果我们能强制每个人的血压都达到健康的 120/80 mmHg，那么这种药物的效果是什么？”

但这有一定的“人造”性质。如果我们选择的水平 $m^*$ 对某些人来说在生物学上是不可能的，或者非常不典型，那该怎么办？CDE 回答了一个问题，但它是最相关的问题吗？我们是在探究真实世界中的机制，而不是在一个我们能像神一样控制一个人的内部生理机能的世界里。

这就引出了一个更微妙、更优美的想法。与其将中介变量固定在一个外部的、人为的值 $m^*$ ，不如我们将其设为——对每个人而言——如果他们处于对照组中时它本会自然取到的值？这个“自然”的基线水平是 $M(0)$ 。现在我们可以定义一种新的直接效应。我们比较一个人接受处理（ $A=1$ ）但其中介变量被保持在其自然基线水平 $M(0)$ 时的结果，与他不接受处理（ $A=0$ ）且其中介变量也处于其自然基线水平 $M(0)$ 时的结果。这就是自然直接效应（Natural Direct Effect, NDE）：

\text{NDE} = E[Y(1, M(0)) - Y(0, M(0))]

这个量意义深远。它代表了在中介路径被阻断的情况下，处理对结果的效应——这种阻断不是通过强制其达到某个通用常数，而是通过将其保持在每个个体在没有处理时本会具有的自然水平上。

跨世界之旅

仔细看 NDE 定义中的第一项： $Y(1, M(0))$ 。这是一个奇妙而奇异的构造。它是一个嵌套反事实（nested counterfactual），通常被称为“跨世界”反事实。让我们用语言来翻译它：它是指如果你接受了处理（ $A=1$ ），而你的中介变量处于如果你本处于对照组（ $A=0$ ）时它本会具有的值的情况下，你本会得到的结果。

对于任何单个个体来说，这在物理上和逻辑上都是不可能的。你不可能在同一时间既接受处理又不接受处理。你的结果被测量的世界（ $A=1$ ）与你的中介变量值所来源的世界（ $A=0$ ）是不同的。这似乎有点科幻小说的味道。

该框架的早期批评者认为，这类量是“未定义的”或“形而上学的”，在科学中没有立足之地。但这没有抓住要点。数学和逻辑的力量在于，我们可以定义概念并探索其后果，即使我们无法在作坊里将它们制造出来。 $Y(1, M(0))$ 这一项不是我们期望能为某个人观察到的东西。它是一个理论构建，使我们能够以完美的清晰度提出我们的问题——“什么是直接效应？”。它的作用是定义我们试图理解的理想目标，即使我们只能用真实数据来近似它。

宏伟的分解：整合各个部分

这些定义的真正美妙之处在于它们如何组合在一起。处理的总因果效应是每个人都接受处理的世界与无人接受处理的世界之间的差异：

\text{Total Effect} = E[Y(1)] - E[Y(0)] = E[Y(1, M(1))] - E[Y(0, M(0))]

现在，请看。通过一点简单的代数（加上和减去同一项），我们可以进行一个非凡的分解：

\text{Total Effect} = E[Y(1, M(1)) - Y(0, M(0))] = \big(E[Y(1, M(0))] - E[Y(0, M(0))]\big) + \big(E[Y(1, M(1))] - E[Y(1, M(0))]\big)

这个和的第一部分，根据定义，就是我们的自然直接效应。第二部分被称为自然间接效应（Natural Indirect Effect, NIE）。

\text{NIE} = E[Y(1, M(1))] - E[Y(1, M(0))]

NIE 也有一个同样直观但令人费解的解释。它问的是：在将处理固定在“开启”位置（ $A=1$ ）的同时，仅仅由于中介变量从其自然的控制值（ $M(0)$ ）转变为其自然的处理值（ $M(1)$ ）而引起的结果变化是多少？这完美地隔离了通过中介变量传递的效应。

而最后的点睛之笔是：

\text{Total Effect} = \text{Natural Direct Effect} + \text{Natural Indirect Effect}

这不是一个近似。它是一个精确的、代数上的恒等式。我们的概念之旅引领我们得到了一个对因果关系的完美划分。我们将一个原因的总效应干净地分成了两条路径：直接效应和通过中介变量运作的间接效应。这种分解证明了反事实框架的力量和内部一致性。

从理想世界到真实数据：可识别性的挑战

我们已经定义了我们的理想量。现在是困难的部分：我们能测量它们吗？我们能将这些抽象的反事实与我们从实验或观察性研究中收集到的混乱的真实世界数据联系起来吗？这就是可识别性（identification）的问题。

一个普遍的直觉是，一个简单的随机对照试验（RCT）应该能解决所有问题。如果我们随机化处理 $A$ ，我们就打破了 $A$ 与患者特征之间的所有混杂。这是对的，它使我们能够无偏地估计总效应 $E[Y(1)] - E[Y(0)]$ 。但是，它本身并不能让我们估计 NDE 或 NIE。为什么？因为随机化确保了 $A$ 与患者的潜在结果无关，但它并没有打破患者内部的依赖关系。例如，一个人在处理下的潜在结果 $Y(1,m)$ 与其在控制下的潜在中介水平 $M(0)$ 可能仍然被其潜在的遗传或生理因素联系在一起。仅对 $A$ 进行随机化无法窥探这种“跨世界”关系内部。

为了从数据中识别 NDE 和 NIE，我们需要做出一个信念上的飞跃，这体现在一系列强有力的、无法检验的假设中。在最简单的情况下，这些假设通常被称为中介分析的“四诫”：

一致性：潜在结果框架准确地描述了观测数据。
正值性：对于任何类型的人，他们都有一定的机会接受任一处理，并可能表现出任何相关的中介变量值。不存在“注定”的子群体。
无未测量混杂：这是一个巨大的飞跃。我们必须假设我们已经测量了所有混杂了任何关系的基线因素（我们称之为 $L$ ）： $A$ 对 $Y$ 的效应、 $A$ 对 $M$ 的效应，以及至关重要的是， $M$ 对 $Y$ 的效应。
跨世界假设：这是最后，或许也是最大胆的飞跃。我们必须假设，不存在未测量的因素将一种暴露下的潜在中介 $M(0)$ 与另一种暴露下的潜在结果 $Y(1,m)$ 联系起来。正是这个假设让我们在数学上能够将两个世界“缝合”在一起。

如果这四个假设成立，那么就有可能写出一个公式——通常称为中介公式——它完全根据我们数据中的可观测概率和条件期望来表达 NDE 和 NIE。

一座遥不可及的桥：当我们的假设崩塌时

这些假设不仅仅是技术性的脚注；它们是脆弱的。自然是复杂的，真实世界的因果结构很容易以微妙的方式违反它们。考虑一个经典而棘手的案例：暴露引起的中介-结果混杂因素（exposure-induced mediator-outcome confounder）。

想象一种新药（ $A$ ）导致患者更频繁地与医生进行随访（ $L$ ）。这些更频繁的随访反过来又导致对他们血压（ $M$ ）的更仔细监测，从而改善了他们的最终健康结果（ $Y$ ）。但随访（ $L$ ）也对结果（ $Y$ ）有直接影响，也许是因为医生在这些访问中提供了其他有用的健康建议。因果图如下所示： $A \to L$ 、 $L \to M$ 、 $L \to Y$ 和 $M \to Y$ 。

在这里，变量 $L$ （医生访问）是中介变量 $M$ 和结果 $Y$ 的共同原因。这使它成为 $M \to Y$ 关系的混杂因素。但这个混杂因素 $L$ 本身是由暴露 $A$ 引起的。这打破了标准的可识别性假设。在统计模型中简单地“调整 $L$ ”是行不通的；事实上，它可能通过阻断我们想要理解的一部分因果效应而产生更多偏倚。在这种情况下，我们如此精心定义的优美的 NDE 和 NIE 使用标准方法已不再可识别。

这是一个至关重要的教训。自然直接效应为我们提供了完美的问题。因果推断为我们如何回答它提供了一个框架。但它也迫使我们对自己所做的关于世界的强大假设保持诚实和谦卑，并认识到现实的复杂性何时超出了我们工具的范围。理解“为什么”的旅程，既在于欣赏问题的美妙，也在于尊重答案的艰难。

应用与跨学科联系

在回顾了因果分解的原理和机制之后，人们可能会倾向于将这些想法视为统计学家头脑中优雅但抽象的创造。事实远非如此。自然直接和间接效应的概念不仅仅是学术上的好奇心；它们是剖析支配我们世界的复杂因果链的有力手术刀。要真正领会它们的力量，我们必须看到它们在实践中的应用。我们必须从黑板走向真实世界，在真实世界中，这些工具被用来回答科学、社会和工程领域中一些最紧迫的问题。这是一段从一个原因“是否”有影响，到更深远的“如何”发挥其影响的问题的旅程。

揭示健康与疾病的机制

人体是一个由相互关联的路径组成的迷宫。一个角落的变化可能会在整个系统中引发涟漪，其方式往往远非显而易见。因果中介分析为探索这个迷宫提供了一盏明灯。

思考一个经典的公共卫生难题：高盐摄入、血压和中风之间的联系。我们经常被告知，高盐是危险的，因为它会升高血压，而血压升高又会增加中风的风险。这描述了一条间接路径：盐摄入 $\to$ 血压 $\to$ 中风。但这是全部真相吗？高盐摄入是否会通过其他独立于其对血压影响的机制损害心血管系统？这正是自然直接效应（NDE）旨在回答的问题。NDE 量化了盐对中风的绕过血压路径的效应。相反，自然间接效应（NIE）则分离出通过血压传递的那部分危害。通过将总效应分解为这两个部分，研究人员可以了解公共卫生干预措施是否应仅专注于血压管理，还是有其他由盐引起的危险需要防范。

同样的逻辑在现代医学和药理学中也是不可或缺的。想象一种新的抗炎药正在进行测试。已知该药物能降低血液中一种特定的炎症生物标志物，服用该药物的患者也表现出临床结果的改善。对药物开发者来说，关键问题是：药物的益处是因为它降低了这种生物标志物（间接效应），还是药物有其他有益的“脱靶”效应（直接效应）？NDE 有助于量化这些直接的、多效性的效应。理解这一点对药物的疗效和安全性都至关重要。一种药物可能通过其预期靶点产生有益的间接效应，但同时产生有害的直接效应，反之亦然。

这个框架的力量超越了分子层面，延伸到心理学和行为领域。众所周知，乐观的个体往往寿命更长。但为什么呢？心理学家可能会假设，这是因为乐观的人更可能采取健康行为，比如戒烟。用我们的语言来说，这是一条间接路径：乐观 $\to$ 戒烟 $\to$ 长寿。那么，自然直接效应将捕捉到即使我们能够固定一个人的吸烟行为，乐观所带来的任何剩余的生存益处。这可能指向积极心态对身体恢复能力的直接心理生理效应，这是医学心理学一个引人入胜的前沿领域。

打造更公平的世界：从社会正义到 AI 伦理

决定我们健康的因果路径并不仅限于我们的身体内部；它们深深地延伸到社会结构之中。我们用来追踪药物路径的同样工具，也可以用来追踪不平等的路径。

社会流行病学家试图理解为什么像收入和社区这样的因素会对健康产生如此深远的影响。考虑低收入与抑郁症之间的联系。一个合理的假设是，低收入导致更高水平的慢性压力，而压力又导致抑郁。这是一条间接路径。自然直接效应将捕捉到收入对抑郁的任何不通过其对压力的影响来解释的效应——也许是通过获取资源、社会参与或安全感。

在一个引人注目（尽管是假设性的）的医疗保健差距分析中，研究人员可能会调查为什么生活在贫困社区会增加严重孕产妇发病率的风险。假设他们发现，这种效应的很大一部分——比如说 60%——是通过产前保健不足来介导的。这个数字，即“中介比例”（ $\frac{NIE}{NIE+NDE}$ ），不仅仅是一个统计数据；它是一个强有力的政策指向标。它表明，旨在均等化高质量产前保健服务的干预措施，有可能消除观察到的大部分健康差距。它将一个复杂的社会问题转变为一个可行的行动目标。

这种对公平的追求在人工智能世界中找到了一个新的、紧迫的应用。我们越来越多地部署算法在招聘、贷款甚至医疗资源分配等领域做出改变人生的决定。我们如何确保这些算法不会延续或放大历史偏见？因果中介分析提供了一个革命性的答案。

想象一个旨在分配稀缺医疗资源的 AI 系统，它使用患者自我认定的种族（ $A$ ）和临床风险评分（ $X$ ）来做出决策（ $Y$ ）。其因果图可能看起来像 $A \to Y$ （直接路径）和 $A \to X \to Y$ （间接路径）。

种族对决策的自然直接效应是绕过临床风险评分的效应。在线性模型中，这由单个系数 $\gamma$ 捕获。这对应于两个具有完全相同的临床风险评分的个体，仅仅因为他们的种族而获得不同的决策。这正是直接歧视的定义，我们可以通过强制 NDE 为零来要求我们的算法消除这种情况。
自然间接效应通过临床评分产生影响。这更为微妙。 $A \to X$ 的联系可能反映了系统性的不平等（例如，某个种族群体在历史上获得预防性保健的机会较少，导致临床评分较差），也可能反映了群体层面疾病患病率的真实差异。路径特定公平性（path-specific fairness）的概念为我们解决这个问题提供了一种形式化语言：我们可以设计一种算法，故意阻断不允许路径（如直接效应）的影响，同时保留被认为是临床上合理的路径。我们可以构建一个 AI，使其做出的预测就像直接歧视路径不存在一样。这是一个深刻的转变，从仅仅观察偏见到从我们的自动化系统中手术般地移除它。

从人到机器：因果关系的普适逻辑

一个基本科学原理最美的方面之一是其普适性。因果中介的逻辑不仅限于生物学或社会学。它适用于任何一个组件的行动通过中介影响另一个组件的复杂系统。

考虑一个网络物理系统，比如工厂里的机器人。安装了一个新的控制算法（ $A$ ）。不久之后，机器人的主臂开始更频繁地发生故障（ $Y$ ）。一位工程师观察到，臂的电机也比平时更热（ $M$ ）。这位工程师的诊断问题正是一个中介问题：新软件导致故障是因为它使电机过热（间接效应， $A \to M \to Y$ ）？还是软件中存在一个直接导致故障的错误，与温度无关（直接效应， $A \to Y$ ）？分清这两条路径至关重要。如果 NDE 是罪魁祸首，那么软件必须被调试。如果 NIE 是主要驱动因素，问题可能通过安装更好的冷却系统来解决。在任何复杂的工程系统中，从喷气发动机的数字孪生到全球互联网，区分这些场景的能力对于有效的根本原因分析至关重要。

从理解“为什么”到决定“怎么做”

到目前为止，我们一直专注于 NDE 和 NIE 如何帮助我们理解世界自然发展的过程。但通常，我们的目标是通过干预来改变世界。在这里，一个微妙但至关重要的区别就出现了，它凸显了我们提出的问题与我们能够采取行动的答案之间的关系。

自然直接效应涉及一个“跨世界”的思想实验：如果我们实施了处理，但中介变量被保持在没有处理时它本应有的水平，会发生什么？这对于理解机制是完美的，但并不对应于一个直接的现实世界政策。我们不能为每个患者知道他们未被观察到的反事实中介水平，并干预以将其设置在那里。

这就是相关概念受控直接效应（CDE）变得无比宝贵的地方。CDE 提出了一个不同的问题：如果我们干预将每个人的中介变量都设置为同一个固定水平 $m$ ，那么处理的效果是什么？例如，“如果我们给每位患者一种新抗炎药，同时还给他们第二种药物，强制将他们的生物标志物水平设为 50，那么效果是什么？” 这是一个具体的、可实施的策略。CDE 量化了其效果。

NDE 是我们用于被动理解的工具；CDE 是我们用于规划主动干预的工具。一个完备的科学家和一个明智的政策制定者必须两者都懂。他们必须首先使用 NDE 来理解世界的自然路径，然后利用这些知识来构想类似 CDE 的问题，即哪些干预措施最有可能成功。

从我们细胞的静默运作，到我们社会的热闹动态，再到我们机器的精确逻辑，因果分解的原则为探究提供了一个统一的框架。它们使我们不仅能看到事件之间的联系，还能理解这些联系的本质，揭示塑造我们现实的隐藏路径。