try ai
科普
编辑
分享
反馈
  • 归因科学

归因科学

SciencePedia玻尔百科
核心要点
  • 归因科学通过将我们的事实性现实与一个科学构建的、缺少特定原因的“反事实”世界进行比较,来正式确立因果关系。
  • 在气候科学中,超级计算机模型模拟存在与不存在人类排放的世界,以量化气候变化在多大程度上改变了极端天气事件的概率。
  • 在人工智能领域,特征归因方法通过突出显示哪些输入数据对其预测最为关键,来诊断模型的“思维”过程。
  • 归因的概念统一了多个不同领域,从利用基因组学追溯大流行病的起源,到在医疗保健中分配责任和评估科学贡献。

引言

什么导致了热浪、疾病暴发或人工智能的决策?区分有意义的因果关系与纯粹的巧合,是推动科学进步的引擎。然而,要超越相关性,严格证明因果关系,是一项艰巨的挑战,尤其是在无法进行受控实验的复杂系统中。本文介绍了归因科学,这是一门致力于解决这一难题的正式学科。它为以科学的信度回答“为什么”提供了框架。在接下来的章节中,我们将首先探讨其基础的“原理与机制”,追溯从早期医学侦查工作到由超级计算机模拟的强大的反事实世界概念的因果逻辑。然后,我们将历览其“应用与跨学科联系”,发现这同一个理念如何被用来解读我们地球的“高烧”,窥探人工智能的思维,甚至为历史性的科学突破分配功劳。

原理与机制

因果侦探:从病菌到基因再到温室气体

说某物导致了某事,这意味着什么?公鸡打鸣,太阳升起。是公鸡的啼叫导致了黎明吗?当然不是。我们直观地理解,仅仅因为两个事件相继发生,并不一定意味着一个导致了另一个。这个简单的道理——相关性不等于因果性——是所有科学中最根本的挑战之一。成为一名科学家,就是成为一名因果侦探,在纷繁的线索中筛选,区分有意义的联系和纯粹的巧合。

远在超级计算机时代之前,一种用于锁定“罪魁祸首”的杰出方法从医学领域浮现。在19世纪末,随着“疾病的细菌理论”逐渐被接受,德国医生 Robert Koch 面临着一项艰巨的任务:他如何能够毫无疑义地证明,某种特定的、看不见的微生物是炭疽或结核病等特定疾病的元凶?

他的解决方案是逻辑和实验严谨性的典范,现在被称为​​科赫法则​​。本质上,它们构成了建立因果关系的四步算法:

  1. ​​发现​​:在每一例病患中都必须能发现该微生物,但在健康个体中则不存在。
  2. ​​分离​​:必须能够从患病宿主中分离出该微生物,并在纯培养基中使其生长,远离所有其他生物体。
  3. ​​测试​​:将培养出的微生物引入一个新的、健康的、易感的宿主中,必须能引起同样的疾病。
  4. ​​再发现​​:必须能从新感染的宿主中再次分离出同样的微生物。

这个序列之所以强大,是因为它是一种主动干预。它不仅仅是观察相关性,而是做出预测并进行检验。特别是第三条法则,直接测试了​​充分性​​:引入这种微生物是否足以导致疾病?第一条法则旨在建立​​必要性​​:该微生物的存在对于疾病的发生是否必要?第二和第四条法则是绝妙的实验控制,确保你测试的病原体确实是你开始时使用的那一个,而不是某种意外的污染物。

总的来说,这些法则为证明一种微生物是某种疾病的充分原因提供了一个坚实的框架。然而,随着科学的进步,我们发现即使是这个优雅的框架也有其局限性。对于无症状携带者——携带病原体的健康人——该如何解释?他们违反了第一条法则。对于病毒又该如何?它们无法像细菌那样在“纯培养基”中生长。它们不满足第二条。出于伦理原因,我们不能在人类身上测试像艾滋病这类疾病的第三条法则。

这揭示了一个深刻的教训:科赫法则在能够被满足时,是证明因果关系的强大工具,但未能满足它们并不一定推翻因果关系。真实世界是复杂的。早期在医学领域确定因果关系的挣扎,为在广阔、复杂的系统中寻找因果联系这一更大的挑战完美地铺平了道路,在这些系统中,我们根本无法对单个宿主进行受控实验。

未曾存在的世界:反事实的力量

我们如何证明吸烟致癌,或者温室气体正在使地球变暖?我们不可能将一半人口置于“无烟”环境中生活50年,也找不到第二个地球作为行星实验的对照组。侦探的工作变得更加困难。

支撑所有现代归因科学的概念性突破是​​反事实​​(counterfactual)——字面上意为“未曾存在的世界”——的理念。做出任何因果声明,都意味着将我们的现实与一个假想的现实进行比较。当我说“阿司匹林治好了我的头痛”时,我实际上是在比较我服用了阿司匹林的世界与一个未被观察到的、我没有服用阿司匹林的反事实世界,并得出结论:在那个世界里,头痛会持续存在。

归因科学将这种直觉形式化。某个因素(我们称之为 AAA)对某个结果(EEE)的因果效应,被定义为存在 AAA 的世界与不存在 AAA 的反事实世界之间的差异。如果我们能同时观察到这两个世界,问题就解决了。归因科学的全部挑战,就在于找到一种科学上站得住脚的方法来构建或近似这个“未曾存在的世界”。

在计算机中构建世界:气候归因实践

对于像地球气候这样复杂的系统,我们构建这些反事实世界的主要工具是超级计算机。气候模型——或者更准确地说,地球系统模型——是代表物理学基本定律的大量方程组:大气、海洋、冰和陆地的质量、动量和能量守恒。在某种意义上,它们是完整的虚拟行星。

这些模型使我们能够进行我们永远无法在真实地球上进行的宏大实验。归因一次极端天气事件(如毁灭性的热浪或洪水)的程序,通常涉及运行两大组模拟:

  1. ​​事实世界​​:科学家运行大量的模拟(一个“系集”),其中包含所有已知的影响气候的因素,包括自然的(如火山爆发和太阳输出的变化)和人为的(人类引起的温室气体排放、气溶胶污染、土地利用变化)。这个系集代表了我们对真实世界的最佳理解。

  2. ​​反事实世界​​:然后,他们使用完全相同的模型运行另一个大规模的系集,但有一个关键的改变:他们移除了人为造成的影响。这就创造了一个“未曾存在的世界”的模拟——一个假如工业革命从未发生,世界可能的样子。

通过比较这两个世界,我们可以提出精确的、定量的问题。对于一个特定的热浪,由某个地区的特定温度阈值定义,我们可以计算出在两个模拟世界中,该量级的事件发生的频率。这使我们能够计算出两个关键概率:pFp_FpF​,即在​​事​​实世界(​​F​​actual world)中事件的概率,以及 pCp_CpC​,即在​​反​​事实世界(​​C​​ounterfactual world)中的概率。

根据这些概率,我们得出归因研究的头条声明:

  • ​​风险比(RRRRRR)​​:计算公式为 RR=pF/pCRR = p_F / p_CRR=pF​/pC​,它告诉我们事件变得多么更可能发生。像“气候变化使这次热浪的可能性增加了4倍”这样的声明意味着风险比为4。

  • ​​可归因风险分数(FARFARFAR)​​:计算公式为 FAR=1−pC/pFFAR = 1 - p_C / p_FFAR=1−pC​/pF​,它表示事件风险中可归因于所研究因素的比例。对于一个为4的 RRRRRR,FARFARFAR 为 1−1/4=0.751 - 1/4 = 0.751−1/4=0.75,从而得出声明“该事件75%的风险可归因于气候变化”。

至关重要的是要理解,这些结论总是与一个非常具体的事件定义相关联。关于百年一遇洪水的声明不同于关于千年一遇洪水的声明。任何归因研究的第一步都是对所讨论的事件进行仔细而精确的定义,因为你得到的答案完全取决于你提出的问题。整个过程,从定义事件到运行模型再到计算概率,代表了一个全面且科学上稳健的工作流程。

超越单一事件:指纹和故事线

反事实概率方法功能强大,但它不是归因科学家工具箱中唯一的工具。有时我们想问不同类型的问题。

例如,我们可能不关注单个、孤立的事件,而是想分析一个长期趋势。春天的提前——以树木首次展叶日期衡量——是否在几十年间发生了变化?在这里,科学家使用一种通常称为​​最优指纹法​​的方法。他们首先确定不同因素会在气候系统上留下的特征性变化模式——即“指纹”。温室气体变暖的指纹(全球低层大气变暖)与太阳输出的变化等因素的指纹截然不同。然后,科学家们查看观测到的长期数据,并进行复杂的信号处理分析,以确定真实世界趋势中每种“指纹”的含量有多少。

另外,对于一个刚刚发生的特定事件,一种称为​​故事线归因​​的不同方法可以提供更直观的答案。故事线方法不是问事件的概率如何变化,而是问:鉴于导致此事件的大尺度天气模式(“故事”)已经发生,气候变化如何改变了其特征? 对于热浪而言,这可能意味着获取导致该事件的观测到的大气环流,然后使用模型在事实和反事实世界中模拟这一确切情况。结果不是一个概率,而是一个量级声明:“气候变化使这次特定的热浪比它原本的温度高了1.5°C。”

因果关系的统一逻辑甚至超越了物理科学。在公共卫生或政策领域,通常不可能进行干净的模拟。如果一个城市为一项新的健康税发起了一场复杂的宣传运动,我们如何知道是这场运动导致了政策变化,尤其是在行业游说者和变化的公众舆论也同时起作用的情况下?在这里,评估人员使用​​贡献分析​​。它是归因的务实表亲。它不是寻求孤立单一效应的大小,而是涉及制定一个“变革理论”(一个关于运动的行动应如何导致结果的逻辑模型),然后收集多方面的证据——定性的和定量的——来建立一个可信的论证,即该运动对最终结果做出了贡献,即使它不是唯一的原因。其核心思想保持不变:将现实与一个经过推理的、即使不是完美模拟的反事实进行比较。

拥抱不确定性:诚实的中间人

一个关于科学的常见误解是它提供绝对的确定性。实际上,好科学的一个标志是对不确定性进行坦率而严谨的说明。一个没有误差范围的答案不是一个完整的答案。在归因科学中,理解不确定性至关重要,它主要有两种类型:

  1. ​​偶然不确定性(掷骰子)​​:这种不确定性来自于像天气这样的混沌系统的内在随机性。即使我们有一个完美的气候模型,热浪的发生仍然是一个机遇问题,就像掷骰子一样。它可能在今年发生,也可能在明年发生。这是不可简化的自然变率。科学家通过运行单个模型数百或数千次来量化它,每次都对其起始条件进行微小的调整(一个​​初始条件系集​​),以观察给定气候能够产生的所有天气范围。

  2. ​​认知不确定性(我们所不知道的)​​:这是源于我们自身知识不完善的不确定性。我们的气候模型极其复杂,但并非完美。世界各地的不同科学团队在构建模型时,对于像云形成这样的复杂过程,会采用略有不同的假设和参数化方案。他们结果的差异代表了我们的认知不确定性。我们通过比较来自​​多模式系集​​(一个由不同研究中心的模型组成的集合)的结果来量化这一点。为确保我们的结论不过分依赖于某个可能存在缺陷的模型,科学家会进行敏感性分析,如​​留一模式法(LOMO)​​测试,以观察当每个模型被依次移除时结果如何变化。

一个稳健的归因结论是指,变化的信号(事实世界和反事实世界之间的差异)明显大于偶然不确定性和认知不确定性所产生的噪音。

这种对不确定性的诚实说明对于科学与社会之间的接口至关重要。归因科学家的工作是充当信息的诚实中间人。科学可以产生这样的陈述:“人为气候变化已将此量级热浪的风险增加了10倍,95%的置信区间为5到20倍。”。这是一个关于物理现实的概率性、定量陈述。然而,它不是一个政策处方。它没有说:“因此,X市必须投资1亿美元用于建设降温中心。”那是一个社会必须做出的规范性的、基于价值的决定,而科学证据中关于风险变化的信息为其提供了依据。归因科学告诉我们骰子是如何被“做手脚”的;而如何玩这场游戏,则取决于我们自己。

应用与跨学科联系

现在我们已经熟悉了归因科学的基本机制——事实世界与反事实世界之间优雅的舞蹈——我们可以开始一次盛大的巡礼。这种思维方式将我们引向何方?它打开了哪些大门?你可能会感到惊讶。将效应归因于原因、分配功劳或责任的概念,并不仅限于单一领域。它是解决理解问题的通用溶剂。我们将看到它在解码我们地球的“高烧”、窥探人工智能的硅基心智、追溯大流行病的路径,甚至衡量科学功劳本身的性质中发挥作用。这段旅程将揭示科学探究的深刻统一性,展示一个强大的理念如何能照亮我们世界中最不相干的角落。

解码地球的“高烧”:气候与极端天气

当今归因科学面向公众最广的舞台或许就是气候研究。当毁灭性的热浪、洪水或干旱发生时,人们不可避免地会问:“这是气候变化造成的吗?”归因科学提供的工具不是简单地回答“是”或“否”,而是给出一个细致的、概率性的陈述:“由于人为引起的气候变化,此量级的事件发生的可能性增加了 XXX 倍。”但要得出这个数字,需要经过一番仔细的科学侦查工作。

首先,侦探必须精确地定义“犯罪现场”。我们研究的事件,究竟是什么?这比听起来要微妙。以干旱为例。它仅仅是缺雨吗?在一个变暖的世界里,这是一个不完整的画面。更高的温度会增加蒸发,从土壤和植物中吸走更多水分。一个只关注降水,使用如标准化降水指数(SPI)等指标的归因分析,会忽略故事的关键部分。一个物理上更完整的定义使用像标准化降水-蒸散指数(SPEI)这样的指标,它既考虑了水的供应(降水),也考虑了大气的需求(蒸散)。通过选择正确的定义,我们确保我们归因的是正确的现象——不仅仅是降雨亏缺,而是一场真正的水平衡危机,因高温而加剧。

一旦事件被定义,我们就可以开始识别“罪魁祸首”。但“气候变化”并非单一行为者;它是多种机制复杂相互作用的结果。我们可以用归因来剖析这些机制。想象一场在已经经历干旱条件的地区发生的酷热。干旱本身,作为陆-气耦合的结果,可以放大热浪。较少的土壤水分意味着更少的能量用于蒸发冷却(潜热),而更多的能量直接用于加热空气(感热)。我们可以问一个更精细的问题:在已有的干燥土壤条件下,温室气体带来的背景变暖在多大程度上放大了热浪?这被称为条件归因。它允许我们隔离一个驱动因素(热力学变暖)的影响,同时固定另一个条件(地表状态),从而揭示,例如,风险的相对增加在湿润条件下可能更大,仅仅因为该事件在那里原本就极为罕见。

然而,有时我们想理解一个特定的、历史性事件的完整、独特的叙事。这就是“故事线”方法。我们不看一类事件,而是聚焦于一个。以一个复合事件为例,比如热浪和干旱的同时发生。我们可以使用气候模型来问:导致高压系统在一个地区停留数周的特定、观测到的大气环流模式(“故事线”)起了什么作用?干燥的土地又是如何反馈以加剧那场热浪的?这需要一个复杂的实验设计,使用多个模拟系集,其中一些被微调以遵循观测到的大气“故事”,而另一些则人为关闭了土地反馈。这就像对监控录像进行逐帧分析,使我们能够将悲剧性结果的不同部分归因于初始的大气设置与下方土地的放大响应。

最后,最终目标是将物理学与人联系起来。归因于温度升高3°C是一回事;归因于由此产生的经济损失或生命损失则是另一回事,一个更难的问题。当极端事件造成损害时,总影响不仅取决于灾害风险的强度,还取决于我们的暴露度(有多少人或资产处于危险之中)和我们的脆弱性(我们的建筑和社区的恢复力如何)。随着时间的推移,这三者都可能改变。一场飓风可能因气候变化而更强(灾害风险),但沿海人口也可能增长了(暴露度),建筑规范也可能改善了(脆弱性)。要归因影响的变化,需要一个能够解开这三条线索的框架。这将归因科学推向了因果推断的领域,在这里,识别纯粹的“仅灾害风险”贡献成为一项艰巨的挑战,需要对这些不同因素如何相互作用做出仔细的假设。

打开黑箱:窥探人工智能的思维

当我们以人工智能的形式构建我们自己的复杂系统时,我们发现自己面临一个熟悉的问题:一个复杂的过程产生一个输出,而我们想知道为什么。归因科学,在一次平行的智力进化中,也发展出了窥探这些数字“黑箱”的工具。在这里,目标不是将事件归因于物理原因,而是将模型的预测归因于其输入特征。

想象一个经过训练以执行语义分割的人工智能——识别图像每个部分中的对象。如果它正确地勾勒出一辆汽车,那么输入图像中的哪些像素对这个决定最重要?我们可以使用像积分梯度这样的方法来生成一个“显著性图”,突出显示有影响力的像素。通过在一个使用简单卷积的模型上这样做,我们可以获得非凡的洞察。如果模型使用一个检测边缘的核(如拉普拉斯算子),归因图将在对象的边界上亮起。如果它使用一个平均值的核(如盒式滤波器),归因可能在对象的内部更高。这使我们能够诊断模型的策略:它是在以边缘还是纹理的方式思考?这就像不仅问一位艺术家画了什么,还问他们最重要的笔触落在哪里以及为什么。

这种能力从一种诊断工具转变为一种科学发现的方法。考虑一个在大量基因组数据上训练的深度学习模型,用于预测RNA上特定化学修饰——N6-甲基腺苷(m6A)——会出现在哪里。生物学家知道m6A修饰通常发生在一种称为DRACH的特定序列模式或“基序”内。这个AI模型可能极其准确,但对于科学家来说,关键问题是:它学到了真实的生物学知识,还是仅仅抓住了数据中的某些虚假相关性?像SHAP(沙普利加性解释)这样的特征归因方法可以回答这个问题。通过分析数千个预测的归因分数,我们可以看到模型是否一致地将高重要性分配给构成DRACH基序的核苷酸。通过控制GC含量和基因位置等混杂因素的严格分析,可以验证AI确实学到了科学上正确的模式,从而增加我们对模型的信任,甚至帮助我们完善自身的生物学理解。

追踪无形之敌:从大流行病到病患护理

在医学和公共卫生领域,追溯原因的追求尤为紧迫。当一种新疾病出现时,首要问题是“它从哪里来?”和“谁应负责?”

在基因组学时代,我们可以以惊人的精度回答第一个问题。对于一种从动物传播到人类的人畜共患病,我们可以利用归因科学和进化生物学的完美融合来追溯其起源。通过对来自不同宿主(比如人类、蝙蝠和果子狸)的病原体基因组进行测序,我们可以构建一个系统发育树——一个显示不同样本如何相关的遗传家族树。然后,利用一个关于病原体如何突变和在物种间跳跃的概率模型,我们可以对这棵树进行归因分析。这使我们能够从“叶子”(观测到的样本)向后追溯到“根”(最近的共同祖先),并计算出该祖先存在于蝙蝠、果子狸或其他某种宿主物种中的后验概率。这是一种用于寻找大流行病源头的遗传谱系学。

“谁应负责”的问题在医疗保健管理中也具有非常实际的意义。为了衡量护理质量、按绩效付费,或者仅仅是帮助患者了解谁是他们的主治医生,卫生系统需要一种公平、透明且可复现的方法,将每位患者归因于单一的临床医生。这是一种不同风格的归因——不是关于物理因果关系,而是关于分配责任。然而,其逻辑惊人地相似。必须选择一个模型。一个“前瞻性”归因模型可能会将您分配给您在注册时选择的初级保健医生。一个“回顾性”模型可能会回顾过去一年,将您分配给您访问最频繁的医生。如果出现平局怎么办?就像在气候科学中一样,规则必须精确。一个确定性的打破平局的层级结构——例如,使用最近的访问日期,如果仍然平局,则使用提供者的唯一ID号——对于确保系统公平且可审计至关重要。这表明,归因的核心原则对于我们社会系统的运作是不可或缺的。

人的因素:伦理、决策与科学功劳

我们已经看到了归因科学在自然界和我们的技术中发挥作用。但它最具挑战性的应用出现在当它将镜头转回我们自身——我们的决策、我们的伦理和我们的历史时。

随着人工智能变得越来越强大,尤其是在生物医学领域,它也带来了双重用途的担忧。一个在设计治疗性药物方面高效的AI模型,原则上可以被用来设计毒素。我们能否使用归因科学来审计我们自己的AI系统以防范此类风险?想象一个使用个人遗传血统作为特征的生物医学模型。即使这个特征提高了预测准确性,如果该模型被用于有害目的,其包含本身就创造了潜在的危险。我们可以使用特征归因来计算一个“敏感归因分数”——模型预测能力中依赖于此类敏感特征的比例。一个高值将标志着潜在的安全风险。这不是万能药;归因是一种相关性诊断,可能会被代理变量或复杂的非线性关系所欺骗。但它提供了一道至关重要的第一道防线,一个指导技术负责任发展的道德罗盘。

最终,我们追求归因是为了做出更好的决策。科学在变得与决策相关之前,是不完整的。假设一项气候归因研究得出结论,某种类型的洪水现在发生的可能性是原来的2.5到5.0倍。这种不确定性是不可简化的。城市规划者如何利用这一点?稳健决策框架提供了答案。经济学家可以采纳这个风险比区间 [2.5,5.0][2.5, 5.0][2.5,5.0],并将其代入一个优化问题。然后,城市可以通过找到在归因研究得出的最坏情况概率下提供最佳结果的选择,来解决新的防洪墙的最佳投资水平。例如,在这样一个假设情景中,对目标函数的导数分析显示其为正,这意味着在此稳健框架下的最优策略是全面投资。这提供了一条从气候科学的输出到具体的、实地的适应行动的直接、理性的途径。

最后,让我们思考一下科学事业本身的人文核心:功劳。链霉素的发现,作为第一种有效对抗结核病的抗生素,是20世纪医学的里程碑。它也引发了一场关于谁应获得功劳的激烈争论。Selman Waksman 是设计系统性筛选土壤微生物这一宏大研究计划的教授。Albert Schatz 是在其 Waksman 实验室工作的研究生,他进行了关键的实验:他分离出了特定的细菌,并证明了其对抗结核病的独特能力。诺贝尔奖单独授予了 Waksman。但这正确吗?从归因的角度看,我们是在要求为一个结果分配贡献。现代科学伦理,不同于1940年代的等级规范,会认为两人都是不可或缺的共同发现者。Waksman 提供了宏大的战略愿景和必要的资源。Schatz 提供了关键的、非显而易见的实验突破。两者的贡献都是必不可少的;任何一方都不足以单独完成。这提醒我们,归因不仅仅是一种技术工具。它是一项公平和认可的基本原则,支撑着我们称之为科学的集体知识探索。