
在科学和生活的方方面面,我们都在与未知作斗争。我们面对不确定性进行预测、建立模型并采取行动。然而,将所有不确定性视为一个单一、同质的问题是一个根本性的错误。无法预测雨滴产生的涟漪的确切形状,与因缺乏足够数据而无法预测硬币抛掷结果,这两种“无法预测”有着本质上的不同。本文旨在通过解析不确定性的两个主要方面——偶然不确定性(aleatory uncertainty)和认知不确定性(epistemic uncertainty)——来填补一个关键的知识空白。
本文提供了一个全面的框架来理解这一至关重要的区别。在第一章“原理与机制”中,我们将探讨偶然不确定性(世界固有的随机性)和认知不确定性(我们知识中的空白)的核心概念。您将了解到这些概念如何在科学模型中体现,以及全方差定律(Law of Total Variance)如何提供一个精确的数学工具来将它们分离开来。随后,“应用与跨学科联系”一章将展示这一区别所带来的深远实际影响。我们将遍历工程、医学、法律和伦理学领域,看一看区分机遇与无知是如何指导我们从设计更安全的飞机到做出富有人情味的临床决策等一切事务的。读完本文,您将获得一个强大的新视角,用以分析问题和驾驭这个充满不确定性的复杂世界。
想象一下,我们正在观察一滴雨水落入水坑。涟漪散开,形成一幅复杂而美丽的图案。现在,如果我请你预测下一滴雨水产生的涟漪的确切形状,你会发现这是不可能的。为什么?你的不确定性有两个层面,解开它们是所有科学领域中最深刻、最实用的任务之一。这就是关于偶然不确定性和认知不确定性的故事。
让我们从一个更简单的游戏开始:抛硬币。我们说得到正面的概率是二分之一。但宇宙真的在用这枚硬币掷骰子吗?如果你知道拇指弹动的确切力量、精确的旋转、硬币的重量分布以及房间里空气的微妙流动,经典力学定律将让你确定无疑地知道结果。你在这里的不确定性并非源于世界的基本随机性,而是源于你知识的缺乏。这就是认知不确定性(epistemic uncertainty),源自希腊语episteme,意为“知识”。原则上,它是可以减少的。借助足够强大的相机和计算机,你可以收集所需数据来进行预测。你的无知将会缩小。
但是,世界是否存在一个真正随机的层面?也许在量子层面,微小且不可避免的涨落使得结果从根本上无法预测。这种不确定性代表了一个系统固有的变异性或随机性,被称为偶然不确定性(aleatory uncertainty),源自拉丁语alea,意为“骰子”。即使你对系统的结构和参数有完美的了解,这种随机性仍然会存在。它是不可减少的。
这种区分不仅仅是哲学家的游戏。它是我们理解、建模和预测世界的核心组织原则,从医院的运作到自动驾驶汽车的安全,无不如此。
我们的科学模型并非现实的完美复制品;它们是简化的草图。这些草图包含两种不确定性,它们直接对应于我们所说的机遇的两个面孔。
思考一下管理医院急诊科(ED)的挑战。我们想建立一个计算机模拟来预测患者等待时间并优化人员配置。我们立刻就会面临固有的随机性:患者并非按照固定的时间表到达。他们的到来更像是随机的散点,我们或许可以用泊松分布来建模。即使我们知道平均到达率,比如每小时 位患者,任何一小时内的实际人数都像是掷骰子。这是系统的偶然不确定性。它是我们所建模世界的一个特征,而不是我们模型中的一个缺陷。
但是,我们怎么知道平均到达率是 呢?我们是根据历史数据估算的。如果我们的数据稀疏,或者需求最近发生了变化,我们对 的估计可能就不准确。模型参数的这种不确定性是认知不确定性的典型例子。它反映了我们有限的数据。我们可以通过收集更多数据来减少这种不确定性,从而使我们对 的估计更加精确。
此外,我们模型的正确结构是什么?我们应该将急诊科表示为所有患者的单一队列,还是它有一个为不太严重病例设置的独立“快速通道”?我们对正确模型形式的犹豫是认知不确定性的另一层面。我们可以通过更仔细地观察医院的运作并确定其真实工作流程来减少这种不确定性。
因此,在一个单一的实际问题中,我们看到了两种不确定性都在起作用:世界不可减少的随机性(偶然的)和源于我们自身对模型参数和结构不完全了解的可减少的不确定性(认知的)。
值得注意的是,这种概念上的分离有一个精确的数学对应物。当我们对任何复杂系统——无论是喷气发动机部件的温度还是移植肝脏的功能——做出预测时,我们预测中的总不确定性可以被完美地分解。其关键是一项优美的数学成果,称为全方差定律(Law of Total Variance)。
假设我们想预测一个量 。我们的总不确定性是它的方差 。我们用符号 来表示我们模型中所有不确定的部分(比如弹簧刚度、热导率或平均患者到达率等参数)。这个 代表了我们的认知不确定性。全方差定律告诉我们:
我们不要被这些符号吓倒;其思想非常简单。
第一项 是偶然部分。内层的 代表了如果我们完全知道参数 时系统的固有随机性。它来自传感器噪声或微小的物理波动。外层的期望 只是将这种固有随机性在我们考虑的所有可能的 值上进行平均。它是不可减少的模糊性的期望值。
第二项 是认知部分。内层的 是我们在给定特定参数选择 时对 的最佳预测。外层的方差 衡量的是,当我们考虑 的不同可能值时,这个最佳预测会摇摆多少。如果我们完全知道 ,这一项就是零;我们对它越无知,这一项就越大。它直接源于我们知识的缺乏。
这个方程是一个强大的透镜。它告诉我们,我们面临的总不确定性是系统固有随机性与我们自身无知所带来的不确定性之和。
这种分解不仅优雅,而且具有战略指导意义。它告诉我们,必须用两种不同的武器来对抗两种类型的不确定性。
我们通过学习来攻击认知不确定性。我们收集数据并用它来减少我们的无知。考虑一辆汽车自动刹车系统的“数字孪生”。轮胎与路面之间的真实摩擦力,一个我们可以称为 的参数,是未知的。我们从一个宽泛的猜测开始——一个先验概率分布 。随着汽车行驶,传感器收集关于刹车性能的数据 。然后我们可以使用贝叶斯推断来更新我们的信念,产生一个新的、更清晰的后验分布 。这个数字孪生正在从经验中学习。随着学习的进行,我们不确定性方程中的认知项会缩小。这就是粒子滤波器和卡尔曼滤波器等数据同化技术的全部目的:用传入的信息系统地减少我们的无知。
然而,我们无法消除偶然不确定性。我们这里的武器不是消除,而是表征。我们努力建立能够正确捕捉固有随机性性质和幅度的模型。在一个热力系统的模型中,这可能意味着包含随机噪声项 ,以表示随机的传感器波动。目标是正确设置方差 ,这样我们模型的预测就有了正确的“模糊度”。
这里有一个有趣而微妙的点。有时,我们建模为偶然噪声的东西,实际上是承认认知不确定性的一种巧妙方式。在一个监测移植肝脏的模型中,可能会在状态方程中添加一个“过程噪声”项 。它可能不代表真正的生物学随机性,而是作为一个修正因子,用来解释我们简单的线性模型是对复杂、非线性生理学的不完美表示这一事实。它是我们模型结构性无知的一个代理。这凸显了批判性地思考我们模型中随机性来源的重要性。
在科学技术的前沿,偶然不确定性和认知不确定性之间的区别比以往任何时候都更加重要。
在人工智能领域,当我们训练一个模型来根据患者数据预测败血症风险时,我们正与这两种不确定性作斗争。著名的偏差-方差权衡(bias-variance tradeoff)是认知不确定性的直接体现。我们模型的“方差”来自于我们碰巧得到的有限训练数据集的随机性。“偏差”则来自于使用的模型类别可能过于简单,无法捕捉到真正的潜在模式。但即使是一个拥有无限数据的完美模型,也会面临一个根本的限制:偶然不确定性。具有相同可观察数据()的患者,由于未测量的因素或纯粹的生物学偶然性,仍可能有不同的结果()。这种不可减少的误差 为任何预测模型的性能设定了一个硬性上限。
在复杂系统中,比如一个经济的基于主体的模型,会出现新的不确定性来源。存在来自个体主体特异性冲击的偶然不确定性。但也存在一种有趣的结构性随机性:任何一个城市或经济体都由从更广泛人口中抽取的特定、有限的个人或公司集合组成。在某个实例中,主体的特定“组合”是一个偶然事件,这在不同城市之间造成了偶然变异性,即使它们遵循相同的基本规则。当然,关于这些基本规则是什么的不确定性仍然是认知的。
认知不确定性的最终形式不仅仅是对模型参数的不确定,而是对模型形式本身的不确定。先进的贝叶斯方法,比如那些使用Dirichlet 过程的方法,现在允许我们在整个可能的模型结构空间上赋予概率。这就像在说,“我不仅不确定我机器上的旋钮;我甚至不确定这台机器长什么样”,然后用数据来了解其基本设计。
从简单的抛硬币到人工智能的最前沿,这个简单的区别——区分世界上什么是随机的,与我们知识中缺少什么——提供了一个统一的框架。它给了我们一种语言来表达我们的无知,一个数学工具箱来剖析它,以及一个战略蓝图来征服可以征服的,并尊重那些不能征服的。从本质上讲,这正是科学探索的精髓。
我们已经探讨了一个优美而简单的思想:不确定性有两种类型:世界固有的随机性,我们称之为*偶然不确定性;以及我们自身知识的空白,我们称之为认知不确定性*。人们可能很想把这当作一个简洁的哲学区分,一种聪明的思维整理术。但这样做就完全错失了重点。这种区分并非抽象哲学问题;它是我们拥有的最强大、最实用的智力工具之一。它是一把刀,让我们能够清晰地分离开我们能管理什么和我们必须学习什么,什么是机遇问题,什么是无知问题。
现在,让我们踏上一段跨越人类探究领域的旅程,从喷气发动机的设计到病床前做出的痛苦抉择。我们将看到这同一个强大的思想在各处发挥作用,揭示了我们所面临的挑战以及我们寻求克服它们的方式中隐藏的统一性。
从本质上讲,工程学是一场对抗不确定性的战斗。工程师想要建造一座屹立不倒的桥梁,一台持续运转的引擎,一台进行计算的计算机,所有这些都必须具有坚定不移的可靠性。但世界是一个顽固多变的地方。面对未知,如何可靠地进行建造?秘诀在于知己知彼——了解你正在对抗的是哪种未知。
想象一下催化剂表面上分子的复杂舞蹈,这是现代化学大部分反应发生的微小舞台。我们对这些反应的模型,使我们能够设计从化肥到药物的一切,都依赖于了解分子附着在表面的能量。但我们对这些能量的计算,通常是通过复杂的量子力学模拟完成的,并非完美。我们使用的能量值存在不确定性,这是我们知识上的一个缺口。这是认知不确定性。我们可以,也确实通过更好的理论和更强大的计算机来减少它。但即使我们完美地知道了能量,一个分子落在表面一个空位上的过程本身也是一场机遇游戏。对于一个拥有大量位点的表面,被占据的位点数量会在平均值周围随机波动。这是真实世界中不可减少的、统计上的波动——偶然不确定性。要掌握这个反应,我们必须同时解决两者:我们进行更多研究以缩小我们对能量的认知不确定性,并且我们设计过程使其能够抵御我们知道永远无法消除的偶然波动。
让我们从原子尺度放大到你能看到和触摸到的东西:在空中飞行的飞机机翼。航空航天工程师的一个主要关切是预测机翼上的阻力。他们使用的计算机模拟——计算流体动力学的奇迹——由包含数十个参数的方程控制。我们知道我们湍流模型中所有系数的确切、正确的值吗?不知道。这是一种认知不确定性;我们的模型是不完整的。我们可以通过更多的风洞实验来减少它。但当飞机实际飞行时,它会受到随机、不可预测的阵风的冲击。这些阵风导致的阻力波动,是任何对模型参数的研究都无法消除的。那种变异性是偶然的。一个安全的飞机设计必须同时考虑到两者。机翼必须足够坚固以承受最坏情况下的随机阵风(管理偶然风险),并且设计过程必须足够谦虚以考虑到我们的模型可能不完美的可能性(管理认知风险)。
这种二元性也出现在最现代的技术中。想想你手机或电动汽车中的电池。当数以百万计的电池在生产线上制造时,材料厚度等方面会存在微小、不可避免的差异。这种电芯间的性能差异是一种偶然不确定性。这是一个制造一致性的问题。但是,最初用于设计这些电池的复杂基于物理的模型包含一些参数——比如锂离子的扩散系数——我们并未以完美的精度知晓。这是认知不-确定性。区分这两者告诉工程团队应该将精力集中在哪里。改进制造过程解决的是偶然分布问题;进行基础实验室实验以测量物理常数解决的是认知差距问题。一个是工厂车间的问题,另一个是研究实验室的问题。
那么我们如何区分它们呢?我们如何知道我们的天气预报错误是因为运气不好还是因为模型不好?例如,在预测风电场的输出时,湍流的混沌性质引入了一个不可减少的偶然部分。但我们的预测模型也是不完美的。诀窍是在错误中寻找线索。如果一个模型是好的,它的错误应该和它试图预测的东西一样随机——它们应该是纯粹的、无模式的噪声。但如果模型有缺陷——例如,如果它遗漏了一个重要的物理效应——它的错误就会有结构。它们会以同样的方式持续出错。通过分析我们失败的模式,我们可以诊断出我们知识中的差距(认知的),并将它们与我们必须忍受的纯粹机遇(偶然的)分离开来。
如果说工程学是一场与不确定性的战斗,那么医学就是一场与不确定性的谈判。这里的系统要复杂得多,而赌注是我们的生命。在这里,偶然不确定性与认知不确定性之间的区别不仅仅是制造更好东西的工具,更是做出更明智、更人道决定的指南。
考虑一下设计一种新药或预测一个新发现的基因突变是无害还是致病的挑战。我们为测试药物毒性而进行的实验受到测量噪声的影响,而且生物系统本身也具有固有的变异性。这是偶然不确定性。与此同时,我们用来预测这些属性的计算机模型是建立在有限且通常有偏见的数据集上的。一个在现有药物上训练的模型可能不知道如何评估一个全新的化学支架。这是认知不确定性。
区分这两者是进步的关键。如果一个模型的预测高度不确定,我们必须问为什么。如果不确定性是认知的——因为模型被迫推断到未知领域——答案很明确:我们需要更多数据。我们必须对那类新分子进行更多实验来教导模型。推迟决策以收集更多信息是正确的举动。但如果不确定性是偶然的——因为生物过程本身就有一个可变的结果(一个经典的例子是具有“不完全外显率”的基因变异,在某些人身上致病,但在另一些人身上则不会)——那么再多的数据也无法让不确定性消失。风险是不可减少的。任务于是从学习转变为管理。临床对话必须从“我们需要弄清楚这是否危险”转变为“这在一定比例的病例中是危险的,我们必须决定如何管理这种风险”。
这把我们带到了我们概念最深刻、最个人化的应用中,它指导着我们的沟通、我们的伦理,甚至我们的法律。
想象一位临床医生与一个患有罕见侵袭性癌症的孩子的父母坐在一起。他们问出了那个不可能回答的问题:“我们的孩子还能活多久?”。诚实的回答必须包含两种不确定性。医生的知识基于对其他儿童的研究,但对于这种罕见疾病,数据可能很稀少。预后模型是不确定的。这是一种深远的认知不确定性。医生必须通过说类似“根据我们有限的经验,估计是X”来传达这一点。但即使数据是完美的,任何一个孩子的生命历程也不是预先确定的。疾病在他们特定病例中如何进展存在一种不可减少的、偶然的随机性。医生通过范围和可能性来传达这一点:“可能是几周,也可能是几个月;没有人能确切知道。” 能够分离和阐明这两层不确定性是富有同情心、诚实沟通的基石,也是知情同意的基础。这是假装自己是神谕与作为一位智慧诚实的向导之间的区别。随着我们在医学中越来越依赖人工智能系统,这一点变得更加关键;一个提供风险评分却不同时传达其自身置信度(认知的)和结果固有随机性(偶然的)的人工智能不仅无益,而且在伦理上是危险的。
当我们思考那些触及人类未来的技术,如生殖系基因编辑时,赌注变得更高。在评估CRISPR的风险时,我们或许能够估计脱靶突变的随机概率——这是一种可以通过安全协议量化和管理的偶然风险。但我们对改变人类基因库的长期、多代后果却极度无知。这是一种巨大而可怕的认知不确定性。20世纪优生学的黑暗历史提供了一个令人不寒而栗的教训,告诉我们在面对深度无知时以傲慢的确定性行事的灾难性后果。区分这两种不确定性提供了一个明确的政策指令:我们管理已知的、随机的风险,但我们必须以一种深切的预防心态来对待广阔的未知,优先进行研究和公共讨论以减少我们的无知,然后再迈出不可逆转的一步。
最后,这种根本性的区别是如此强大,以至于它已经融入了我们法律体系的结构中。考虑一个医疗事故案件,其中诊断的疏忽延迟将患者的生存机会从(比如说)36%降低到22%。法院必须首先应对认知不确定性:它必须权衡证据,并根据概率平衡来决定生存机会是否真的被降低了。这是一个事实调查的问题,是减少法院自身知识缺乏的过程。但接着是偶然问题。即使有最好的护理,患者也只有36%的机会。他们死亡的可能性总是比生存的可能性更大。怎么能说疏忽“导致”了死亡呢?传统的法律框架对此感到困惑。但许多现代司法管辖区已经发展出一个绝妙的解决方案:“机会丧失”原则。这一法律理论承认,疏忽从患者那里夺走的不是一个确定性,而是一个概率性的机会。法律承认了结果的偶然性。因此,它判决的损害赔偿与所丧失的机会成比例。通过这种方式,法律在不放弃问责制的情况下,努力解决了不可减少的随机性问题。
从一个原子的悄然振动到关于我们集体未来的激烈辩论,区分机遇与无知的简单行为带来了清晰。它让我们既能大胆又能谦卑:大胆地努力管理我们能量度的风险,谦卑地面对我们尚不知晓的浩瀚未知。它是一个统一的原则,一种科学智慧,无论在何处应用都证明了其价值。