try ai
科普
编辑
分享
反馈
  • 随机不确定性与认知不确定性:“未知”的两面性

随机不确定性与认知不确定性:“未知”的两面性

SciencePedia玻尔百科
核心要点
  • 随机不确定性是系统固有的随机性(如掷骰子),而认知不确定性是可减少的知识缺乏(如未知参数)。
  • 这种区分至关重要,因为它决定了行动方向:我们通过稳健设计来管理随机风险,通过更多数据和研究来攻克认知风险。
  • 贝叶斯推断和全方差定律等数学工具使我们能够在预测中对这两种不确定性进行建模、区分和量化。
  • 该框架被应用于不同领域,包括工程安全、医疗决策、天气预报以及新技术的伦理治理。

引言

不确定性是我们存在的一个基本方面,它承认我们对世界的知识是不完整的。无论我们是预测飓风的路径、设计关键部件,还是做出改变一生的医疗决定,我们都是在信息不完整的情况下进行操作。然而,仅仅承认不确定性的存在是不够的。不同类型的不确定性之间存在着一个关键但常被忽视的区别,未能认识到这一点可能导致模型缺陷、策略失效和政策误导。本文旨在通过揭示两种主要不确定性形式——随机不确定性和认知不确定性——的神秘面纱,来弥补这一知识鸿沟。

本指南的结构旨在为这一关键概念提供清晰而实用的理解。在“原理与机制”一章中,我们将深入探讨随机不确定性(内在随机性)和认知不确定性(可减少的无知)的核心定义。我们将探讨为什么这种区分如此重要,并考察贝叶斯推断和全方差定律等数学框架,这些框架使我们能够对这些组成部分进行建模和分离。在建立了这一基础性理解之后,“应用与跨学科联系”一章将展示这种区分在实践中如何成为一个强大的工具。我们将通过来自工程、气象学、医学和公共政策领域的真实案例,阐明对不确定性的清晰洞察如何带来更稳健的设计、更坦诚的沟通和更明智的决策。

原理与机制

在我们理解世界的旅程中,我们不断面临不确定性。这是我们谦逊地承认我们并非无所不知。但事实证明,并非所有的不确定性都是生而平等的。实际上,它以两种截然不同的形式出现。学会区分它们不仅仅是一项学术活动;它是构建更好模型、做出更明智决策以及理解知识本质的关键。

“未知”的两种类型

想象一位工程师,他的任务是预测一块附着在通道壁上的金属板,是否会因流经其旁边的湍流热流体所产生的应力而失效。这位工程师面临着一场未知因素的风暴。流体的流入本质上是混沌的;其速度每时每刻都在不可预测地波动。同时,这块金属板本身具有特定的材料刚度——其杨氏模量——但这特定板的精确值并不为人所知;它可能在制造商指定的范围内的任何位置。

这里我们简明扼要地看到了不确定性的两种类型。

首先,是​​随机不确定性​​(aleatory uncertainty),源自拉丁语 alea,意为“骰子”。这是宇宙固有的模糊性,其不可简化的随机性。即使我们拥有一个完美的世界模型,并以上帝般的精度知晓其所有参数,这种变异性仍然存在。它是河流中湍流涡旋的混沌之舞,是屋顶上雨滴落下的随机时刻,或是两个人偶然相遇导致疾病传播。对于我们工程师的问题,流体速度 U∞(t)U_{\infty}(t)U∞​(t) 的瞬时波动是随机的。我们可以描述其统计特性,但我们永远无法预测下一次阵风的精确值。这是系统的属性。

其次,我们有​​认知不确定性​​(epistemic uncertainty),源自希腊语 episteme,意为“知识”。这种不确定性源于我们自身知识的缺乏。这是一个世界对某个量的秘密,这个量在现实中是单一且固定的值,但我们只是不知道它是什么。这是我们自己头脑中的迷雾,至关重要的是,它是可以减少的。我们可以通过收集更多数据、精炼我们的测量或改进我们的理论来减少它。在我们例子中,那块已安装的金属板,其杨氏模量 EEE 是一个固定的数值。我们对它的不确定性是认知的。如果我们把板取出来进行测试,我们就可以确定其具体的刚度,这种不确定性就会消失。同样,如果我们的物理模型不完美——例如,如果湍流模型中的一个常数 CμC_{\mu}Cμ​ 在特定流态下未知——我们对该常数的不确定性也是认知的 [@problem-id:3531533]。这是我们知识的属性。

为何区分很重要:从模型到决策

这种区分不仅仅是哲学上的吹毛求疵。它非常实用,因为它告诉我们下一步该做什么。我们需要一个更好的理论,还是需要更大的减震器?答案完全取决于我们面临的是哪种不确定性。

我们在模型中表示这些不确定性的方式有着根本的不同。

​​随机不确定性​​通过将随机性直接构建到数学中来建模。我们使用概率和随机过程的语言。我们可能会将流体的波动速度或传感器中的噪声建模为一个随机过程 W(t)W(t)W(t),或者使用随机场来表示岩石属性从一点到另一点的内在变异性。这种模型的目标不是预测单一结果,而是预测所有可能结果的分布。

另一方面,​​认知不确定性​​通过探索我们无知的后果来处理。在贝叶斯推断这一强大的框架中,我们将我们对一个未知参数(如病毒的真实传播率 θ\thetaθ)的信念状态编码为一个称为​​先验​​(prior)的概率分布 p(θ)p(\theta)p(θ)。当我们从现实世界中收集数据 yyy 时,我们使用贝叶斯定理将我们的信念更新为一个​​后验​​(posterior)分布 p(θ∣y)p(\theta \mid y)p(θ∣y)。这巧妙地划分了问题:数据生成过程的随机性被捕获在似然函数 p(y∣θ)p(y \mid \theta)p(y∣θ) 中,而我们对底层参数的认知不确定性则被捕获在 θ\thetaθ 的先验和后验分布中。数据同化技术,如粒子滤波器,允许一个系统的“数字孪生”通过将其预测与真实世界的测量结果进行比较,来不断学习并缩小其认知不确定性。

但是,如果我们的无知如此深重,以至于我们甚至无法为一个未知参数确定一个单一的概率分布呢?在​​深度不确定性​​(deep uncertainty)的情况下,例如试图将实验室的毒性数据外推到真实世界的生态系统,我们可能只能说一个参数 μ\muμ 位于一个区间 [a,b][a, b][a,b] 内。在这里,我们必须转向其他工具。我们可能不会对各种可能性进行平均,而是采取一种稳健的、最坏情况的方法,提问:“假设这个参数取最坏的合理值,我能采取的最具保护性的行动是什么?” [@problem-id:2498272]。这是预防原则的数学体现,是认识到我们深度认知不确定性本质的直接结果。

大分离:厘清波动的来源

在任何现实系统中,两种类型的不确定性都同时存在并相互纠缠。例如,一个复杂部件的数字孪生,既受到其输入 u(t)u(t)u(t) 和传感器 n(t)n(t)n(t) 中随机噪声的影响,也受到其参数 θ\thetaθ 甚至模型方程形式本身的认知不确定性的影响,后者由一个差异项 d(x,t)d(x,t)d(x,t) 表示。为了理解我们最终预测中的总不确定性,我们需要一种方法将它们分离开来。

幸运的是,数学为此提供了一个优美的工具:​​全方差定律​​(Law of Total Variance)。假设我们正在预测一个量 YYY,比如一次流行病中的累计病例数。我们预测的总方差 Var⁡(Y)\operatorname{Var}(Y)Var(Y) 可以被 neatly 分成两个部分:

Var⁡(Y)=Eθ[Var⁡(Y∣θ)]+Var⁡θ(E[Y∣θ])\operatorname{Var}(Y) = \mathbb{E}_{\theta}[\operatorname{Var}(Y \mid \theta)] + \operatorname{Var}_{\theta}(\mathbb{E}[Y \mid \theta])Var(Y)=Eθ​[Var(Y∣θ)]+Varθ​(E[Y∣θ])

不要被这些符号吓到。这个方程讲述了一个简单而深刻的故事。它说我们预测的总波动(Var⁡(Y)\operatorname{Var}(Y)Var(Y))是两个贡献的总和:

  1. ​​随机贡献​​:第一项 Eθ[Var⁡(Y∣θ)]\mathbb{E}_{\theta}[\operatorname{Var}(Y \mid \theta)]Eθ​[Var(Y∣θ)] 是我们从系统固有随机性 (Var⁡(Y∣θ)\operatorname{Var}(Y \mid \theta)Var(Y∣θ)) 中预期的平均方差量,这个平均是在我们不确定的所有可能参数值 θ\thetaθ 上计算的。这是来自随机不确定性的贡献。

  2. ​​认知贡献​​:第二项 Var⁡θ(E[Y∣θ])\operatorname{Var}_{\theta}(\mathbb{E}[Y \mid \theta])Varθ​(E[Y∣θ]) 表示随着我们改变对未知参数 θ\thetaθ 的假设,我们的平均预测 (E[Y∣θ]\mathbb{E}[Y \mid \theta]E[Y∣θ]) 会变化多少。这是来自我们认知不确定性的贡献。

考虑一个公共卫生团队正在为一个疫情建模。假设他们的分析显示,随机方差部分(来自谁感染谁的随机性)非常大,比如说 900 (病例)2900 \, (\text{病例})^2900(病例)2,而认知方差部分(来自不知道确切传播率)则小得多,也许是 100 (病例)2100 \, (\text{病例})^2100(病例)2。这种分解为行动提供了有力的指导。它表明,花费大量预算进行更多监测以确定传播率,对总不确定性的削减作用很小。不可预测性的主要来源是疫情本身的内在随机性。一个更明智的政策可能是投资于应急能力——更多的医院床位、员工和物资——为由巨大的随机不确定性所决定的广泛可能结果做准备。

当界限变得模糊:建模者的选择

最后,重要的是要认识到,随机和认知之间的界限并不总是一条由自然界划定的、固定而清晰的线。有时,它是我们作为建模者,根据我们探究的范围在沙地上划出的一条线。

想想制造电池。如果我们正在分析一个稳定且控制良好的过程,我们可能会将电极孔隙率等属性的微小、电芯间的差异视为随机不确定性。我们可以用一个单一的、平稳的概率分布来对其建模。然而,如果我们发现不同批次的原材料导致系统性地不同的平均孔隙率怎么办?这被称为“批次间漂移”。现在,对于一个随机挑选的电芯,其孔隙率取决于它来自哪个批次——这个事实我们可能不知道。我们对批次来源的知识缺乏引入了一层新的认知不确定性。这些电芯不再是​​可交换的​​(exchangeable);知道一个电芯的孔隙率会给我们提供关于批次的线索,从而提供关于同一批次其他电芯可能孔隙率的线索。将变异性视为纯粹的随机性还是混合型,取决于我们是否可以假设过程是稳定的,并且其生产的物品是可交换的。

认识到不确定性的两面性是转型性的一步。它使我们能够通过评估我们总预测分布的校准情况来恰当地验证我们的模型与现实。它澄清了我们的思维,指导了我们的建模,并在科学、工程和公共政策中导致了更诚实、稳健和有效的决策。从本质上讲,这是明智地保持不确定的艺术。

应用与跨学科联系

在阐明了随机和认知不确定性的理论脉络之后,我们现在走出抽象,进入现实世界。在这里,我们将看到这种区分不仅仅是哲学家的消遣或统计学家的精微之处。它是科学家、工程师、医生和政策制定者看待现实的强大透镜——一个塑造我们如何建造桥梁、预测天气、治疗疾病以及面对科学伦理前沿的工具。从本质上讲,它是在一个部分是掷骰子、部分是未解之谜的世界中航行的实用指南。

工程师的世界:为偶然与无知而建

想象一下工程师的任务。他们是现代的先知,不是预言人类事务,而是预言钢铁、混凝土和硅的行为。他们的预言,我们称之为设计,必须能够抵御自然的力量和使用的严酷考验。在这里,不确定性的两面性持续地相互作用。

考虑一位设计支撑柱的结构工程师。他们可能正在使用一块采石场的石头。即使这块石头来自一个“均匀”的源头,其内部结构也是由颗粒和微裂纹组成的混沌织锦。如果你从中切割十个样本,每个样本的强度都会略有不同。这种样本间的离散性是​​随机不确定性​​——材料本身固有的、不可简化的随机性。对那一块石头进行再多的额外测试,也无法告诉你你切割的下一个样本的确切强度。这是宇宙内置的变异性。

现在,将其与一个不同的问题进行对比。假设工程师正在使用一种全新的、尖端的合金。关于这种合金在极端条件下(如非常高速的冲击)的行为数据可能很稀缺。在这种未经测试的领域中,对其基本属性的不确定性是​​认知的​​。它不是随机性;它是我们集体知识中的一个缺口。这个缺口可以被弥合。我们可以进行更多实验,发展更好的物理理论,并减少我们的无知。

同样的二元性也出现在我们的结构必须承受的载荷上。在任何一个星期二,桥上汽车和卡车的混沌、瞬时的到来是一个随机过程。我们可以对其进行统计描述,但我们无法预测确切的序列。另一方面,在一个只有两个冬天数据的新地点估算屋顶可能的最大雪荷载,是一项涉及认知不确定性的工作。我们的估算不稳固,因为我们的记录很短;再多十年的数据会给我们一个更自信的答案。

这种区分不仅仅是学术性的;它决定了行动。我们通过安全系数来管理随机风险,设计一座足够坚固的桥梁以承受99.99百分位的随机交通。我们通过研究和数据收集来攻克认知风险——我们建立一个高应变率测试设施或安装更多的气象站。

这场戏剧也在微观尺度上演。在半导体制造厂中,每个微芯片都诞生于一个称为化学机械平坦化(CMP)的过程中,该过程将晶圆抛光至原子级的平滑度。即使机器的设置保持完全恒定,由于抛光浆料的湍流和其他微观偶然因素,去除率在不同晶圆之间也会略有变化。这是生产线上的随机噪声。但随着天数和周数的推移,抛光垫会磨损,工具的传感器可能会漂移。工具的真实“状态”变得未知,从而在其性能中引入了一个缓慢的、系统性的变化。我们对这个隐藏的工具状态的不确定性是认知的。为了应对它,工程师们采用了一种聪明的策略:他们使用经过认证的参考晶圆进行定期检查,并使用原位传感器来跟踪工具的行为,不断更新他们的知识,减少他们对机器真实状况的无知。

数字孪生:模拟世界,模拟不确定性

在现代,我们越来越多地不是用钢铁和石头来建造,而是用比特和字节。我们创造“数字孪生”——从喷气发动机到地球气候的各种事物的庞大计算模型。在这些虚拟世界中,随机和认知不确定性之间的区别是指导我们信任什么的一个原则。

想想天气预报。气象学家会创建一组预报,即一个天气未来的可能家族。为什么?因为他们的模型面临两种不确定性。他们对大气初始状态——各处的温度、压力和风——的知识是不完美的。气象站之间存在差距。这是​​认知不确定性​​。为了解释这一点,他们从一系列略有不同的初始条件开始他们的模型。但大气也是一个混沌系统。即使初始状态被完美知晓,微小的、未解析的现象,比如蝴蝶翅膀的扇动,或者更现实地说,单个湍流涡旋的行为,也会被放大成大规模的变化。这种固有的、爆炸性的不可预测性是​​随机不确定性​​的本质。一些先进的模型甚至通过内置随机(random)组件来代表这些未解析的小尺度过程的影响,从而接受了这一点。集合预报中的离散程度是我们初始无知和系统固有野性综合效应的视觉表示。

这引出了一个极其微妙而强大的思想,一种在许多领域都出现的层级式不确定性。有时,我们的认知不确定性是关于随机不确定性本身的。在地质力学中,模拟斜坡稳定性的工程师知道土壤强度会随地点的不同而随机变化——这是随机变异性,他们可以用“随机场”来建模。但他们通常对该随机场的参数深感不确定。平均强度是多少?变异范围有多宽?属性在多大距离上是相关的?这种对控制随机性的参数的知识缺乏是第二层不确定性,并且是认知的。同样的原则也适用于模拟生物组织中的营养物质输运或复合材料的弹性特性。

自然界为我们提供了一个优美的数学工具来处理这个问题:全方差定律。在其最简单的形式中,它告诉我们预测中的总不确定性可以分为两部分:一部分来自系统的内在随机性(随机),另一部分来自我们对模型参数的知识缺乏(认知)。更正式地,对于一个依赖于参数 θ\thetaθ 的目标量 QQQ: Var⁡(Q)=Eθ[Var⁡(Q∣θ)]+Var⁡θ(E[Q∣θ])\operatorname{Var}(Q) = \mathbb{E}_{\theta}\big[\operatorname{Var}(Q \mid \theta)\big] + \operatorname{Var}_{\theta}\big(\mathbb{E}[Q \mid \theta]\big)Var(Q)=Eθ​[Var(Q∣θ)]+Varθ​(E[Q∣θ]) 第一项是平均的随机方差。第二项是预期结果的方差,它捕捉了参数 θ\thetaθ 中的认知不确定性。这个优雅的公式允许建模者分解总不确定性,并看出有多少是由于“运气不好”,有多少是由于“我们知道得不够多”——这是决定是投资于更多研究还是设计更稳健系统的关键一步。

医生的两难:在病床边驾驭偶然与无知

在任何地方,随机和认知不确定性之间的区别都没有像在医生办公室那样变得如此个人化、如此人性化。在这里,它是医学中最神圣的职责之一——知情同意——的关键。

想象一位接受了癌症手术的病人。医生必须讨论复发的风险。他们可能会引用一项研究,表明具有相似特征的患者有,比如说,20%的复发风险。那个20%的数字被两种不确定性的幽灵所困扰。

首先,这个数字本身是一个估计,而不是神圣的真理。它来自对有限数量的人进行的研究,这些人可能在不同的医院,属于不同的人群。这位特定患者的真实风险可能更低或更高。围绕着20%这个数字的不确定性——也许合理的范围在12%到30%之间——是​​认知的​​。它是可以减少的。等待活检结果或更先进的扫描可能会缩小这个范围,并给出一个更个性化、更自信的估计。

但即使一位神谕者能告诉我们这位患者的风险恰好是19.7%,那又意味着什么呢?这意味着如果我们能将这位患者克隆一百次,大约有二十个会看到癌症复发。对于坐在房间里的单个患者来说,结果仍然是掷骰子。他们是落入19.7%的群体还是80.3%的群体,纯粹是不可简化的​​随机不确定性​​的问题。这是生物学的残酷彩票。

一位明智且有道德的临床医生必须传达这两者。将它们混为一谈就是对患者的失职。将20%的估计作为既定事实呈现,是隐藏了认知不确定性,剥夺了患者决定是否值得进行更多测试以减少这种无知的机会。只谈论随机性而不承认风险估计本身的不确定性,是助长一种宿命论。真正的共同决策发生在医生能够这样说的时候:“我们对您风险的最佳猜测是X。我们对这个数字不确定,原因如下。我们可以做Y测试来让我们的猜测更准确。但即使有了最好的猜测,最终的结果也包含着无人能预测的偶然因素。”这种诚实的区分是患者自主权的基础。

治理未来:预防、政策与我们的基因密码

这种区分证明其价值的最后一个舞台,是在科学与社会最宏大的挑战中。它为我们应该如何治理具有未知后果的强大新技术提供了道德和实践的指南。

考虑使用CRISPR进行种系基因编辑。这项技术提供了普罗米修斯般的力量来消除遗传性疾病,但它也带来了已知和未知的风险。一个社会应该如何决定是否继续前进?随机和认知不确定性的框架至关重要。

在基因组可预测位置发生“脱靶”突变的风险,在很大程度上是一种​​随机不确定性​​。通过广泛的实验,我们可以描述这种事件的概率。如果这个概率足够低,社会可能会决定这是一个可接受的风险,就像我们接受乘坐飞机的微小但非零的风险一样。我们可以通过设定概率性安全阈值和设计更精确的编辑工具来管理这种随机风险。

但基因编辑也带来了更深层、更可怕的不确定性。那些我们了解甚少的发育途径呢?一个旨在修复一个问题的编辑,会不会在几十年后或几代之后,造成一个无法预见且灾难性的问题?这是深刻的​​认知不确定性​​——一种深度无知的状态。我们不仅仅是有一个误差范围很宽的概率;我们甚至可能不知道可能的不良后果是什么。

对这两种不确定性的政策回应必须有根本的不同。我们管理随机风险。我们必须对深度认知风险采取预防措施。在如此深刻的无知面前果断行动是狂妄自大的顶峰。这是从优生学黑暗历史中得到的持久教训,在那里,造成巨大伤害的政策建立在虚假确定性和对人类遗传复杂性的故意无知的基础之上。当我们不知道我们在做什么时,第一步不是行动,而是学习。这意味着促进研究,要求透明度,进行广泛的公众讨论,并可能实施临时暂停,直到我们的知识能够赶上我们的雄心。

从一块石头的强度到我们物种的未来,区分什么是随机的,什么是未知的这个简单行为,为我们提供了一个清晰的框架。它让我们在一个永远无法完全预测的世界里理性行事,将可管理的风险与需要我们谨慎、谦逊和不懈求知欲的深刻无知分离开来。