try ai
科普
编辑
分享
反馈
  • 随机不确定性与认知不确定性:在偶然与无知间航行

随机不确定性与认知不确定性:在偶然与无知间航行

SciencePedia玻尔百科
核心要点
  • 不确定性并非单一概念;它分为随机不确定性(如掷骰子般的内在随机性)和认知不确定性(可以被减少的知识缺乏)。
  • 管理不确定性的正确策略取决于其类型:建立稳健性以对抗随机风险,收集更多信息以减少认知风险。
  • 混淆这两种类型,例如将测量误差误认为是真实的系统变异性,可能导致模型缺陷和决策失误,如高估灭绝风险。
  • 对于长期预测,我们对基本参数的无知(认知不确定性)通常比内在的年际随机性(随机不确定性)成为更大的不确定性来源。

引言

从金融市场到气候预测,再到医疗预后,我们的世界充满了不确定性。我们常常将所有未知事物视为一个单一、模糊的概念,然而这是一个关键的错误。一枚公平硬币的抛掷结果的不确定性,与一张古老、不完整的地图所带来的不确定性,有着本质上的不同。理解这种差异是管理风险、做出明智决策,以及区分何为内在不可预测、何为仅仅未知的关键。

本文将揭示这一关键区别,为理解、量化和应对不同形式的不确定性提供一个清晰的框架。它旨在纠正将所有未知因素混为一谈的常见但危险的做法,这种做法可能导致分析错误和策略失效。通过区分偶然与无知,我们可以学会何时应该投资于获取更多知识,何时应该构建更具韧性的系统。

首先,在“原理与机制”一节中,我们将探讨随机不确定性(偶然)和认知不确定性(无知)的核心定义,审视它们的数学基础以及区分二者的深远意义。然后,在“应用与跨学科联系”一节中,我们将遍览从结构工程、保护生物学到合成生物学和金融学等多个领域,见证这一概念透镜如何为解决现实世界的问题带来清晰度和力量。

原理与机制

我们生活在一个充满不确定性的世界。医生对病人做出预后判断,经济学家对市场进行预测,工程师为桥梁计算安全裕度。在日常语言中,我们将这些“未知”混为一谈。但在科学的语言里,这是一个关键的错误。要真正理解和管理世界,我们必须首先认识到,并非所有的不确定性都是相同的。你看,抛硬币的不确定性与不了解游戏规则的不确定性之间存在着深刻的差异。掌握这种区别,是踏上掌控风险、做出更明智决策、并领会偶然与知识之间微妙相互作用的征途上,第一步也是最重要的一步。

不确定性的两面:偶然 vs. 无知

想象一个简单的掷骰子游戏。你了解关于这枚骰子的一切——它是一个公平的、六面的正方体。规则完全清晰。然而,在你掷出它之前,你无法确定哪一面会朝上。你只能用概率来描述:掷出四点的几率是六分之一,掷出六点的几率也是六分之一。这就是​​随机不确定性​​(aleatory uncertainty)。这个名字来源于拉丁词 alea,意为骰子。它代表了系统中内在的、不可简化的随机性或变异性。它是世界本身的一种属性。即使对系统的规则有完美的了解,单个事件的结果仍然是偶然的。

现在,想象另一种不确定性。假设有人递给你一枚硬币,让你预测抛掷的结果,但你不知道这枚硬币是公平的还是加权的。正反面的概率是50/50,还是70/30?下一次抛掷的结果仍然是随机的,但这里存在一个更深层次的不确定性:你对这枚硬币的一个基本属性一无所知。这就是​​认知不确定性​​(epistemic uncertainty)。这个名字来源于希腊词 epistēmē,意为知识。它代表了对原则上可知事物的知识缺乏。硬币的偏倚度有一个单一的、真实的值;你只是不知道它而已。与掷骰子不同,你可以减少这种不确定性。通过多次抛掷硬币并记录结果,你可以越来越确信其真实的偏倚度。认知不确定性不是世界的属性,而是我们对其理解的局限。

这一根本区别在科学和工程领域无处不在。

  • 由混沌湍流引起的每一次冲击力的变化是随机的;它是系统内在的“摆动”。管道入口处水流速度的瞬时随机波动是随机的。驱动生态系统生产力的年际降雨量变化是随机的。这就是宇宙在掷骰子。
  • 相比之下,工程师在手册中查到的弹簧的真实刚度是一个单一的、固定的数值。不确定性来源于手册提供的是一个通用值,而不是对那个特定弹簧的精确测量。这是认知的。影响流体流动的管道内表面的确切、固定的粗糙度,是我们可能不知道的单一数值。我们对其的不确定性是认知的。这些是向我们隐藏的事实,等待被发现。

深入探究无知:层层剥开认知洋葱

正如正确的方式不止一种,无知的方式也各不相同。认知不确定性,即我们知识的缺乏,并非一团混沌的迷雾;它有几种截然不同的类型,每一种都有其自身的特点。

首先是​​测量误差​​(measurement error)。我们的仪器,无论多么精密,都不是完美的。它们给我们呈现的是一幅略显模糊的现实图景。一位生态学家在清点昆虫种群时可能会漏数或重复计数。得出的数字并非真实的丰度,而是真实丰度加上或减去一些噪声。一座测量森林二氧化碳交换的灵敏仪器塔给我们的是一个估计值,而非绝对的真理。这类不确定性不会改变潜在的现实——昆虫的真实数量仍然是那个真实数量——但它模糊了我们的观测窗口。

其次,我们面临​​参数不确定性​​(parameter uncertainty)。我们的科学模型就像食谱,而参数就是配料的用量。想象一下生态学家用来模拟食草动物从植物中获取多少能量的模型:S=αβ⋅NPPS = \alpha \beta \cdot \text{NPP}S=αβ⋅NPP。在这里,NPPNPPNPP 是植物净初级生产量,β\betaβ 是被吃掉的植物的比例,而 α\alphaα 是“同化效率”,即被吃掉的食物中转化为食草动物生物量的部分。我们可能从过去的研究中对 α\alphaα 和 β\betaβ 有一个大致的了解,但我们不知道它们在这个特定生态系统中的确切数值。我们对这些固定但未知的数值的不确定性就是参数不确定性。这是对宇宙控制面板上精确设置的知识缺乏。

最后,也是最深刻的,我们有​​模型不确定性​​(model uncertainty)。这是一种可怕的认知,即我们可能连正确的食谱都没有。一位工程师可能对材料的能量使用 EEE 如何随其寿命 LLL 变化有两种不同的、相互竞争的理论。一个模型可能认为关系是线性的,E∝LE \propto LE∝L,而另一个模型则认为它是一个幂律关系,E∝L0.7E \propto L^{0.7}E∝L0.7。这并非模型内参数的不确定性,而是关于模型本身基本结构的不确定性。我们不确定我们应该讲述的究竟是哪个故事。

为何这一区别不仅仅是学术性的

所以,我们有偶然(随机)和无知(认知),而无知又分为几种类型。为什么这种细致的分类如此重要?因为识别不确定性的性质会告诉你该做什么。应对随机不确定性和认知不确定性的策略是完全不同的。

要对抗​​认知不确定性​​,策略很简单:​​去获取更多信息​​。你通过学习来减少无知。

  • 如果你不确定材料的刚度,你就进行更多的力学测试。
  • 如果你不确定一个种群的长期增长率,你就资助一个更长期的监测项目。
  • 如果你不知道一个生物学参数,你可以设计一个有针对性的实验来测量它。 在每种情况下,你都在投入资源以增进你的知识,减少无知的迷雾。这正是科学方法和决策理论中“信息价值”的全部原则。

但你无法对​​随机不确定性​​这样做。再多的数据收集也无法告诉你下一次公平抛硬币的结果。随机性是内在的。这里的策略不是消除不确定性,而是构建能够承受它的系统。这就是​​稳健性​​(robustness)和​​韧性​​(resilience)的领域。

  • 你不会试图预测百年一遇的洪水;你会把桥建得足够坚固以抵御它。
  • 你不会试图预测明天哪只股票会上涨;你会分散你的投资组合,这样任何单只股票的随机游走都不会让你倾家荡产。
  • 一位河流管理者,面对天气内在的随机性,可能会释放额外的水作为安全缓冲,确保鱼类种群即使在意外干旱的年份也能存活下来。 你不是战胜偶然;你是为它的后果做好准备。

当我们将这两者混淆时,危险就出现了。想象一位生态学家研究一个数量随时间波动的种群。这些波动由两个因素引起:环境中真实的年际变化(随机的过程噪声)和计数方法的不完美(认知的观测误差)。如果这位生态学家不加区分地将所有观测到的变异性归为一谈,并称之为“过程噪声”,那么他就在犯一个严重的错误。他将自己测量的模糊性归因于世界本身比实际更混乱。这会导致一个过程方差被夸大的模型。当这个有缺陷的模型被用来预测未来时,它会系统性地​​高估灭绝的风险​​。这可能导致“狼来了”的局面,基于对系统风险真实性质的误解而触发昂贵且不必要的管理行动。

波动性的数学:不确定性如何转化为行动

这个优美的概念区别不仅仅是哲学上的,它被直接刻画在我们用来描述世界的数学中。在许多领域,如经济学,一个简单的、“一阶”近似的系统会表现出一种称为​​确定性等价​​(certainty equivalence)的性质。这意味着模型的行为就好像未来是确定的一样——所有随机变量都被它们的平均值所取代。在这样的模型中,一个主体的决策完全无视风险。波动性,即围绕平均值的摆动,被忽略了。

要看到风险的重要性,你必须看得更深,达到“二阶”近似。这里,函数的曲率开始发挥作用。对于一个风险规避的人来说,确定的100美元的效用大于50/50概率获得0美元或200美元的平均效用。效用函数是弯曲的(u′′(c)0u''(c) 0u′′(c)0)这一事实意味着方差会降低期望效用。一个二阶模型捕捉到了这一点。在这些更复杂的模型中,主体会表现出像​​预防性储蓄​​(precautionary savings)这样的行为。当他们感知到未来更具波动性时——当他们经历“风险冲击”时——他们会理性地选择减少消费并增加储蓄,为前方的波涛汹涌创造一个缓冲。他们的行动是对随机不确定性大小的直接反应。

我们可以在一个鱼类种群模型中更清楚地看到这一点。我们对 ttt 年后种群规模预测的总方差 Var⁡(log⁡Nt)\operatorname{Var}(\log N_t)Var(logNt​),可以根据全方差定律分解为两部分:

Var⁡(log⁡Nt)=tσe2⏟Aleatory+t2σr2⏟Epistemic\operatorname{Var}(\log N_t) = \underbrace{t \sigma_e^2}_{\text{Aleatory}} + \underbrace{t^2 \sigma_r^2}_{\text{Epistemic}}Var(logNt​)=Aleatorytσe2​​​+Epistemict2σr2​​​

在这里,σe2\sigma_e^2σe2​ 是由年际环境随机性(随机)引起的方差,而 σr2\sigma_r^2σr2​ 是由我们对种群真实平均增长率的不确定性(认知)引起的方差。看看它们如何随时间跨度 ttt 变化!随机部分随时间线性增长,但认知部分随时间的平方增长。这个简单的公式蕴含着一个深刻的教训:对于长期预测,我们对基本参数的无知(t2σr2t^2\sigma_r^2t2σr2​)很快就成为比年际内在波动(tσe2t\sigma_e^2tσe2​)大得多的不确定性来源。数学本身告诉我们,如果我们想确保种群的长期未来,我们的最高优先事项应该是通过投资于学习真实增长率来减少我们的无知。

最终,随机不确定性的根源可能编织在物理定律的结构之中。在量子世界里,一个处于激发态的原子最终会通过发射光子跃迁到较低的能级。但这是在何时发生?令人惊讶的是,没有一个确定的“何时”。自发辐射的过程发生在一个根本随机的时刻。Heisenberg的测不准原理(Uncertainty Principle)规定,一个状态的能量不确定性(ΔE\Delta EΔE)与其寿命(Δt\Delta tΔt)之间存在权衡。有限的寿命意味着非零的能量宽度,这转化为发射时间的一个不可简化的概率分布。这种不可预测性不是我们知识的失败;它是一条自然法则。因此,作为科学家、工程师和决策者,我们的任务是双重的。我们必须不懈努力以减少我们的认知不确定性——推动我们无知的边界。但我们也必须培养智慧和工具,以驾驭、尊重并建立韧性,来对抗随机不确定性——这个充满活力、生机勃勃的宇宙永恒的标志。

应用与跨学科联系

想象你即将踏上海上航行。你面临两种未知。首先是风暴、不可预测的大风和异常巨浪,这些是海洋固有特性的一部分。你无法将它们驱散。你唯一的办法是建造一艘足够坚固的船来抵御它们。这是​​随机不确定性​​——世界中不可简化的、统计上的随机性。其次,你目的地的地图陈旧且不完整。可能存在未标记的礁石或沙洲。这是​​认知不确定性​​——你知识上的一个缺口。你可以通过派出侦察员、使用更好的望远镜或寻找更有经验的航海家来减少这种不确定性。

这个简单的区别不仅仅是哲学家的游戏;它是现代科学和工程中最强大的组织原则之一。知道你面对的是哪种不确定性,会告诉你该做什么:是建立更稳健的防御来抵御偶然性的变幻莫测,还是投资于学习以驱散无知的迷雾。在我们看过了原理之后,现在让我们踏上其应用的旅程,见证这个单一理念如何为众多领域带来惊人的清晰度。

工程一个可靠的世界

我们的旅程始于有形的工程世界。当我们建造一座桥梁、一个化工厂或一块计算机芯片时,我们是在承诺它将可靠地工作。但在一个不确定的世界里,我们如何能做出任何承诺?

思考一位结构工程师设计一座公路桥梁的任务。她必须考虑日常的交通负荷。十年后某个星期二将要过桥的车辆的确切数量、重量和时间是无法预测的。这是一种经典的随机不确定性,即交通的“天气”。工程师并不试图消除这种随机性;相反,她将桥梁设计得对其统计特性具有稳健性,确保它能轻松应对预期交通量的第99.9个百分位。

但假设她正在使用一种全新的金属合金。实验室已经对其进行了测试,但其在极高应变率下的疲劳特性是未知的。这是一种认知不确定性——我们知识中的一个漏洞。这里的解决方案不是盲目地增加一个巨大的安全系数(尽管保留一些总是审慎的!),而是减少不确定性。工程师可以委托进行更多测试,在实验室中将材料推向极限,并完善其本构模型。通过收集更多数据,她可以缩小其知识的误差范围,从而得到一个更高效且同样安全的设计。

这种对不确定性的细致考量延伸到了最精细的尺度。在分析化学中,滴定似乎是一个简单的程序,但要达到高精度需要理解每一个“抖动”的来源。不确定性来自玻璃滴定管的制造公差、在刻度线之间目测弯月面的随机性,以及化学指示剂颜色变化的内在变异性。这些因素中的每一个都贡献了少量的随机噪声。计量学,即测量科学,提供了一种严谨的演算方法——不确定性传播——来组合这些方差,并报告最终浓度,不是作为一个单一的数字,而是作为一个具有已知置信度的数字,这是对我们所知和仍然受偶然性影响的部分的诚实陈述。

驾驭自然的复杂性

在生态学和环境管理领域,没有什么地方比这里更能体现两种不确定性之间相互作用的重要性了,因为我们的决策可能会产生不可逆转的后果。

想象一位河流管理者正在考虑水电大坝的新运营方案。目标是为夏季节省更多的水,但这将改变一种本地鲤科鱼类赖以产卵的春季洪水。这位管理者面临着大自然的随机不确定性:明年春天是丰水年还是枯水年?这是气候系统不可简化的随机性。但她也面临着一个严重的认知不确定性:将河流流量与鱼类补充量联系起来的科学模型仅基于几年的数据。模型的关键参数是模糊的。

解决方案是什么?一种称为​​适应性管理​​(adaptive management)的绝佳策略,它将认知不确定性视为需要主动消除的对象。管理者可以实施实验性的水坝放流,并仔细监测鱼类的反应。管理行为本身就变成了旨在减少无知的科学实验。新的数据不断流入,不确定的模型参数得到更新——通常使用贝叶斯统计方法——从而为未来的决策提供更好的依据。我们通过实践来学习。

这种方法在种群生存力分析(PVA)中得以形式化,PVA是现代保护生物学的基石。在试图将一个物种从灭绝中拯救出来时,PVA模型就像是该种群的飞行模拟器。它包含了所有的随机风险:繁殖的随机好年景和坏年景(环境随机性)、小种群中个体未能繁殖的纯粹坏运气(人口随机性),以及干旱或流行病等罕见灾难的偶然性。但它也明确包含了我们对物种真实生命率(例如,存活率和繁殖力)的认知不确定性。其输出不是单一的预测,而是在不同管理行动下灭绝的概率。它使我们能够发问:鉴于我们的无知,哪种行动能给物种带来最大的生存机会?

这种与不确定性的谨慎共舞也是我们保护人类健康的核心方式。当监管机构为一种新农药设定安全暴露限值时,他们是根据​​预防原则​​(Precautionary Principle)行事。这一过程通常始于一项对大鼠研究得出的“未观察到有害作用的水平”(NOAEL)。为了将其转化为人类的“参考剂量”(RfD),会应用一系列不确定性因子:

RfD=NOAELUFtotal⋅MF\text{RfD} = \frac{\text{NOAEL}}{\text{UF}_{\text{total}} \cdot \text{MF}}RfD=UFtotal​⋅MFNOAEL​

这些因子并非任意设定。它们是对认知不确定性的制度化承认。有一个因子(通常为10)用于从动物外推到人类,另一个10倍因子用于保护多样化人群中的敏感个体,如果毒理学数据库不完整,还会再加一个因子。我们实际上是在说:“因为我们在这些特定方面存在无知,我们将相应地建立一个安全缓冲。”缓冲的大小直接取决于我们不确定性的大小。渔业管理的框架遵循类似的逻辑,设定捕捞限额,使其对鱼类种群的随机波动和我们对种群真实增长率的认知不确定性都具有稳健性。

在科学与风险的前沿

当我们进入科学和技术的新领域时,随机不确定性和认知不确定性之间的区别变得更加深刻。

在合成生物学中,科学家们正在设计具有新功能的微生物。一个首要的关注点是生物防护:确保这些生物不会逃逸并在野外繁衍生息。可以设计一个“终止开关”,使其在实验室外没有特殊化学品供应时激活。但失败的风险有多大?在这里,两种不确定性截然不同。外界的炎热天气可能导致温度敏感的终止开关失效,这是一种随机风险,由天气统计数据决定。但终止开关存在根本性缺陷,即使在理想条件下也会失败的可能性,则是关于系统可靠性的认知不确定性。贝叶斯统计是解决这个问题的完美工具。我们从对失效率的先验信念开始,进行实验,然后更新我们的信念。在100次试验中观察到零次失败并不能证明系统是完美的。贝叶斯推断使我们能够说:“经过这些实验,我们有95%的信心认为失效率不高于 XXX。”这是一种用于表达和减少我们无知的正式、量化的语言。

也许我们这个时代最宏大的挑战是预测气候变化。地球系统模型是我们最好的工具,但它们极其复杂,不同的模型给出不同的预测——这清楚地表明我们对气候系统的理解存在认知不确定性。一种突破这种困境的强大技术是“涌现约束”(emergent constraint)。科学家们可能会在众多模型中发现一种关系:例如,那些模拟出当今更强的云层季节性循环(一个可观测、可测量的量)的模型,往往会预测未来更大幅度的变暖。这种关系就是涌现约束。通过对那个当今变量进行精确的现实世界观测,我们可以有效地“约束”未来结果的合理范围。这是一种巧妙的方法,利用今天的数据来减少我们对明天世界的认知不确定性。

追踪经济世界中的波动性

金融世界是波动的代名词。在这里,区分不确定性的类型也是管理风险的关键。考虑一家大银行的运营风险——来自欺诈、系统故障或人为错误的损失风险。银行潜在的“风险性”并非一个可直接测量的量;它是一个潜在的、隐藏的状态。我们只能观察到它的症状:损失事件的数量及其财务严重性。

像​​卡尔曼滤波器​​(Kalman filter)这样的复杂工具被用来从这些可观察的线索中反向推断风险的隐藏状态。该模型在其核心承认了随机不确定性:下一次损失事件的确切时间和规模是随机的。但整个滤波练习的目的是减少关于银行当前风险水平的认知不确定性。潜在的风险性是呈上升趋势还是下降趋势?通过每季度吸收新的损失数据,银行可以更新其对这一隐藏状态的信念,从而在危机展开前采取纠正措施。滤波器帮助将不可见变为可见。

结论:决策的指南针

从桥梁的基石到合成生物体的遗传密码,从单个物种的命运到全球气候的未来,同样的基本问题出现了:我们的不确定性的本质是什么?是掷骰子,是我们必须参与的游戏的内在特征?还是我们自身无知投下的阴影,一个我们可以用更多知识的光芒来缩小的阴影?

随机不确定性与认知不确定性之间的区别远不止是一种技术分类。它是一个理性行动的指南针。它指导我们决定何时建立更坚固的盾牌以抵御偶然性的必然风暴,以及何时投资于更好的地图以在未知的领域中航行。在一个由变化和复杂性定义的世界里,它是我们拥有的、用以做出明智和稳健决策的最重要工具之一。