参数不确定性

玻尔百科

核心要点

科学模型面临两种类型的不确定性：偶然不确定性（内在随机性）和认知不确定性（知识的缺乏），这两种不确定性必须以不同的方式进行管理。
通过收集更多数据并应用像贝叶斯推断这样的统计方法，可以系统地减少关于模型参数的认知不确定性。
模型参数中的微小不确定性会在预测中传播并被放大，这使得不确定性量化对于鲁棒和安全的设计至关重要。
像最优实验设计这样的现代方法，利用模型的不确定性作为指导，来确定要进行的最具信息量的实验。

引言

在探索理解和预测世界的过程中，科学家和工程师依赖于数学模型。然而，一个根本性的挑战始终存在：这些模型中的参数——那些定义力的强度、反应的速率或种群增长的数字——永远无法以完美的精度获知。这种参数不确定性并非一个需要隐藏的缺陷，而是科学知识的一个关键方面，它直接影响我们预测的可靠性。未能恰当地考虑这种不确定性可能导致过于自信的结论、有缺陷的设计以及错失发现的机会。

本文为理解和管理参数不确定性提供了一份全面的指南。它强调了采用一种超越单一“最佳猜测”值的复杂方法的迫切需求。在接下来的章节中，您将发现支配不确定性的基本原则、其在众多学科中的实际影响，以及为在一个信息不完美的世界中导航而开发的强大工具。

首先，在原理与机制部分，我们将把不确定性分解为两种基本类型：世界的内在随机性（偶然不确定性）和我们自身知识的欠缺（认知不确定性）。我们将探讨不确定性量化、敏感性分析以及从数据中学习的循环等核心概念。然后，在应用与跨学科联系部分，我们将看到这些原则的实际应用，途经化学、工程、医学和生态学，以了解各领域的专业人士如何处理和利用参数不确定性来做出鲁棒的决策并加速发现。

原理与机制

想象一下你正在观看一场射箭比赛。弓箭手是世界级的专家，但即便如此，他们的箭也不会全都落在完全相同的位置。箭矢在靶心周围形成一个紧密的簇，存在一种微小、固有的散布。现在，想象你是一位试图预测下一箭会落在何处的科学家。你的预测面临两种截然不同的不确定性。第一种是弓箭手无法避免的、微小的抖动——释放和肌肉张力的轻微变化，造成了那种随机的散布。这是一种你无法消除的不确定性。第二种是，你可能不知道箭的确切规格——它的精确重量、箭羽的空气阻力。这是你自身知识的缺乏。如果有人告诉你箭的确切重量，你的预测就会得到改善。

这个简单的类比抓住了科学家和工程师每天都要面对的两种基本“类型”的不确定性。为了建立可靠的世界模型，我们不仅必须承认不确定性，还必须理解其不同的来源，因为它们并非生而平等。在科学语言中，我们称之为偶然不确定性和认知不确定性。

偶然不确定性：宇宙的嗡鸣

第一种不确定性，即弓箭手的随机散布，被称为偶然不确定性。这个词来源于拉丁语 alea，意为“骰子”，就是你在机会游戏中掷的那种。它代表了一个过程固有的、不可简化的随机性。它不是我们知识中的缺陷，而是现实世界的一个特征。

想想流经管道的湍流流体。即使我们完美地保持总流速，管道内任何单一点的速度都会在微秒之间混乱地波动。这些抖动是湍流的基本属性。即使拥有完美的计算机模型和对管道尺寸及流体性质的精确知识，我们也只能预测这些波动的统计特性，而不是它们的确切序列。这种固有的变异性就是偶然不确定性。

我们处处都能看到这一点。在计算生物学中，当我们用一组确定性方程来模拟细胞内分子的复杂舞蹈时，我们对系统的测量总是被仪器微小的、随机的误差所模糊。这种测量“噪声”是一种偶然不确定性；它是测量设备本身的嗡鸣。在生态学中，沿海盐沼产生的能量每年都在波动。这并非因为我们的模型是错误的，而是因为现实世界的环境驱动因素，如降雨和温度，本身就具有内在的随机性。这种“过程变异性”是生态系统动态的一个真实特征。

关于偶然不确定性的关键点在于，它为我们的预测能力设定了一个基本限制。我们无法通过收集更多关于系统固定属性的数据来消除它。然而，我们可以描述它、测量其量级，并将其作为我们预测周围已知程度的随机“模糊性”纳入我们的模型中。这是我们必须学会与之共存的那部分不确定性。

认知不确定性：我们自己制造的迷雾

第二种不确定性，即源于不知道箭的确切重量的不确定性，被称为认知不确定性。这个术语来自希腊语 epistēmē，意为“知识”。这是源于我们自身无知的不确定性。它是我们知识的局限，而非系统本身的特征。它是遮蔽我们看清事物真实、根本状态的迷雾。

让我们回到湍流管道的例子。虽然流体的波动是偶然的，但管道本身有一个固定的、确定的内壁粗糙度，这个参数我们可称之为 $k_s$ 。这个粗糙度会影响流动，但我们可能不知道它的确切值。也许是制造过程留下了一些变异，或者管道已经老化。对于这个特定的管道， $k_s$ 的值是一个单一的数字，但我们对其的无知在我们对压降的预测中造成了不确定性。这就是认知不确定性。

这种“无知的迷雾”笼罩着无数的科学模型。当生物学家写下描述细胞信号通路的方程时，这些方程包含参数——反应速率、结合亲和力——它们是该系统的固定物理常数。但我们很少能完美地知道它们的值。我们在这些参数 $\theta$ 上的不确定性是认知的。当地质学家为建筑物下方的地面建模时，他们知道土壤的强度和刚度并非均匀。他们可以用称为随机场的复杂统计工具来模拟这一点，但*该统计模型*的参数——平均强度、变异程度——本身通常是未知的。这是另一层认知不确定性。

认知不确定性的奇妙之处在于，原则上，它是可以减少的。这是我们自己造成的问题，我们也可以解决它。通过进行更多的测量、执行更有针对性的实验或运行更详细的模拟，我们可以更多地了解我们未知参数的真实值。我们可以驱散迷雾。

预测之舞：正向与逆向问题

这两种不确定性之间的相互作用，定义了科学方法核心的一场宏大舞蹈，一场预测与推断之间的舞蹈。

首先，我们进行正向不确定性量化。在这里，我们采用我们当前关于模型参数的知识状态——或知识的缺乏（我们的认知不确定性，通常表示为“先验”概率分布），并将其通过我们模型的数学机制进行传播。我们问的问题是：“鉴于我认为我所知道的，我的预测将会有多不确定？” 结果的预测不是一个单一的数字，而是一个可能性的范围，是反映我们输入不确定性的输出概率分布。

然后，我们执行相反的步骤：逆向不确定性量化。这是从世界中学习的过程。我们收集真实数据——来自实验的测量值——并将它们与我们模型的预测范围进行比较。数据落在何处，告诉我们关于我们最初的哪些参数猜测更有可能。利用贝叶斯推断的强大框架，我们更新我们的知识，将我们模糊的“先验”信念转变为更清晰、由数据支撑的“后验”信念。我们利用数据减少了我们的认知不确定性。这个“预测、测量、更新”的循环是科学发现的引擎。

应对迷雾世界的智能策略

随着我们的模型变得越来越复杂，拥有数十甚至数千个未知参数，我们需要巧妙的策略来管理我们的认知迷雾。

最重要的问题之一是：“在我众多的未知参数中，我最应该担心哪一个？” 这就是敏感性分析的工作。一种天真的方法可能是每次只调整一个参数，看看会发生什么，但这会忽略参数之间丰富的、非线性的相互作用方式。一种更强大的方法，称为全局敏感性分析（GSA），它会同时探索所有可能的参数值范围。它可以告诉我们，预测中的总不确定性有多少比例是由参数A造成的，有多少比例是由参数B造成的，以及至关重要的是，有多少比例是由A和B之间的相互作用造成的。对于一个试图管理河流的环境规划者来说，GSA可以揭示哪个不确定的生态系数对他们的预测影响最大，从而指导他们将研究经费投向最有效的地方。

此外，如果收集数据成本高昂——比如说，每个数据点都需要一台超级计算机运行一周来计算原子间的量子力学力——我们就不能盲目地进行测量。主动学习是一种绝妙的策略，模型本身成为我们的向导。我们可以问模型：“在可能性的空间中，你在哪里最不确定？” 模型可以指向一个特定的原子构型，在该构型下其认知不确定性（通常通过观察一组不同模型的分歧程度来估计）最高。然后，我们就在那个确切的点上进行昂贵的计算，提供能够最有效地减少模型无知并全面提高其预测能力的数据。

不确定性的统一观点

最终，我们做出的任何预测中的总不确定性都是这两种基本类型的组合。我们的预测分布既被世界固有的随机性（偶然不确定性）所模糊，也被我们自身知识的差距（认知不确定性）所模糊。在数学上，我们预测的总方差可以优美地分解为两部分：一个代表平均偶然噪声的项，以及一个代表从我们参数传播而来的不确定性的第二项。

科学家或工程师的目标不是实现绝对的确定性；那是不可能的。宇宙的偶然嗡鸣将永远存在。真正的目标是解开这两者——理解我们的不确定性有多少是根本性的，有多少是自己造成的无知。通过巧妙的实验、强大的统计推断和不断改进的模型来系统地减少我们的认知不确定性，我们使我们的预测更清晰，我们的决策更鲁棒。这种对我们所知和所不知的复杂而诚实的核算，是现代科学技术的基础，使我们能够在一个充满不确定性的世界中航行，甚至塑造它。

应用与跨学科联系

想象你是一位古代的制图师，任务是绘制一幅已知世界的地图。你手上有来自水手的报告、天文学家的测量数据以及旅行者的草图。这些信息没有一个是完美的。水手可能记错了海岸线；天文学家的测量可能有丝毫偏差；旅行者对山高的估计只是一个猜测。因此，你的地图不能用无限清晰的线条来绘制。海岸线有一定的模糊性，山峰的高度也有一系列可能的海拔。要创作一幅诚实的地图，你不仅要画出你所知的世界，还必须标示出你自己不确定的区域。

在现代科学中，我们的“地图”是数学模型，而“地貌特征”是这些模型的参数。与古代制图师一样，现代科学家知道这些参数——定义力的强度、反应的速率或种群增长的数字——永远无法以完美的精度获知。这种模糊性就是参数不确定性。它不是一个需要纠正的缺陷，也不是一个需要隐藏的弱点。它是我们知识的一个根本的、不可避免的、且信息极其丰富的方面。理解它的作用就是理解科学的真实运作方式，以及它如何从不完美的数据中构建出鲁棒的知识。掌握这种不确定性的征途是一场宏大的冒险，它统一了从化学家的实验室到工程师的车间，从生态学家的田野笔记到医学前沿的各个学科。

涟漪效应：微小的疑虑如何引发重大的问题

让我们从化学世界开始，这个世界表面上看起来是精确配方和反应的世界。假设我们想知道一氧化碳燃烧形成二氧化碳时会释放多少能量，这个反应对于从发动机设计到行星科学都至关重要。这个能量，即反应焓，随温度而变化。为了预测它，我们需要知道所涉及的每种分子的热容。我们可以在实验室测量这个值，并且我们常常发现用一个简单的温度多项式函数来描述数据很方便， $C_p(T) = a + bT + cT^2$ 。系数 $a$ 、 $b$ 和 $c$ 就是我们的参数。但是，当我们用这条曲线去拟合我们带有噪声的实验数据时，我们得到的 $a$ 、 $b$ 和 $c$ 的值并非唯一；存在一小团可能的取值。它们是不确定的。

现在，有趣的部分来了。当我们用我们的模型来预测一个非常高温度下的反应焓时，这个温度远离我们最初进行测量的范围，那么 $a$ 、 $b$ 和 $c$ 中的微小不确定性不仅仅是相加——它们会传播并可能被放大。我们对高温能量释放的预测本身现在也是不确定的。一位负责任的化学工程师不仅必须知道预测的能量值，还必须知道该预测中不确定性的大小，因为它可能关乎一个安全的设计与一个灾难性故障之间的区别。这种*不确定性传播*的思想是物理科学的基石。它需要一种对疑虑的记账，常常要求我们不仅追踪每个参数的不确定性，还要追踪它们是如何相关的——即 $a$ 中的一个误差可能如何与 $c$ 中的一个误差相关联。

这个原则远远超出了化学家的烧杯。考虑一位正在设计桥梁的工程师。钢梁会因数百万辆汽车驶过而承受疲劳。材料的抗疲劳性由一个带有参数的定律来描述，比如 $C$ 和 $m$ ，这些参数是通过测试钢材样本来确定的。但并非每一块钢材都完全相同。存在固有的变异性。工程师不能使用 $C$ 和 $m$ 的单一“真实”值。相反，他们可能会使用一个区间来表示可能值的范围。通过提问“在这些参数已知范围内的最坏情况下，失效的概率是多少？”，工程师可以设计出一个即使面对我们对其组成部分的不完美知识也能保持鲁棒和安全的结构。

或者，让我们跳到医学领域。一种新药被设计用来阻断细胞中一个功能失常的信号通路。它的有效性由一个带有结合亲和力和细胞反应参数的模型来描述。但是你的细胞和我的细胞并不相同。人与人之间存在巨大的生物学变异性，而我们的实验室测量也有其自身的误差。因此，模型参数最好不是用单一数值来描述，而是用概率分布来描述。为了预测一个群体对药物的反应，药理学家不能只代入平均参数值。他们必须拥抱不确定性的完整分布。利用像蒙特卡洛模拟这样的强大计算方法，他们可以模拟成千上万个“虚拟病人”，每个病人都有一套从这些分布中抽取的略有不同的生物学参数，并预测结果的范围——即药物疗效的不确定性。

在所有这些案例中——一个化学反应、一根钢梁、一种救命药物——故事都是相同的。参数不确定性不是一个脚注；它是情节的核心。但正如我们将看到的，“不确定性”本身不是一个单一、庞大的概念。它有不同的类型，而科学已经发展出一套引人入胜的工具集来驯服它们。

不确定性大全及其驯服工具箱

为了对世界做出诚实的预测，我们必须首先诚实地面对我们可能无知的不同方式。一个很好的例子来自生态学，即种群生存力分析（PVA）的挑战。想象一下，你的任务是预测一个濒危物种的灭绝风险。

你可能会建立一个模型，其中下一年的种群数量取决于今年的种群数量和一个平均增长率，比如 $r$ 。一个不确定性的来源是你不知道 $r$ 的确切值。你有一些数据，但是有限的。这是参数不确定性——我们对系统一个固定的、真实的（但未知的）属性的无知。但是还有第二种，完全不同的不确定性。即使一个神一样的存在告诉了你 $r$ 的确切值，由于好天气和坏天气、随机的死亡和幸运的出生，种群数量仍然会年复一年地波动。这种世界固有的随机性被称为过程变异性或随机性。一个好的PVA模型必须同时包含这两者。它必须考虑到我们对潜在平均趋势的模糊知识，以及自然界围绕该趋势的随机波动。混淆这两者是建模中的一个大忌，会导致预测要么过于自信，要么毫无希望地模糊。

认识到不确定性的这些不同类型，促使人们开发出独特而强大的知识工具箱来处理它们。

其中最深刻的之一是贝叶斯视角。对于贝叶斯主义者来说，不确定性是关于*信念状态的陈述。一个参数的值不仅仅是“未知的”；相反，我们对其可能的值有一个信念程度，表示为概率分布。我们从一个先验*分布开始，它代表了我们在看到数据之前的信念。然后，我们用数据来更新我们的信念，形成一个后验分布。这个由贝叶斯法则支配的过程，是从经验中学习的数学形式化。在像模拟气候变化这样复杂的问题中，我们有描述变暖趋势、自然周期等的参数。我们可以使用像哈密顿蒙特卡洛这样的复杂算法来探索后验分布的高维景观，这给了我们一张丰富的地图，显示了在给定历史温度记录的情况下，哪些参数组合是最可信的。这远比一个带有误差条的单一“最佳拟合”值信息量大得多。

与贝叶斯观点形成对比的是同样强大的频率派工具箱，它包括基于似然和重采样的方法。例如，在进化生物学中，科学家重建生命之树。进化模型有参数（如基因突变率），而树的形状本身，即拓扑结构，也可以被视为一个参数。不确定性是巨大的。一个绝妙的频率派工具是自助法（bootstrap）。它基于一个简单而强大的思想：我们的数据是“真实”世界的一个样本；如果我们采样的结果稍有不同会怎样？自助法通过反复从我们自己的数据中进行重采样（有放回地）来模拟这一点，以创建数千个伪重复数据集。对于每一个数据集，我们重新运行整个分析——重新估计所有参数甚至树的拓扑结构。我们在数千次重复中看到的结果变化，为我们提供了一个直接、鲁棒的关于我们不确定性的度量。另一种方法是使用似然函数本身。这个函数告诉我们，对于任何给定的参数集，我们的数据有多大的可能性。我们可以构建一个“置信区间”或区域，其中包含所有似然“足够高”的参数值，这种方法被称为剖面似然。这些方法的严谨性至关重要；在材料科学等领域，一份关于材料成分的合格科学报告不仅需要最终结果，还需要详细说明参数不确定性（包括其相关性）是如何从原始数据传播而来的，这通常是通过一个称为方差-协方差矩阵的结构来实现的。

然而，有时我们的目标不是描述不确定性，而是战胜它。这引出了工程师的鲁棒性思维。想象一下，你正在管理一个云计算服务。你的客户有一个服务水平协议（SLA），规定处理延迟不得超过某个阈值。总延迟取决于许多因素——网络延迟、计算时间、存储访问——它们的贡献是不确定的。你关心的不是平均延迟；你关心的是保证最坏情况下的延迟不会违反SLA。这就是鲁棒优化的世界。在这里，你定义一个“不确定性集”，其中包含你的不确定参数所有可能的值。然后，你设计你的系统，使其在该集合内的每一个可能的参数值下都能正常工作。这就是我们构建系统的方式，从互联网基础设施到飞机，即使我们不能完美预测其运行条件，我们也能信任它们。

前沿：以不确定性为罗盘

几个世纪以来，参数不确定性被视为一种麻烦，是分析中最后一步不情愿报告的内容。但现代的观点要令人兴奋得多。我们已经开始利用我们对不确定性的知识作为发现的工具，一个指向新知识之路的罗盘。

这就是最优实验设计背后的美妙思想。考虑一下科学家们试图揭示细胞内一个复杂的基因调控网络。他们可以建立许多相互竞争的数学模型（假说），并且对于每个模型，参数都是不确定的。他们的预算有限，只能再进行少数几次实验。他们应该做哪个实验？是应该扰动基因A，还是基因B，或者两者都扰动？

答案非常巧妙：他们应该做那个他们预测将最大程度减少不确定性的实验。利用他们当前的模型和与参数相关的不确定性，他们可以对假设的实验进行模拟。对于每个模拟实验，他们可以计算参数不确定性会减少多少。然后他们选择那个有望带来最大“信息增益”的真实世界实验。实际上，他们正在使用自己无知的地图来导航通往知识的最有效路径。不确定性不再仅仅是地图模糊的边界；它是引导制图师的罗盘。

诚实科学家的指南

从大一化学课最基本的计算到系统生物学的前沿，参数不确定性是工作科学家的 постоянный伴侣。学会承认它、用正确的统计语言量化它、并通过我们的模型传播它，这是区分一厢情愿与可靠预测的关键。它使我们能够区分我们所知道的和我们仅仅怀疑的，设计出安全和鲁棒的系统，甚至引导我们未来的探究。拥抱这种不确定性是科学诚信的标志，也是发现的真正引擎。与疑虑共舞不是一场余兴表演；它是主戏。