结构不确定性

玻尔百科

定义

结构不确定性是指由于选择了错误的模型数学形式或蓝图而产生的不确定性，它与模型参数不确定性或内在随机性有显著区别。即使收集无限的数据也无法消除结构不确定性，研究者通常采用贝叶斯模型平均等集成方法或结构奇异值（μ）来应对这一挑战。在气候科学和工程设计等领域，量化结构不确定性对于理解预测误差来源以及指导未来研究至关重要。

核心要点

结构不确定性源于为模型选择了错误的数学形式或蓝图，这与模型参数的不确定性或固有随机性不同。
与参数不确定性不同，结构不确定性无法通过简单地收集更多数据来消除，因为无限的数据只会完美地揭示模型的缺陷。
像贝叶斯模型平均法这样的集成方法通过结合多种模型结构来管理预测不确定性，并根据它们解释数据的能力赋予权重。
在工程学中，结构奇异值 (μ) 提供了一种形式化方法，用于设计能够在特定结构不确定性下保持稳定的鲁棒系统。
在气候科学等领域，量化结构不确定性对于理解预测误差的来源和有效指导未来的研究工作至关重要。

引言

模型是我们探索世界复杂性的重要地图，从分子的微观舞蹈到全球气候的宏大动态，无不如此。然而，每一幅地图都是一种近似，而模型与现实之间的鸿沟充满了不确定性。虽然有些不确定性源于随机偶然或不完美的测量，但一种更深刻且常被忽视的类型源于我们模型的蓝图本身——即其基本结构。本文旨在探讨结构不确定性这一关键概念，解决当我们无法确定核心假设是否正确时，如何构建可靠的系统并做出可信的预测。接下来的章节将首先剖析结构不确定性的“原理与机制”，将其与其他类型的误差区分开来，并探讨表征它的形式化方法。随后，“应用与跨学科联系”部分将展示其在不同领域（从鲁棒工程和合成生物学到气候预测）的真实世界后果及管理方法，揭示了坦诚地评估我们的无知是科技进步的基石。

原理与机制

要真正触及任何复杂系统的核心——无论是活细胞、地球气候，还是一件精密的工程设备——我们都必须建立模型。这些模型是我们对现实的地图，是帮助我们驾驭物理世界复杂领域的简化草图。但每位地图绘制者都知道，地图并非疆域本身。模型与现实之间的鸿沟是一片不确定性的土地，学会驾驭它正是现代科学的标志。然而，这种不确定性并非一团混沌的迷雾；它有着丰富的内部结构。通过理解这一结构，我们不仅能了解知识的局限，还能学会如何使我们的预测更加可靠和鲁棒。

无知的分类学

想象一下，我们的任务是预测一颗炮弹的落点。我们会面临几种不确定性。首先，即使我们的物理学知识是完美的，世界本身也存在固有的随机性。一阵突如其来的风，炮架的轻微晃动——这些都是不可预测的随机效应。这就是随机不确定性（aleatoric uncertainty），源自拉丁语 alea，意为骰子。这是宇宙在掷骰子。它是我们测量中的不可约减的噪声，也是过程本身的内在变异性。在医院急诊室，即使我们完全了解患者的平均到达率，下一小时内走进门的具体人数也是一个随机变量，由泊松分布等概率分布描述。在活细胞中，分子的舞蹈本质上是随机的，产生了内在噪声，导致即使是在相同环境下的基因相同的细胞之间也存在差异。我们无法消除这种不确定性，但可以对其进行表征。

与世界的随机性分开的是我们自身的无知。这就是认知不确定性（epistemic uncertainty），源自希腊语 episteme，意为知识。这是一种原则上可以通过收集更多数据或发展更好的理论来减少的不确定性。但在这里，我们必须做一个关键的区分，这也是我们主题的核心。

首先是参数不确定性。这是我们对所选模型的“调节旋钮”的不确定性。假设我们确信牛顿定律支配着我们的炮弹。我们有了正确的方程。但我们可能不知道炮弹的确切质量、火药的精确用量或炮管的准确角度。这些都是我们方程中的参数，即常数。我们对其真实值的不确定性就是参数不确定性。我们可以通过更仔细地称量炮弹的重量或使用更精确的量角器来减少它。在像 $y = f(x, \theta)$ 这样的模型中，这是我们对 $\theta$ 值的不确定性。

但如果我们甚至不确定自己是否使用了正确的定律呢？如果我们心中存疑，觉得亚里士多德的运动理论——物体寻找其自然位置的理论——或许是更好的描述，那该怎么办？这是一种更深、更根本的无知：结构不确定性。它关乎的不是机器上的旋钮，而是机器本身的蓝图。我们为模型选择的数学形式是否正确？我们是否遗漏了生物网络中的一个关键反馈回路？一种生物威胁制剂的效应是遵循简单的指数剂量-反应曲线，还是更复杂的曲线？地球气候系统最好由模型A还是模型B来描述，而这两个模型对云的形成有着根本不同的参数化方式？在状态空间表示中，这就是我们对函数 $f$ 和 $h$ 结构本身的不确定性。

机器中的幽灵与数据的局限

我们可以优美地将这个想法形式化。假设自然界的真实神圣过程由一个函数 $\eta(x)$ 给出。我们的模型，一个卑微的人类创造物，是一个函数 $f(x, \theta)$ 。如果我们的模型结构有缺陷，那么无论我们如何调整参数 $\theta$ ，都永远无法完美匹配现实。总会存在一个差距。我们可以定义一个模型差异函数（model discrepancy function） $\delta(x)$ ，作为现实与我们模型最佳尝试之间的差异：

\delta(x) = \eta(x) - f(x, \theta^{\star})

在这里， $\theta^{\star}$ 代表“最佳拟合”参数——即那些使我们有缺陷的模型尽可能接近现实的参数值。这个差异 $\delta(x)$ 就是机器中的幽灵。它是系统性误差，是我们模型结构不足的标志。

这里蕴含着一个发人深省而深刻的真理。人们可能认为，只要有足够的数据，我们所有的问题都会消失。如果我们能够用完美、无噪声的仪器无限次地观测系统，我们肯定能揭示真相。对于参数不确定性，这在很大程度上是正确的；有了足够的数据，我们可以非常精确地确定参数的值。但对于结构不确定性，情况并非如此。在无限、完美数据的极限下，我们将精确地了解函数 $\eta(x)$ 。我们也将精确地了解我们模型的最佳拟合参数 $\theta^{\star}$ 。但如果模型在结构上是错误的，差异 $\delta(x)$ 不会消失。相反，无限的数据只会无情而完美地揭示我们模型的根本缺陷。我们将找到的是最好的错误答案。

模型委员会

如果我们无法确定唯一的真实模型结构，我们该怎么办？固执地坚守一个单一模型，就是故意对自己的无知视而不见。一种更诚实、更强大的方法是拥抱这种不确定性。我们不建立一个模型，而是建立一个模型委员会，一个由多个成员组成的集成体，每个成员代表一个关于系统结构的不同、貌似合理的假设。一个模型可能假设疾病的接触结构很简单，而另一个则使用复杂的社交网络。一个气候模型可能使用一套物理方程来描述洋流，而另一个则使用不同的近似方法。

那么，我们该如何听取这个委员会的意见呢？概率定律以贝叶斯模型平均（BMA）的形式提供了一个优雅的答案。如果我们有一组模型 $\{M_1, M_2, \dots, M_K\}$ ，那么对于一个感兴趣的量 $y$ ，给定一些数据 $D$ ，其完整的预测分布并不是单个模型的预测。它是所有模型预测的加权平均值：

p(y | D) = \sum_{m=1}^{K} p(y | D, M_m) p(M_m | D)

这个方程是对智识谦逊的优美表达。它表明我们的最佳预测 $p(y | D)$ 是对我们所有候选模型的求和。每个模型 $M_m$ 贡献其自己的预测 $p(y | D, M_m)$ ，但这个贡献由 $p(M_m | D)$ 加权——这是该模型的后验概率，即在看到数据后我们对它的信任程度。能够很好地解释数据的模型，在最终共识中获得更大的发言权。这种跨越不同模型族的有原则的混合，是我们对模型结构认知不确定性的明确表示。一种更实用的方法，称为堆叠（stacking），通过测试哪种模型组合在预测新的、未见过的数据时表现最佳，来找到最优权重。无论哪种情况，核心思想都是相同的：集成体的预测比任何单个成员的预测都更鲁棒、更诚实。

当结构失效时：来自轨道的警示故事

误解结构不确定性不仅仅是一个学术错误；它会带来现实世界的后果。思考一位工程师为一颗卫星设计控制系统的故事。这位工程师需要考虑两个反作用轮惯量的不确定性。根据经验，他们假设每个轮子的微小变化是独立且不相关的。这个假设被直接构建到设计所用的数学框架中——不确定性由一个对角矩阵 $\boldsymbol{\Delta}_{design}$ 建模，其中代表相关性的非对角项为零。利用一种称为 $\mu$ -综合的强大技术，设计出的控制器在数学上被证明对于任何具有该对角结构的不确定性都是稳定的。

卫星发射了。在轨道上，它经历了温度波动，导致一个轮子的惯量增加，而另一个轮子的惯量以一种相关的方式减少。这个真实的物理过程对应于一个具有不同结构的不确定性——一个具有非对角项的结构 $\boldsymbol{\Delta}_{true}$ 。这个被认证为鲁棒的系统变得不稳定。为什么？因为稳定性的保证只对属于假设集合 $\boldsymbol{\Delta}_{design}$ 的扰动有效。真实的物理扰动，由于其不同的结构，处于该集合之外，保证也因此失效。这位工程师不只是弄错了一个参数；他们弄错了不确定性本身的蓝图。卫星翻滚不是因为一个数字，而是因为一个结构。

结构有多重要？

鉴于结构不确定性如此关键，量化其影响将非常有用。我们可以问：在我们预测的所有不确定性中，有多少是由于我们不知道该使用哪个模型蓝图造成的？全局敏感性分析提供了一种回答这个问题的方法。通过将模型的选择 $M$ 视为我们分析的输入之一，我们可以分解我们预测的总方差 $\mathrm{Var}(Y)$ 。纯粹由模型结构选择所贡献的方差部分由一个优美的项给出：

S_M = \frac{\mathrm{Var}_{M}\big(\mathbb{E}[Y \mid M]\big)}{\mathrm{Var}(Y)}

用通俗的语言来说，分子 $\mathrm{Var}_{M}(\mathbb{E}[Y \mid M])$ 衡量的是，当我们从一种模型结构切换到另一种时，每个模型的平均预测变化了多少。比率 $S_M$ 告诉我们总预测方差中有多大一部分是由于我们的候选模型在平均意见上存在根本分歧所致。这使我们能够看到我们的不确定性是由不知道使用哪个蓝图（高 $S_M$ ）主导，还是由不知道每个蓝图内旋钮的精确值主导。这是一个强大的工具，用于理解我们的无知真正所在，以及我们应该将努力集中在哪里以学到更多。

应用与跨学科联系

我们已经探索了结构不确定性的原理，学会了不把它看作模型中的一个简单缺陷，而是我们知识中一个深刻而有启示性的特征。现在，我们提出最重要的问题：那又怎样？这种新发现的理解在现实世界中有什么用处？事实证明，这不仅仅是一个学术上的区分。认识到我们无知的结构，是建造不会损坏的机器、设计有效的疗法以及对我们的世界做出可信预测的关键。应用领域与科学本身一样多种多样，但一种美妙的统一思想将它们全部联系在一起。

带着谦逊工程：为我们不完全了解的世界而设计

工程师的核心是实用主义者。他们必须建造能在现实世界中安全可靠运行的东西——桥梁、飞机、机器人——而不是在理想化的数学世界中。正是在这里，结构不确定性从一个哲学概念转变为一个关乎生死的设计参数。

想象一下为一种简单的机械对象设计控制系统的任务，比如两个由弹簧连接的质量块。我们的教科书模型干净而简单。但工程师知道真相。标记为 $1.0\,\mathrm{kg}$ 的质量块并非恰好是 $1.0\,\mathrm{kg}$ ；存在制造公差。弹簧的刚度并非完全已知。这些都是模型参数的不确定性。但存在更深层次的不确定性。我们的简单模型完全忽略了高频振动、执行器的微小延迟或传感器本身的动态。这些不仅仅是参数值不确定，它们是完全被模型方程遗漏的物理现象。这就是结构不确定性。

现代控制理论的精妙之处在于，它不会绝望地举手投降。相反，它提供了一种语言来形式化地描述这种结构化的无知。质量的不确定性，作为真实的物理常数，由实数表示。未建模的高频动态，涉及幅度和相移，由复数的、频率相关的块来捕获。所有这些部分被组装成一个单一的分块对角矩阵 $\Delta$ ，这是一个数学上的嵌合体，精确描绘了我们的不确定性。

但是，我们如何设计一个对这个 $\Delta$ 所描述的所有可能世界都安全的系统呢？我们需要一个工具，一种“鲁棒性标尺”。这个工具就是结构奇异值，或称 $\mu$ 。对于给定的模型 $M$ 和不确定性结构 $\Delta$ ， $\mu(M)$ 衡量的是可能破坏系统的最小不确定性量。主循环定理（Main Loop Theorem），作为鲁棒控制的基石，给了我们一个简单而强大的准则：如果 $\mu$ 在所有频率上的峰值小于1，那么系统就保证是稳定的，并且性能符合规范，无论我们不确定性宇宙 $\Delta$ 中出现哪个特定的“小妖精”。

真正非凡的是这个思想的普适性。让我们从机械小玩意跳到合成生物学的前沿。在这里，我们不是用钢铁和电线来建造，而是用DNA和蛋白质，试图设计一个基因回路——比如说，一个负反馈回路——来在细胞内执行特定功能。环境是混乱的，生物部件远非标准化，我们对其相互作用的模型也是不完整的。我们面临参数不确定性（例如，这个蛋白质与DNA结合的强度如何？）和结构不确定性（例如，我们忽略了哪些其他分子会干扰我们的回路？）。这个问题极其复杂，但确保我们基因回路鲁棒性的智力框架却完全相同。我们将系统建模为名义部分 $M$ 和不确定性块 $\Delta$ 的互联，并使用结构奇异值 $\mu$ 来证明我们的回路会工作。那个能将探测器降落在火星上的数学思想，同样可以用来设计一个生产救命药物的细胞。这就是科学在其最佳状态下的深刻统一性。

不确定性的两面：偶然与无知

当我们从设计系统转向描述自然世界时，不确定性的性质发生了变化。我们不仅会遇到我们自己的无知，还会遇到自然固有的随机性。这需要更精细的区分，即区分天生随机和我们仅仅未知的事物。

考虑为人类心脏细胞建模的挑战。动作电位——使心脏跳动的电脉冲——由离子通过复杂通道蛋白的流动所控制。我们可以写下优美的方程，但面临两种不确定性。首先是随机不确定性：从一个人到另一个人固有的、不可约减的变异性。你的心肌细胞和我的并不完全相同。这不是知识的缺乏；这是生物学的基本特征，一种偶然性。

然后是认知不确定性：我们自身的知识缺乏。这个类别包括参数的不确定性（我们没有完美地测量某个离子通道的电导）以及至关重要的结构不确定性。科学家们对于某个特定钙通道如何工作，可能有两种相互竞争的理论，两种不同的模型结构（ $M_1$ 和 $M_2$ ）。我们不知道哪种理论是正确的。这种无知原则上是可以减少的。一个巧妙的实验有一天可能会证明 $M_1$ 优于 $M_2$ 。

至关重要的是不要混淆这两者。随机不确定性告诉我们一个群体中预期结果的多样性，而认知不确定性告诉我们对我们的预测有多自信。卫生政策决策严重依赖于这种区分。在分析一种新疫苗的成本效益时，随机不确定性（这个特定的人会生病吗？）通过对大量人群的微观模拟来处理。认知不确定性（疫苗到底有多有效？）通过概率敏感性分析（PSA）来处理。而结构不确定性（我们是否选择了正确类型的流行病学模型——例如，一个包含群体免疫的模型与一个不包含的模型？）则通过在不同模型场景下运行整个分析来处理。混淆它们会导致错误的决策。

让我们能够进行这种分离的数学工具是极其优雅的全方差定律： $\operatorname{Var}(Y) = \operatorname{E}[\operatorname{Var}(Y|M)] + \operatorname{Var}(\operatorname{E}[Y|M])$ 本质上，它说总不确定性（总方差）是每个可能模型结构内部的平均不确定性（随机部分）和不同模型结构的平均预测之间的不确定性（认知、结构部分）的总和。这个方程就像一把手术刀，让我们能够将总不确定性干净地分解为其基本组成部分。

窥探未来：量化我们对明天的无知

在任何地方，结构不确定性的挑战都没有像我们试图预测地球未来时那样深刻或具有重大影响。当气候科学家预测2100年的全球温度时，他们面临着一个层级化的未知。

内部变异性： 气候是一个混沌系统。即使有一个完美的模型和完全已知的外部强迫，2075年某一天的天气也是不可预测的。这是一种随机不确定性，是气候系统固有的“噪声”。通过从略有不同的初始条件多次运行同一个模型来解决这个问题，从而创建一个“初始条件集成”。
模型结构不确定性： 没有单一、完美的地球气候模型。世界各地的不同研究小组已经开发了几十个复杂的全球气候模型（GCMs）。它们都遵循相同的基本物理定律，但在关键细节上有所不同：它们如何表示云，如何耦合海洋和大气，它们的网格分辨率。这些是结构上的差异。这些不同模型之间预测的离散程度直接衡量了我们的结构不确定性。
情景不确定性： 这也许是所有不确定性中最大的一个。未来的气候取决于未来的人类行为。我们会积极削减温室气体排放吗？我们会继续一切照旧吗？这些不同的未来由外部强迫的“情景”来表示。

耦合模型比对计划（CMIP）是一项英勇的科学努力，旨在描绘这整个不确定性的景观。它是一个集成的集成，通过应用相同的全方差定律，科学家可以将未来预测的总离散度分解为这三个组成部分。他们的发现很有启发性：对于近期预测，内部变异性是不确定性的主要来源。然而，对于长期预测，模型结构不确定性以及最重要的情景不确定性开始占主导地位。

这种分析可以变得非常具体。在一项预测未来土地利用变化的研究中，分析师可能会发现，预测的农田面积总方差以一种特定的方式进行划分。例如，他们可能会发现模型结构的不确定性贡献了 $10000$ 单位的方差，而经济驱动因素预测的不确定性贡献了 $2450$ 单位，初始卫星地图误差的不确定性仅贡献了 $1050$ 单位。这样的结果不仅仅是一个数字；它是一个指南。它告诉研究界，提高他们预测的最有效方法不是制造更好的卫星地图，而是构建更好的模型，并更好地把握社会经济的未来。

即使是我们用来研究工具的工具也存在结构不确定性。在现代电池设计过程中，工程师使用快速、简单的“代理模型”来近似缓慢、复杂的模拟。选择使用哪种类型的代理模型——多项式、神经网络、高斯过程——本身就是一种结构不确定性的来源，必须进行跟踪和管理。

最终，结构不确定性并非科学失败的标志。它是智识诚实和成熟的标志。它是我们无知的地图，通过绘制这张地图，我们确切地了解到新知识的宝藏可能埋藏在何处。它将“不确定”的模糊感觉转变为未来发现之路的精确、量化的指南。