
在科学探究中,数学模型是理解复杂系统不可或缺的工具,从病毒的传播到电池的行为都概莫能外。建模的一个核心目标是通过将模型与实验数据拟合,来估计模型的参数——即控制其行为的内部“旋钮”和“设置”。然而,一个根本性的挑战可能会出现,并破坏整个过程:如果模型的结构本身使得我们无论收集多少数据都无法唯一地确定这些参数,那该怎么办?这个问题被称为结构不可辨识性,它代表了一个关键的知识鸿沟,可能导致错误的结论和被误导的科学研究。
本文深入探讨了这一深刻问题的核心。第一章“原理与机制”将揭开结构不可辨识性的神秘面纱,解释它是什么,它如何由模型对称性产生,以及它与由噪声数据引起的实际限制有何不同。随后,“应用与跨学科联系”一章将展示这一理论概念如何在从医学到生态学等不同领域中体现,并强调认识到这一点是设计更稳健的实验和建立更可靠的科学知识的第一步。
想象一台复杂的机器,一个装满了错综复杂的齿轮和杠杆的黑箱。在外面,有一组你可以转动的旋钮——这些是你科学模型的参数。你也可以提供一个输入,比如说,通过踩下一个踏板。机器嗡嗡作响,产生一个输出,或许是刻度盘上一根移动的指针。建模的巨大挑战就是观察指针的运动(数据),并推断出所有隐藏旋钮的精确设置。
本章探讨的是我们在这项探索中有时会遇到的一个奇特而深刻的难题:结构不可辨识性。这并非指在读取刻度盘时视力模糊或手发抖;这是一个更根本的问题。它发生在因机器内部设计的原因,无论我们如何踩动踏板,不同的旋钮设置组合都会产生完全相同的输出。我们面对的是一种完美的模糊性,再多的完美数据也无法解决。
让我们从最简单的“机器”开始。假设我们的输出 只是两个未知参数旋钮 和 的乘积,再乘以一个我们控制的已知输入杠杆 。模型很简单:
我们可以选择任何我们喜欢的输入 ——一个尖锐的脉冲、一个平缓的波形,任何都行——并且我们可以用完美的精度测量输出 。我们能唯一地确定 和 吗?
让我们试试。假设真实的设置是 和 。它们的乘积是 。所以我们机器的行为由 描述。那么,有没有可能另一组参数也产生了同样的行为?当然有!如果旋钮设置为 和 呢?或者 和 ?在所有这些情况下,乘积仍然是 ,输出也完全相同。
这就是结构不可辨识性的本质。模型中存在一种对称性。我们可以对参数进行变换——对于任何非零数 ,我们可以将 变为 ——而模型的输出保持完全不变。我们的实验唯一能告诉我们的是可辨识组合 的值。 和 的各自取值是结构不可辨识的。
这种参数组合隐藏在视野之外的想法并不仅仅是玩具代数模型的特征。它出现在动态系统的核心。考虑一个简单的过程,其中输入 产生某种物质 ,然后对其进行测量。模型可能是:
在这里,参数是衰减率 、输入增益 和测量缩放系数 。如果我们分析这个系统,会发现我们控制的输入和我们看到的输出之间的关系由乘积 决定。我们可以毫无困难地确定衰减率 ,但我们永远只能知道 的组合值。将输入增益 加倍并将传感器增益 减半,会产生完全相同的数据。参数 和 同样是结构不可辨识的。从输出的角度来看,模型具有一种对称性,使得它们内在地纠缠在一起。
将这个问题与更常见的噪声数据问题区分开来至关重要。想象一下你正试图用尺子测量长度。你在对齐标记时犯下的一些微小随机错误会产生偶然不确定性(aleatoric uncertainty)——一种源于偶然和随机性的不确定性。用一把更好的尺子和更多的测量,你可以通过平均来减少这些误差,从而降低这种不确定性。
然而,结构不可辨识性创造了认知不确定性(epistemic uncertainty)——一种源于根本性知识缺乏的不确定性,再多的数据也无法修复。这并非我们的视野有噪声;而是我们正在观察的东西本身就是真正模糊的。在我们的例子 中,即使有无限长、完美精确的 和 记录,我们也能以绝对的确定性知道乘积 ,但我们离知道真实参数是 还是 并没有更近一步。
在贝叶斯框架中,我们用参数的概率分布来表达我们的知识,其效果是惊人的。随着我们收集越来越多的数据,我们对可辨识组合 的信念会变得像刀刃一样锋利。然而,我们对单个参数的信念只会坍缩到由 定义的曲线上。数据告诉我们参数必须位于参数空间中的这条线上,但它无法给出任何关于它们位于线上何处的线索。沿着这条线的残余不确定性是我们知识的一个永久特征,是模型结构的直接后果。
到目前为止,可辨识性似乎是模型方程中固有的一个属性。但事情更为微妙。可辨识性是模型和实验相结合的属性。我们选择问什么,以及我们选择如何测量,可能与系统内部的线路同样重要。
考虑一个简单的衰减过程,。让我们看看我们的实验选择有多重要:
这揭示了一个深刻的真理:实验设计不仅仅是收集数据,而是收集正确类型的数据。例如,在某些系统中,仅测量不同恒定输入下的最终稳态值可能会隐藏动态信息,从而造成一种不可辨识性,而测量完整的时间过程响应则可以解决这个问题。
到目前为止,我们一直生活在一个拥有完美、无噪声测量的柏拉图式理想世界中。在现实世界里,所有数据都含有噪声。这给我们带来了一个关键的区别:结构不可辨识性与实际不可辨识性。
结构不可辨识性是一座悬崖。 如果一个参数是结构不可辨识的,那么你在参数空间中可以沿着某个方向走,而模型的输出完全不会改变。“模型拟合数据的程度”的地形图在这个方向上是完全平坦的。你的不确定性是无限的,再多的数据也永远无法帮助你找到谷底。你已经掉下了悬崖的边缘。
实际不可辨识性是一片广阔、浅浅的泥潭。 一个模型可能在结构上是可辨识的——这意味着地形图确实有一个唯一的最低点——但它可能极其平坦。在某个参数方向上走很远,模型的输出也几乎没有变化。对于有噪声的数据,几乎不可能分辨出真正的最小值在哪里。你的不确定性不是无限的,但却是巨大的。这种情况通常被称为松弛性(sloppiness)。
一个极好的可视化工具是剖面似然(profile likelihood)。要检查单个参数 的可辨识性,我们可以绘制出对于 的每个可能值,模型能多好地拟合数据(允许所有其他参数进行调整以给出最佳拟合)。
在数学上,这个地形的曲率由费雪信息矩阵(FIM)捕获。结构不可辨辨识性对应于一个奇异的 FIM(一个零特征值),意味着在某个方向上曲率为零。实际不可辨识性对应于一个病态的,或“松弛的”FIM(一个非常小但非零的特征值),意味着曲率非常低。
我们能反击这种不确定性吗?如果我们发现自己陷入了实际不可辨识性的泥潭,答案是响亮的“是”。我们可以成为聪明的侦探,设计更好的实验。如果我们当前的实验对某个参数不敏感,我们可以设计一个新的实验——例如,通过使用特定的输入信号 ——使系统输出以恰当的方式摆动,从而揭示该参数的值。这就是最优实验设计的目标。更好的是,我们可以使用自适应输入,即每一步施加的输入都是基于我们目前所学到的信息来选择的,其目的就是最大限度地减少我们剩余的不确定性。这就像一个侦探提出一系列有针对性的问题,以锁定真相。这个过程改善了FIM,将泥潭变成了一个小得多的水坑。
但如果我们面对的是结构不可辨识性的悬崖呢?在这里,我们无能为力。如果模型存在根本的对称性,比如我们的 乘积,再巧妙的输入设计也无法打破它。两个嫌疑人一起拥有完美的不在场证明;无论侦探多么巧妙地盘问他们,这种模糊性都无法解决。
唯一的出路是改变游戏规则:要么修改模型,要么改变实验,收集能够打破对称性的不同类型的数据。例如,在我们的 模型中,如果我们能够直接测量内部状态 ,我们就能将 和 解耦。
一个最后也是至关重要的警告。人们很容易试图通过对参数施加约束来解决这个问题。例如,如果我们知道传感器增益 必须在 和 之间,我们的计算机可能会很乐意地报告一个对输入增益 的良好、精确的估计。但这是一种幻觉。我们并没有解决不可辨识性问题。我们所做的只是人为地将无限长的可能解线段限制在一个小片段上。我们的确定性并非源于数据,而是源于我们自己的假设。这是科学建模中最微妙的陷阱之一——将我们假设的边界误认为是知识的边界。
在我们迄今为止的旅程中,我们一直在探讨结构可辨识性的抽象原理,就像数学家在安静的房间里证明定理一样。我们定义了它,剖析了其成因,并确立了它与其实际的、依赖于数据的“表亲”之间的深刻差异。现在,是时候离开那个安静的房间,看看这些思想在何处焕发生机。我们会发现,不可辨识性的幽灵并非仅仅是一种理论上的好奇心;它是一个在各个科学学科的实验室和现场出没的吵闹鬼,从我们细胞内的分子舞蹈到行星系统的宏大尺度。
但这并非一个旨在吓唬人的鬼故事,而是一个侦探故事。通过学会看到这个幽灵,我们了解了我们知识的真实形态。我们发现了我们模型的局限性,并在此过程中,被引导向更巧妙的实验、更诚实的结论,以及对世界更深刻的理解。
也许这个幽灵最常玩的把戏就是简单的参数混淆。我们写下一个看似完全合理的方程,结果却发现两个或更多的参数变得密不可分,对外界来说如同一个单一的实体。
想象一下,试图为一个受捕捞法规约束的可再生资源,比如鱼类种群,建立模型。一个简单的模型可能会描述种群的增长及其因捕捞而导致的减少。这种减少将取决于执法巡逻的强度(我们称之为 )和捕捞船队的社会遵从度()。一个自然的建模方式可能包含一个类似 的项,其中 是资源存量。但看看发生了什么!参数 和 总是以乘积的形式出现。仅仅通过观察种群 ,人们永远只能确定复合参数 的值。我们永远无法从这些数据中区分严格执法与低遵从度(高 ,低 )的情景和执法松懈与高遵从度(低 ,高 )的情景。它们会产生完全相同的种群动态。这是结构不可辨识性的一个经典案例。其政策含义是巨大的:如果不改变模型或实验,任何关于加强执法与促进遵从的建议都是基于猜测,而非数据。
同样的混淆以更微妙的方式出现在我们自己的身体内。在医学上,我们常常试图理解身体如何处理从营养物到药物的各种物质。考虑我们组织从血液中吸收葡萄糖的方式。在微观层面,这个过程通常由所谓的米氏动力学(Michaelis-Menten kinetics)控制,这是一个由最大摄取速率 和半饱和常数 描述的饱和过程。然而,如果我们进行的实验只对血液葡萄糖水平在其正常静息状态附近做小幅扰动,那么复杂的米氏动力学函数在很大程度上表现得像一个简单的线性过程。模型简化了,但代价是两个基本参数 和 坍缩成一个单一的、可观测的复合参数,通常称为葡萄糖利用率 。从这样一个有限的实验中, 和 是结构不可辨识的。
但故事在这里发生了转折。这个诊断并非模型的死刑判决书;它是一个改进实验的处方。不可辨识性的产生是因为我们只在一个操作点上探测了系统。如果我们更聪明一些呢?通过在两个不同的、明确的稳态葡萄糖水平下进行实验,我们可以有效地“解开”这些参数。每个稳态都提供了一个不同的、关联 和 的方程,有了两个未知数的两个方程,我们就可以唯一地解出它们。不可辨识性的幽灵一旦被发现,就教会了我们如何设计一个能够驱除它的实验。
一种更深刻的不可辨识性形式源于我们模型结构中隐藏的对称性。在这里,不仅仅是参数的简单乘积,而是多个参数和状态的协同变换,使得可观测输出保持完全不变。
这种现象在传染病研究中非常普遍。一个经典的病毒感染模型追踪靶细胞()、受感染细胞()和自由病毒粒子()。我们可能会随时间测量病毒载量 ,但我们无法轻易地计算靶细胞的数量。一个隐藏的尺度对称性潜伏在这些方程中。事实证明,我们可以取一个给定的解,将靶细胞数量()减半,同时将每个受感染细胞的病毒产生率()加倍,而产生的病毒载量曲线 将会完全相同。仅凭病毒载量测量的数据无法区分一个在靶细胞稀少宿主中极高产的病毒和一个在靶细胞众多宿主中复制缓慢的病毒。单个参数 和初始靶细胞数量 是结构不可辨识的。模型只揭示了某些不变的组合,例如乘积 。这就好比我们通过一个固定的望远镜观察一个物体:我们可以描述它的表观亮度,但我们无法判断它是一个本身很暗的近处物体还是一个非常亮的远处物体。
同样的尺度幻觉也出现在错综复杂的神经科学世界中。为了模拟神经元的放电,我们必须描述离子通道——控制电流流动的分子门——的行为。一个钠通道的模型可能涉及最大电导 (如果门完全打开,能有多少离子流过)和一个激活变量 ,其中包括一个振幅 (门实际上能达到“打开”状态的多大比例)。总电流与乘积 成正比。你可能已经看到了问题所在。一个最大电导低但完全打开的通道(小 ,)可以产生与一个最大电导加倍但只打开一半的通道(大 ,)完全相同的电压轨迹。仅从电压测量来看,这两种情况是无法区分的。
认识到这些对称性对安全和治理具有至关重要的影响,尤其是在合成生物学等新兴领域。想象一下评估释放一种工程微生物的生态风险。一个模型可能会追踪工程种群 和一个本地宿主种群 。一个现场传感器可能会测量一个组合信号 ,其中 是仪器的一个未知校准因子。一个尺度对称性立刻出现:我们可以将宿主种群 的估计值按任何因子 放大,只要我们同时将校准因子 的估计值按相同因子缩小,测量的信号 将完全相同。可怕的结论是,我们无法从这个实验中确定宿主种群的绝对规模。因此,一个负责任的治理标准会禁止任何基于 的绝对值的风险评估声明。相反,它会要求证据只能以可知的、可辨识的量来表述,或者要求重新设计实验——比如通过增加第二个独立的测量——来打破这种对称性。
到目前为止,我们一直假设模型的结构是正确的,只有其参数存在问题。但如果不可辨识性的幽灵根植得更深呢?如果不同的潜在物理机制可能导致完全相同的可观测行为,那该怎么办?
这是水文学家在模拟降雨如何变成河流流量时面临的一个深刻问题。关于集水区(河流的流域盆地)如何产生径流,存在着相互竞争的理论。一种理论,“饱和超渗”,假定径流产生于饱和区域,而集水区饱和部分的比例()决定了径流,。另一种与之竞争的理论可能提出,径流的产生遵循一个关于集水区某个潜在状态 的平滑、类似逻辑斯蒂函数的函数,使得 。
这些看起来像是对现实的根本不同描述。然而,通过一个简单的数学变换(具体来说,是一个 logit 函数),第一个模型的状态变量 可以直接映射到第二个模型的状态变量 上,使得对于任何给定的降水序列 ,它们都能产生完全相同的径流序列 。这两个模型在观测上是等效的。这种不同结构或路径导致相同最终结果的现象被称为“殊途同归性”(equifinality)。这是一个令人谦卑的教训。即使有完美的数据,我们可能也无法唯一地确定大自然如何运作。数据可以证实输入-输出关系,但内部机制可能仍然是一个黑箱。
经过这一切,建模似乎成了一项无望的努力,充满了幽灵和幻觉。但正是在这里,视角从哲学家的视角转变为工程师的视角。不可辨识性的诊断不是终点;它是一个设计过程的开始。
我们必须首先区分我们讨论过的深层次结构性问题和更常见的实际不可辨识性。在药代动力学研究中,一个药物模型的参数在理论上可能是结构可辨识的,但如果你在给药后没有足够早地采集血样,你将很难估计药物的分布容积 。类似地,在药效动力学研究中,如果你只测试远低于半数最大效应浓度 的浓度,你将没有什么希望估计最大效应 。这些不是模型结构的缺陷,而是*实验设计*的缺陷。
这就是我们的侦探工作变得定量化的地方。例如,在电池工程领域,一个锂离子电池的模型必须解开离子扩散()和电荷转移动力学()的影响。在短时间尺度上,这两个过程都对电压降有贡献,其方式看起来可能非常相似。这些参数实际上是不可辨识的。我们可以通过检查模型的灵敏度——即输出电压如何随每个参数变化——来形式化这个问题。如果 和 的灵敏度向量几乎平行,那么这两个参数就是混淆的。这种共线性在数学上被一个叫做费雪信息矩阵(FIM)的工具所捕捉。一个病态的 FIM(即接近不可逆的矩阵)是实际可辨识性差的正式诊断。
这个诊断引导我们走向一个系统化的工作流程,一个为在职科学家或工程师准备的真正的作战计划:
首先,进行结构分析。 在收集任何数据之前,分析模型方程。是否存在任何深层次的对称性或混淆的参数?如果有,你必须将模型重新参数化为可辨识的组合,或者改变实验的根本性质(例如,增加新的测量类型)。
然后,进行实际分析。 对于一个结构上合理的模型,模拟一个提议的实验。计算灵敏度和费雪信息矩阵。它是否是良态的?预测的参数估计是否足够精确以满足你的目的?
如果不是,优化实验。 这是最优实验设计(OED)的核心。使用 FIM 作为你的指南来改变实验方案。你应该更频繁地采样吗?在不同的时间点采样?输入信号(药物剂量、电流脉冲、温度变化)的形状应该有所不同吗?OED 提供了一个数学框架,以在你的约束条件下找到“信息量最大”的实验。
迭代和验证。 这个过程是一个循环。设计、分析、再设计。一旦找到了最优设计,在投入昂贵的真实实验之前,要用大量的模拟来验证它。
通过这种方式,不可辨识性的幽灵从一个令人沮丧的障碍转变为一个强大的向导。它迫使我们批判性地思考我们的模型与现实之间的联系,推动我们设计更巧妙的实验,并更诚实地面对我们真正能声称知道的东西。归根结底,它是追求科学过程中一个必不可少的工具。