try ai
科普
编辑
分享
反馈
  • 模型可识别性

模型可识别性

SciencePedia玻尔百科
核心要点
  • 模型可识别性主要分为结构可识别性(模型方程的内在属性)和实践可识别性(取决于实验数据的质量和设计)。
  • 结构不可识别性源于固有的数学缺陷,如集总参数或对称性(例如混合模型中的标签交换问题),任何数量的数据都无法解决这些问题。
  • 当一个实验的信息量不足以区分不同参数效应时,即使模型在结构上是合理的,也会出现实践不可识别性。
  • 分析模型的可识别性是确保其预测值得信赖的基础,因为不可识别的参数会使科学结论变得武断且不可靠。

引言

在探索世界的过程中,从微观的分子舞蹈到宏观的生态系统动态,我们构建了数学模型。这些模型是我们捕捉系统本质的最佳尝试,其中包含参数——代表物理速率、效率或强度的常数——我们希望通过真实世界的数据来确定这些参数。但整个 endeavors 都面临一个关键问题:如果我们将模型拟合到数据,我们能确定找到的参数值是唯一且有意义的吗?或者,是否有可能存在一组完全不同的参数,同样能很好地解释我们的观测结果?

这就是​​模型可识别性​​的挑战,这是一个作为科学信任守门人的基本概念。在一个模型被用于做出预测、检验假设或设计新技术之前,我们必须首先扪心自問,从我们能做的实验中唯一地确定其参数是否可能。回答这个问题,能保护我们的科学认知不至于建立在沙堡之上。

本文主要通过两个部分深入探讨这个关键主题。首先,在​​原理与机制​​部分,我们将剖析核心理论,区分结构可识别性的理想世界和实践可识别性的 messy 现实。我们将揭示那些常见的“潜在缺陷”——即那些使参数无法被知晓的数学缺陷和实验不足。随后,​​应用与跨学科联系​​部分将展示这些原理如何在真实世界的科学问题中体现,涵盖生态学、电池设计、系统发育学和人工智能等领域,从而证明可识别性不仅是一个理论问题,更是可靠发现的指南针。

原理与机制

想象你面对着一台复杂的机器,一个装满了错综复杂的齿轮和杠杆的黑箱。外面有几十个你可以转动的旋鈕——这些是你的机器的​​参数​​。还有一个能给你读数的仪表——这是你可以观察到的​​输出​​。你的任务是仅通过观察仪表,弄清楚里面每一个旋鈕的精确设置。你可能很快就会遇到一个问题:如果将旋鈕 A 调高一点,同时将旋鈕 B 调低很多,与仅仅将旋鈕 C 稍微转动一点,在仪表上产生了完全相同的读数,该怎么办?如果不同的旋鈕设置组合可以产生相同的输出,你又如何能确定里面到底发生了什么?你正面临一场可识别性的危机。

这个简单的类比抓住了​​模型可识别性​​的核心,这个概念在定量科学的每个领域都至关重要,从构建信息物理系统的数字孪生 到模拟我们心脏中分子的复杂舞蹈。当我们构建一个数学模型时,我们本质上就是在构建这样一台机器。模型的方程包含我们想要通过比较模型输出与真实世界数据来确定的参数——比如反应速率、扩散系数或电导率。可识别性提出了一个根本问题:给定我们的模型和我们的实验,唯一地确定这些参数的值是否可能?如果答案是否定的,那么我们寻找“真实”参数的探索从一开始就注定要失败。

可识别性的两个世界:结构可识别性与实践可识别性

要理清这个问题,我们必须首先认识到我们可以在两个截然不同的世界里提出它:一个完美的、纯数学的理想世界,以及一个混乱的、不完美的真实实验世界。这种区别催生了可识别性的两种最重要类型。

​​结构可识别性​​是模型抽象数学形式的一种属性。它在理想世界中提出问题:假设你是一个完美的实验者,擁有无噪声的仪器,能够在所有时间上连续测量输出,并且可以自由设计任何你想要的输入信号,你能否唯一地确定这些参数?[@problemid:4229673]。这是一个关于模型方程结构本身的问题。如果一个模型是结构不可识别的,它就存在固有的缺陷——一个“潜在缺陷”——再完美的数据也无法修复。从其参数到其输出的映射根本不是一对一的。

另一方面,​​实践可识别性​​将我们拉回现实。一个模型在理论上可能完美无缺(结构上可识别),但我们仍然可能无法从我们的实际实验中确定其参数。为什么?因为在真实世界中,我们的数据是有限的、在离散时间点采样,并且总是被噪声污染。此外,我们选择运行的特定实验可能不够“丰富”,无法揭示不同参数效应之间的微妙差异。实践可识别性不是一个简单的“是”或“否”的属性,而是一个程度问题。它关乎我们参数估计的实际可行性和精确度,通常通过查看置信区间或统计后验分布的形状来评估。一个置信区间非常大的参数,实际上就是实践不可识别的。

潜在缺陷:结构不可识别性的来源

当模型的数学结构产生模糊性时,就会出现结构不可识别性。这些模糊性可以有多种形式,常常表现为巧妙的代数纠缠或微妙的统计对称性。

代数纠缠

在许多由微分方程描述的模型中,参数可以在方程内部相互纠缠,使得它们无法被区分开来。一个经典的观察方法是使用​​拉普拉斯变换​​,这是一种将时域微分方程转换为新变量 sss 中的代数方程的数学工具。这通常通过一个​​传递函数​​ H(s)H(s)H(s) 来揭示系统的输入-输出关系。

考虑一个描述药物如何在体内移动的简单模型,该模型可用于为计算机模拟临床试验构建虚拟患者。假设一种药物以速率 kek_eke​ 被清除,并且还通过第二个隔室以速率 ktrk_{tr}ktr​ 和 kdk_dkd​ 刺激生物反应。最终测量的效应 y(t)y(t)y(t) 与第二个隔室中的浓度成正比,比例因子为 α\alphaα。连接药物输入与测量效应的传递函数可能看起来像这样:

H(s)=αktr(s+ke)(s+kd)H(s) = \frac{\alpha k_{tr}}{(s+k_e)(s+k_d)}H(s)=(s+ke​)(s+kd​)αktr​​

从我们的实验中,我们可以完美地确定这个函数的形式——也就是说,我们可以找到分子和分母多项式系数的数值。但是我们能找到四个独立的参数 α\alphaα、ktrk_{tr}ktr​、kek_eke​ 和 kdk_dkd​ 吗?

看一下分子,我们立刻发现一个问题。我们只能确定乘积 αktr\alpha k_{tr}αktr​。我们无法区分 α=2,ktr=3\alpha=2, k_{tr}=3α=2,ktr​=3 和 α=6,ktr=1\alpha=6, k_{tr}=1α=6,ktr​=1。这些参数被“集总”成一个单一的实体。现在看分母,(s+ke)(s+kd)=s2+(ke+kd)s+kekd(s+k_e)(s+k_d) = s^2 + (k_e+k_d)s + k_e k_d(s+ke​)(s+kd​)=s2+(ke​+kd​)s+ke​kd​。我们可以确定和 ke+kdk_e+k_dke​+kd​ 以及积 kekdk_e k_dke​kd​。这意味着我们可以找到与这两个速率对应的值,但我们无法知道哪一个是 kek_eke​,哪一个是 kdk_dkd​。这个表达式是对称的。交换它们不会改变任何东西。这是一种​​对称性​​或​​置换​​模糊性。如果我们正在模拟一个生化级联反应,但无法测量一个中间物种,同样的问题也会出现;控制那个隐藏步骤的参数会集总在一起,它们的顺序也会变得模糊不清。无论我们关于输入和最终输出的数据有多么完美,我们都永远无法解决这些模糊性。它们是结构性缺陷。

统计模糊性:标签问题

结构不可识别性并不仅限于物理动态模型。它也是许多统计模型,尤其是混合模型的一个臭名昭著的特征。想象你是一位生物信息学家,正在研究一个肿瘤样本中的基因表达。你知道有两种类型的细胞——比如说,癌细胞和免疫细胞——但你无法事先区分它们。你测量一个基因的表达,并将数据建模为一个​​高斯混合模型​​,其中每个细胞的表达水平都从两个钟形曲线(高斯分布)中的一个抽取,每个曲线代表一个亚群。

假设第一个亚群的平均表达为 μ1\mu_1μ1​,占细胞总数的比例为 π\piπ,而第二个亚群的平均表达为 μ2\mu_2μ2​,占剩余的 1−π1-\pi1−π。观察到某个表达水平 xxx 的概率是:

p(x)=πN(x∣μ1,σ2)+(1−π)N(x∣μ2,σ2)p(x) = \pi \mathcal{N}(x \mid \mu_1, \sigma^2) + (1-\pi) \mathcal{N}(x \mid \mu_2, \sigma^2)p(x)=πN(x∣μ1​,σ2)+(1−π)N(x∣μ2​,σ2)

现在,如果我们通过简单地交换标签来创建一组新的参数,会发生什么?假设我们的新参数是 π′=1−π\pi' = 1-\piπ′=1−π,μ1′=μ2\mu_1' = \mu_2μ1′​=μ2​,和 μ2′=μ1\mu_2' = \mu_1μ2′​=μ1​。 resulting probability is:

p(x)=(1−π)N(x∣μ2,σ2)+πN(x∣μ1,σ2)p(x) = (1-\pi) \mathcal{N}(x \mid \mu_2, \sigma^2) + \pi \mathcal{N}(x \mid \mu_1, \sigma^2)p(x)=(1−π)N(x∣μ2​,σ2)+πN(x∣μ1​,σ2)

这和原来的表达式完全一样!因为加法满足交换律,所以在原始参数和标签交换后的参数下,数据的似然是相同的。这就是臭名昭著的​​标签交换​​问题。由于这种内在的对称性,参数并非严格可识别的。在贝叶斯框架中,当我们计算参数的后验概率分布时,这表现为一个多峰后验。如果数据清晰地显示出两个组,后验将有两个完全对称的峰,每个峰对应于两种可能的标签分配之一。

情况可能变得更糟。如果两个亚群实际上是相同的,即 μ1=μ2\mu_1 = \mu_2μ1​=μ2​ 呢?模型方程就退化成一个单一的高斯分布,而混合参数 π\piπ 完全从方程中消失了。在这种情况下,π\piπ 变得根本上、结构上不可识别。后验分布会形成一个“脊”,即一个平坦的区域,在这个区域里似然函数完全不提供关于 π\piπ 的任何信息。

实验的艺术:揭示实践不可识别性

即使一个模型在结构上是合理的,我们的实验设计也可能出卖我们,导致实践不可识别性。

信息量不足的实验

让我们回到生物化学的世界,看看著名的米氏方程酶动力学模型。在某些假设下,底物消耗的速率由下式给出:

dSdt=−Vmax⁡SKm+S\frac{dS}{dt} = -\frac{V_{\max} S}{K_m + S}dtdS​=−Km​+SVmax​S​

我们想要找到的参数是 Vmax⁡V_{\max}Vmax​ (最大反应速率) 和 KmK_mKm​ (米氏常数,与底物亲和力相关)。这个模型是结构可识别的;从底物浓度 S(t)S(t)S(t) 的完整时间进程中,可以唯一地确定 Vmax⁡V_{\max}Vmax​ 和 KmK_mKm​。

但假设我们以一种非常特殊的方式进行实验:我们向系统中注入大量的底物,使其浓度 SSS 始终远远大于 KmK_mKm​。在这种情况下,分母简化为:Km+S≈SK_m + S \approx SKm​+S≈S。速率方程变为:

dSdt≈−Vmax⁡SS=−Vmax⁡\frac{dS}{dt} \approx -\frac{V_{\max} S}{S} = -V_{\max}dtdS​≈−SVmax​S​=−Vmax​

底物浓度呈直线下降,斜率以很高的精度告诉我们 Vmax⁡V_{\max}Vmax​。但是 KmK_mKm​ 呢?它已经从动态方程中完全消失了!我们测量的输出对其值变得不敏感。在这个实验 regime 下,KmK_mKm​ 是实践不可识别的。如果我们的实验设计方式使其效应变得不可见,我们就无法测量这个参数。

欺骗性信号:敏感性与可识别性

这就引出了一个最微妙且重要的区别:参数的敏感与可识别之间的差异。高敏感性意味着改变一个参数会对模型的输出产生很大影响。你可能认为这就是获得良好估计所需要的一切。但你错了。

让我们深入电池设计的世界。我们有一个锂离子电池的模型,它有几个参数,包括扩散系数 DsD_sDs​ 和交换电流密度 i0i_0i0​。我们施加一个电流并测量电压响应。我们发现电压对 DsD_sDs​ 和 i0i_0i0​ 都非常敏感。改变其中任何一个都会引起输出的巨大变化。这听起来很棒!

然而,当我们仔细观察它们如何影响电压时,我们发现了一个纠缠。我们可以为每个参数计算一个“敏感性向量”,它描述了该参数对随时间变化的电压测量的独特影响指纹。假设我们发现 DsD_sDs​ 的敏感性向量恰好是 i0i_0i0​ 敏感性向量的两倍:sDs=2si0s_{D_s} = 2 s_{i_0}sDs​​=2si0​​。这意味着将 DsD_sDs​ 增加一定量所产生的电压变化,其形状与将 i0i_0i0​ 增加两倍该量所产生的电压变化完全相同。它们的效果是完全相关的。

当我们试图从数据中估计参数时,模型无法将它们区分开来。它无法区分来自 DsD_sDs​ 的效应和来自 i0i_0i0​ 的效应。这就像两个不同的歌手,他们的声音强度不同但音色完全相同;如果他们一起唱歌,你能听到音乐,但你无法确定谁在唱哪个部分。尽管两个参数都高度敏感,但它们是实践不可识别的,因为它们的效果是​​共线的​​。在数学上,这对应于敏感性矩阵的列是线性相关的,这反过来又使得至关重要的​​费雪信息矩阵​​是奇异的,标志着可识别性的灾难性失败。

治愈许多这些实践性弊病的良方是设计一个更好、更“信息丰富”的实验。我们需要以一种打破这些参数相关性的方式来激励系统。对于电池来说,也许一个不同的电流剖面会使 DsD_sDs​ 和 i0i_0i0​ 的电压指紋看起来足够不同,从而可以被区分开来。在系统辨识中,这就是对“持续激励”输入的追求——这种输入足够丰富,以至于系统的所有内部动态都能被外部观察者看到。

结论性思考:一个关于信任的问题

我们为什么在这上面投入如此多的精力?因为可识别性最终是一个关于信任的问题。如果一个模型的参数是不可识别的,那么我们为它们估计的任何特定值都是任意的。基于这些值做出的预测、科学结论或工程设计都建立在沙堡之上。一个不可识别的模型可能完美地拟合现有数据,但它没有真正的泛化或预测能力,因为它 harbors a fundamental ambiguity.

分析可识别性不仅仅是一个数学练习;它是科学过程中至关重要的一步。它迫使我们对自己知识的局限性保持诚实。它让我们提出尖锐的问题:我的模型是否适定?我的实验是否足够强大?我能用我拥有的工具真正回答我正在问的问题吗?对于简单的模型,我们可以用纸和笔回答这些问题。对于控制我们气候或生理机能的那些拥有成千上万个状态和参数的庞大复杂模型,仅仅检查可识别性本身就是一个巨大的计算挑战,推动着数学和计算机科学的前沿。归根结底,对可识别性的追求就是对可靠、值得信赖的科学的追求。

应用与跨学科联系

我们现在已经走过了模型可识别性的形式化 landscape,探索了它的定义和理论基础。但真正的冒险从这里开始。对物理学家、生物学家或工程师来说,一个理论的好坏取决于它描述世界的能力。那么,这个看似抽象的可识别性概念在何处留下了它的足迹?你可能会欣喜地发现,答案是:无处不在。它并非某些构思拙劣模型的深奥病理;相反,它是科学诚信的根本守护者,是帮助我们在可知事物的浩瀚海洋中航行的指南针。它是一个模型揭示自然新真理与另一个模型仅仅编织一个优雅但空洞的小说之间的关键区别。

隐藏的世界:当我们无法看到一切时

科学的大部分工作都是从可见推断不可见。我们构建具有隐藏齿轮和杠杆的模型——潜变量、不可观测的状态——并希望通过观察模型的可见输出来理解它们的功能。正是在这里,可识别性首次且最有力地宣告了它的存在。

想象你是一位生态学家,正在研究一个简单的食物链:一个捕食者物种消耗单一资源,比如说,狼和羊,或者海星和贻贝。你可以轻松地计算捕食者的数量,但资源庞大且难以测量。你建立一个模型来描述捕食者种群如何增长。这种增长取决于两个关键参数:捕食者将食物转化为后代(eie_iei​)的效率,以及它捕獲食物的技能,即其攻击率(aia_iai​)。你有一条美丽的捕食者丰度时间序列,你试图拟合你的模型来找到这两个参数。但你会失败。不是因为你的数据不好,而是因为模型有一个秘密。捕食者的可观测动态只取决于这两个参数的乘积,eiaie_i a_iei​ai​。无法区分一个非常高效但笨拙的捕食者和一个非常低效但熟练的捕食者。它们对可观测世界的影响是完美纠缠在一起的。模型结构本身对我们所能知道的施加了根本性的限制。这是一个经典的结构不可识别性案例。

这个挑战并非捕食者与猎物所独有。考虑一下计算一个隐蔽物种的任务,比如茂密森林中的一种稀有两栖动物。你进行一次调查,并计算你看到的个体数量。你计算出的数量显然取决于两件事:该物种在该地的真实潜在丰度(NiN_iNi​)和你实际探测到存在的个体的概率(pijp_{ij}pij​)。如果你只访问该地点一次,你又将面临一个不可打破的纠缠。一个高的计数可能意味着一个庞大但难以看到的种群,或者一个很小但容易看到的种群。数据只反映了丰度和可探测性的乘积。

但在这里,一个巧妙的实验设计前来解救。如果你第二次访问该地点会怎样?真实丰度 NiN_iNi​ 是相同的,但你有了新的、独立的机会来探测这些个体。两次访问計數之间的关系——特别是它们的协方差——携带着解开参数所需的信息。看到许多新个体与重新看到相同个体的模式,提供了统计上的 leverage 来分别估计丰度和探测概率。这个美丽的结果表明,虽然一些限制是绝对的,但其他限制则是邀请我们在收集数据的方式上变得更加巧妙。

事物的形态与尺度的制约

有时,不可识别性不是隐藏变量的问题,而是支配系统的基本物理定律的结果。物理方程通常用物理常数来书写,但它们的解——我们实际观察到的行为——常常由这些常数的无量纲组合所支配。

考虑一下现代锂离子电池的核心:一个微小的多孔颗粒,锂离子在其中流动和扩散。一位电化学工程师可能会建立一个基于偏微分方程的复杂模型来描述这个过程。该模型将包括諸如固相扩散系数(DsD_sDs​)(描述离子移动的速度)和颗粒半径(RRR)等参数。实验者在电池充电和放电时测量其随时间变化的电压。他们能用这些数据精确地确定 DsD_sDs​ 和 RRR 吗?

事实证明他们不能。球体中的扩散物理学决定了你在终端看到的电压依赖于时间,不是单独通过 DsD_sDs​ 或 RRR,而是通过特征扩散时间,一个与参数组 R2Ds\frac{R^2}{D_s}Ds​R2​ 成比例的量。这个组代表了一个离子穿过颗粒所需的时间。任何保持这个时间尺度不变的较大半径和更快扩散的组合,都会产生完全相同的电压剖面。实验对单个参数是盲目的,只对它们的 governing combination 敏感。这是另一种形式的结构不可识别性,它根植于自然界的标度律之中。

实践者的困境:从理想理论到嘈杂现实

结构可识别性是针对理想世界中完美模型和无噪声数据的问题。但工作的科学家生活在现实世界中,一个充滿有限测量和不可避免噪声的世界。这就是实践可识别性的领域。一个模型的参数在原则上可能是可识别的,但用我们实际能获得的数据却无法确定。

让我们回到生物学。想象一下模拟一个细胞信号通路的复杂网络,这可能需要估计几十个反应速率。或者考虑一位临床药理学家使用正电子发射断层扫描(PET)来观察药物在大脑中的去向。模型错综复杂,而来自PET扫描仪或生化分析的数据总是嘈杂的。模型中的一些参数可能对最终测量的输出只有微乎其微的影响。它们的信号完全被统计噪声所淹没。虽然在结构上可识别,但这些参数在实践上是不可识别的。

这就是一个名为费雪信息矩阵(FIM)的强大工具发挥作用的地方。FIM 是一个数学对象,它告诉我们特定的实验设计为每个参数提供了多少“信息”。一个奇异或“病态”的 FIM 是一个危险信号,表明某些参数在我们的实验方案下统计上如此纠缠不清,以至于它们的估计将具有巨大的不确定性。这不仅仅是一个数学上的好奇心;它是一个宝贵的指南。它告诉我们,我们需要一个更好的实验。也许我们需要收集更长时间的数据,更频繁地采样,或者,最巧妙地,设计一个输入(如药物剂量方案或电刺激模式),专门“激励”我们感兴趣的系统部分,使其参数的微弱声音大到足以在噪声之上被听到。这就是最优实验设计的精髓,一个致力于不僅問我们能测量什么,還問我们应该如何测量以学到最多的领域。

对称性与身份互換

一些最微妙和迷人的可识别性问题源于模型结构中隐藏的对称性。在这些情况下,模型对其内部组件我们给予的名称是漠不关心的。

一个美丽的例子来自进化生物学,在系统发育学领域。为了重建生命之树,科学家模拟DNA序列如何进化。通常假设基因组中的不同位点以不同的速率进化是很有用的;一些是“快速进化”的,另一些是“慢速进化”的。一种常见的方法是混合模型,它假定存在几个潜在的位点类别。但模型的数学對“类别1”或“类别2”没有内在的概念。如果我们交换标签——如果我们把之前称为“快”的现在称为“慢”,反之亦然——观察到我们的DNA数据的似然是相同的。这种现象被称为​​标签交换​​,意味着每个类别的个体身份在结构上是不可识别的。我们可以识别基因组中存在的*进化速率集合*,但我们不能给其中任何一个分配固定的标签。

这导致了一种更深层次的病态。如果一个有(比如说)三个类别的模型,最好被描述为其中两个类别是相同的,那会怎么样?例如,两个不同的“慢速”类别。这种情况与一个只有两个类别的模型完全无法区分,在后一种模型中,那个单一的“慢速”类别只是被赋予了更大的权重。这揭示了,仅从似然来看,甚至混合物中不同组分的数量都可能不是可识别的 [@problemid:2840524]。

现代前沿:从流域到人工智能

可识别性的挑战并不仅限于传统的物理学或生物学;它处于模拟复杂系统甚至人工智能设计的前沿。

在水文学中,科学家们建立模型来根据降雨量预测洪水。这些模型很复杂,有许多描述水如何在景观上和景观中流动的参数。人们早就认识到,许多这些参数的不同组合可以产生与历史河流流量记录幾乎同样匹配的模拟。这个概念,被称为​​殊途同归​​(equifinality),是实践不可识别性的一种形式。开明的建模者不认为这是一种失败。他们不是去寻找那一个“真实”的参数集——一个因不可识别性而注定失败的追求——而是拥抱不确定性。他们从一系列合理的参数集的集合中生成预测。结果不是一个单一的、看似精确的预测,而是一系列可能的未来河流流量,这是一个关于可知与不可知的诚实陈述。

也许最令人兴奋的现代应用之一是在​​弱监督​​领域,这是一种在没有完美的、手工标注的数据时训练机器学习模型的技术。想象一下,试图训练一个AI来分类临床短信,但没有任何“黄金标准”标签。相反,你有一系列不完美的、启发式的规则,或“标注函数”。每个规则都是嘈雜的,有时是错误的,并且常常弃权。这似乎是一项不可能的任务。然而,通过将这个系统建模为一个潜变量问题——真实标签是隐藏的——我们可以在某些条件下恢复所有关键参数。通过观察这些弱监督者之间的一致和不一致的模式,我们可以估计每一个的准确性,以及真实类别的普遍性。关键的洞见是,如果我们至少有三个(条件独立的)标注函数,矩方程组就变得可解,参数在全局标签置换下变得可识别。这使我们能够在没有完美老师的情况下“教导”一台机器,这是一个对人工智能具有深远影响的革命性思想。

结语:科学的指南针

正如我们所见,从动物的秘密生活到电池的内部工作,从物种的进化到AI的训练,可识别性是一条普遍的线索。它不仅仅是对我们方程的技术性检查;它更是对我们科学主张的深刻检验。它迫使我们问:我向我的模型提出的问题,它能用我拥有的数据真正回答吗?

一个参数不可识别的模型就像一艘没有舵的船;它可能是一艘令人印象深刻的船只,但它无法被驶向一个真正的目的地。不可识别性的存在使我们许多标准的统计工具失效,例如似然比检验和用于模型选择的常见信息准则。这是一个必须正面面对的问题,要么通过将模型重新参数化为可识别的形式,要么通过设计一个新的能够打破僵局的实验。

最终,与可识别性搏斗使我们成为更好的科学家。它鼓励我们对不确定性保持诚实,在实验设计上发挥创造力,并对我们声称已经测量的参数保持健康的怀疑态度。它不是知识的障碍,而是一位值得信赖的向导,确保我们的模型告诉我们的故事不仅仅是 plausibel 的,而是真正用世界本身的语言写成的。