经验模型

玻尔百科

定义

经验模型是通过拟合观测数据来优先保证预测准确性的建模方法，其核心在于利用已知数据而非重现系统的底层因果机制。此类模型通常采用线性函数或神经网络等结构作为归纳偏置，在观测数据范围内的插值预测方面表现优异。目前，诸如物理信息机器学习等现代混合方法已将经验模型的灵活性与机械模型的物理定律约束结合在一起。

核心要点

经验模型通过拟合观测数据来优先保证预测的准确性，而机理模型则旨在表征系统底层的因果过程。
经验模型通常在观测数据范围内（内插）表现出卓越的预测能力，而机理模型则提供更强的解释能力，并且在外推时更为可靠。
选择经验模型的结构（如线性函数或神经网络）是一种被称为归纳偏置的假设形式。
现代的混合方法，如物理知识驱动的机器学习，将经验模型的灵活性与来自机理模型的物理定律约束相结合。

引言

在尝试理解一个复杂系统时，科学家和工程师面临一个根本性的选择：是基于第一性原理，由内而外地构建模型，还是基于观测数据，由外而内地构建模型？这个选择定义了建模的两种伟大哲学思想：旨在构建一个解释系统为何如此运行的“玻璃箱”的机理方法，以及创建一个能准确预测系统将会做什么的“黑箱”的经验方法。两者都是必不可少的工具，但它们基于不同的原则运作，服务于不同的目标。

在机理模型的解释能力和经验模型的预测准确性之间进行权衡，是科学探究中的一个核心挑战。本文旨在应对这一挑战，提供一个清晰的框架，以理解何时以及如何使用每种方法，并突显它们各自独特的优势与劣势。我们将探讨定义这些建模哲学的核心概念，并指导其应用。第一章“原理与机理”将剖析模型的基础思想、假设和评判标准。随后的“应用与跨学科联系”一章将展示这些原理如何应用于从医学到天体物理学的广泛科学领域，揭示数据驱动发现的力量。

原理与机理

想象一下，你想了解汽车是如何工作的。你有两条路径。第一条是机械师的路径：你可以打开发动机盖，拆解引擎，研究燃烧的物理学、热交换的热力学以及传动的力学。你将基于基本原理，由内而外地构建一个模型。这就是机理方法。

第二条路径是数据科学家的路径。你可以细致地记录每一次踩下油门踏板以及产生的车速，完全忽略引擎。你会收集数千个数据点，并找到一个数学函数，它就像一个神奇的黑箱，将“踏板压力”作为输入，并给出“车速”作为输出。你不知道它为何有效，但你能以惊人的准确性预测汽车的速度。这就是经验方法。

在科学和工程领域，我们两种模型都会使用。它们不是敌人；它们是用于不同工作的不同工具，每种都有其自身的哲学、美感和局限性。

两种模型的故事：由内而外与由外而内

机理模型旨在表征系统底层的因果过程。它是一个基于第一性原理（如能量守恒、质量平衡或已确立的生物物理定律）构建的“玻璃箱”。机理模型中的参数不仅仅是数字；它们代表了真实世界中具体、可测量的量。例如，在模拟神经元如何发放电脉冲时，著名的 Hodgkin-Huxley 模型使用的参数对应于细胞膜上特定离子通道的物理电导。在构建模型以预测钢梁中的应力时，参数是像杨氏模量或拉梅常数这样的物理属性。在模拟卫星信号如何从森林反射时，参数是叶片吸收系数和冠层散射特性，所有这些都植根于辐射传输方程的物理学基础。机理模型的力量在于其解释深度。它回答了“为什么”。

经验模型，通常也称为唯象模型，是由外而内地工作的。它是一个“黑箱”，其主要目标是准确描述观测到的输入和输出之间的关系。它毫不讳言是数据驱动的。模型的结构不是从物理定律推导出来的，而是因其灵活性和拟合数据的能力而被选择。其参数是统计上的旋钮和刻度盘，通过调整以最小化模型预测与观测现实之间的误差。一个经典的例子是用于根据患者数据预测败血症风险的逻辑回归模型。模型权重并不对应于特定的生物学速率；它们仅仅是优化预测准确性的数值。

科学领域中，经验模型最优雅的例子之一是用于生物化学中描述蛋白质如何与其他分子结合的希尔方程 (Hill equation)。许多蛋白质表现出一种称为“协同性”的行为，即结合一个分子会使其更容易结合下一个分子，从而产生一个急剧的S形（S型）响应曲线。希尔方程 $Y = \frac{[L]^n}{K_{0.5}^n + [L]^n}$ 仅用两个经验参数就完美地捕捉了这种S形特征： $K_{0.5}$ （半饱和浓度）和 $n$ （希尔系数，衡量“陡峭度”或协同性）。虽然这个方程可以从一个简化的、全有或全无的结合场景中推导出来，但其真正的力量在于，它为观测到的现象提供了一个出色的数学描述，而无需拘泥于真实且通常远为复杂的底层分子机理。它是对“是什么”的有力总结，而不是对“如何实现”的证明。

假设的艺术：将物理学编织进黑箱

没有模型是在真空中创建的；两种模型都建立在假设的基础之上。但这些假设的性质却截然不同。

对于机理模型，假设就是物理定律。模型构建者断言系统遵守例如质量守恒定律，而这个约束被硬编码到模型的结构中，就像摩天大楼的钢框架一样。模型的有效性取决于这些基础定律的有效性。

经验模型起初似乎更自由。你可以用任何你想要的函数来拟合数据。但这种自由是一种错觉。选择使用哪个函数本身就是一个强有力的假设，是统计学家和计算机科学家称之为归纳偏置的一种先验知识形式。如果你选择用一条直线来拟合数据，你就在施加线性的归纳偏置。如果你预期药物的效果会平滑增加并趋于平稳，你可以选择一个具有这种单调、饱和形状的数学函数。即使在贝叶斯框架中，选择模型参数的先验分布也是一种归纳偏置，反映了我们在看到数据之前对何为“合理”模型的信念。

这把我们带到了一个两种哲学交汇的美丽前沿。如果我们设计一个经验模型，比如一个神经网络，但强制它遵守一条物理定律会怎样？这就是“物理知识驱动的机器学习”这个激动人心的领域。例如，在固体力学中，弹性材料中的应力可以从一个势能函数导出。这条物理定律意味着材料响应中存在特定的数学对称性。一个通用的、现成的神经网络不会知道这种对称性。但我们可以专门设计网络的架构，以保证势能函数总是存在，从而将一条基本的热力学定律直接嵌入到我们的经验模型中。通过这样做，我们创造了一个混合体：一个既有经验方法的灵活性，又有机理方法严谨性的模型。

模型的评判者：预测、解释和简洁性

那么，哪个模型“更好”？这就像问锤子是否比螺丝刀更好。答案完全取决于你需要做的工作。评判一个模型的三个最重要标准是其预测能力、解释能力和简洁性。

权衡通常发生在预测和解释之间。如果你的唯一目标是对与你已观测到的情况相似的情形进行准确预测（内插），一个灵活的经验模型通常占有优势。在分析 fMRI 脑成像数据时，目标通常只是检测某个大脑区域是否对刺激产生了反应。一个将大脑视为黑箱、线性地将神经信号转换为血流信号的简单唯象模型，通常是完成这项工作最稳健且统计上最稳定的工具。当数据充满噪声且参数难以从测量中确定时，尝试拟合一个复杂的、参数丰富的血管动力学机理模型可能会很困难。

然而，如果你的目标是解释系统或预测其在全新条件下的行为（外推），情况就会发生戏剧性的转变。假设你通过施加一个突然的温度“阶跃”变化来研究一个体温调节系统。一个经验模型可能会完美地学习到对该特定输入的响应。但如果你现在想预测对缓慢变化的温度“斜坡”的响应呢？经验模型从未见过斜坡，因此会束手无策。然而，包含热量产生和散发等底层动力学的机理模型，可以接受新的输入并计算出预期的结果。它的解释能力赋予了它外推能力。这是因为机理模型就其本质而言，旨在捕捉系统的因果结构——那些即使输入改变也保持不变的杠杆和齿轮。

最后，我们有永恒的奥卡姆剃刀原则：“如无必要，勿增实体。”在同样能很好地解释数据的竞争模型中，应首选最简单的那个。想象一下，你有两个模型来根据卫星数据预测森林生物量。一个是极其复杂、有35个参数的过程模型，模拟了从碳分配到光利用的所有过程。另一个是只有5个参数的简单经验回归模型。你测试了两者，发现它们预测生物量的准确性几乎完全相同。你应该选择哪一个？奥卡姆剃刀会命令你选择更简单的那个。复杂的模型，由于其众多的活动部件，更有可能在“过拟合”——即拟合了你特定数据集中的随机噪声，而不是真实的底层信号。更简单的模型更有可能优雅地推广到新的森林。它用最精简的描述捕捉了关系的本质。

当蓝图出错时

存在一个诱人但危险的陷阱：相信“机理的”总是等同于“正确的”或“更好的”。机理模型是基于我们对世界的假设性理解，而这种理解可能是不完整的，甚至是完全错误的。一个有缺陷的蓝图通常比一个灵活的、数据驱动的描述更糟糕。

考虑一下T细胞（一种免疫细胞）响应刺激分子（细胞因子）的生物学过程。在低剂量的细胞因子下，T细胞会增殖。一个简单的机理模型可能完美地捕捉了这个活化过程。但在非常高的剂量下，一个完全不同的机制开始起作用：活化诱导性细胞死亡。细胞开始死亡，整体响应曲线呈钟形。我们那个简单的机理模型对这个细胞死亡过程一无所知，因此在外推到高剂量区域时会得出灾难性的结果，预测细胞数量会不断增加，而实际上细胞群体正在崩溃。

在这种情况下，一个灵活的唯象模型——其数学形式仅仅被选择为能够表示钟形——实际上可能做出更好的分布外预测。机理模型对不完整理论的执着成了它的致命弱点。这教给我们一个关于科学谦逊的深刻教训：一个模型的好坏取决于它所包含的知识，而“机理”这个标签是对模型结构的声明，而不是对其真实性的保证。

终极测试：设计一个判决性实验

这些建模哲学之间的区别不仅仅是一场学术辩论。它是一个强大而实用的实验设计指南。科学的最终目标是根据现实来检验我们的想法，而做到这一点的最佳方式是设计一个“判决性实验”，迫使两个相互竞争的模型做出截然不同的预测。

想象我们正在研究一种疾病如何在社交网络上传播。我们有两个相互竞争的模型。一个是机理性的“复杂传染”模型。它声称，如果你同时暴露于多个受感染的朋友，你被感染的可能性会大得多，这是一种取决于你局部邻域聚集紧密程度的协同效应。另一个是唯象的“逻辑斯蒂增长”模型。它忽略了网络的精细结构，只是说受感染的人数根据一个简单的、聚合的S形曲线增长。

我们如何在这两者之间做出选择？纯粹的观察方法是软弱的。一个绝妙的实验设计将是，取一个网络并系统地重新布线，拆散紧密的局部集群，同时保持其他一切（如每个人拥有的朋友数量）完全相同。

模型们会预测什么？

对集群视而不见的唯象模型预测，疾病将以完全相同的方式传播。
其核心假设是集群重要性的机理模型预测，疾病的传播速度将慢得多。

我们创造了一种情境，其中模型们做出了相反的、可证伪的预测。通过进行这个实验，我们可以让自然来投出决定性的一票。这就是理论与实验的美妙结合。模型不仅仅是用来描述世界现状的；它们是用来提出尖锐问题、指导我们进行干预，以及揭示支配宇宙的隐藏机制的工具。

应用与跨学科联系

在了解了经验模型的原理之后，我们现在到达了探索中最激动人心的部分：看这些思想在实践中的应用。对物理学家来说，一项新原理就像一把新钥匙。真正的快感不只是检查这把钥匙，而是用它去尝试所有你能找到的锁着的门。你会惊讶于经验模型能打开的门的种类之多，从活细胞的内部运作到黑洞的灾难性舞蹈。

这不是一个关于取代我们对世界深刻的、机理性的理解的故事。远非如此。相反，这是一个关于美妙合作的故事。有时候，自然的完整、未经删节的故事——万物背后的“为什么”——是压倒性地复杂。一个力求捕捉每个齿轮和滑轮的机理模型，可能就像试图建造一个完美的鸟的时钟复制品来理解其飞行一样。这是一种高尚且必要的追求。另一方面，经验模型则像一位观鸟大师的作品，他通过观察无数次的飞行，能够以不可思议的准确性预测鸟的下一站，而从未窥视其内部。这两种方法不是竞争对手；它们是宏伟发现事业中的伙伴。经验模型揭示模式，机理模型则努力解释它。

生命的节律

让我们从你每天都能看到的东西开始：一片绿叶。叶子通过称为气孔的微小孔隙“呼吸”，吸入用于光合作用的二氧化碳（ $\text{CO}_2$ ）并释放水蒸气。它如何决定这些孔隙应该“开放”到什么程度？这是一个涉及光、水和激素的极其复杂的平衡行为。然而，一个绝妙简单而强大的经验模型，即 Ball-Berry 模型，以惊人的优雅捕捉了这种行为的本质。它指出，气孔导度（ $g_s$ ），即衡量孔隙开放程度的指标，与光合速率（ $A$ ）和叶片表面的湿度（ $h_s$ ）呈线性关系，同时与叶片表面的 $\text{CO}_2$ 浓度（ $C_s$ ）成反比。该关系可以写为 $g_s = g_0 + m \frac{A h_s}{C_s}$ ，其中 $g_0$ 是一个小的残余导度， $m$ 是一个敏感性参数。这不是从保卫细胞生物化学的第一性原理推导出来的；它是在数据中注意到的一个模式。但它的发现是一个启示，提供了一条简单的规则，现在为用于预测全球气候和农业产量的植被模型提供了动力。

这种预测能力从植物世界延伸到我们自己的身体，直至临床医学领域。考虑一位正在接受造血干细胞移植的患者，这个过程会补充他们的血液生成系统。一个关键的里程碑是“中性粒细胞植入”，即他们新的免疫系统开始运作的时刻。医生们观察到，植入所需的时间取决于所给予的干细胞剂量。虽然底层的生物学过程是细胞分裂、信号传导和迁移的旋风，但一个经验模型带来了惊人的清晰度。研究发现，预期的植入时间 $T$ 与细胞剂量遵循一个优美简洁的对数线性关系： $T = a - b \ln(\mathrm{dose})$ ，其中 $a$ 和 $b$ 是从临床数据中找到的常数。这使得医生能够对患者的恢复情况做出定量预测，将一个复杂的生物过程转变为一个可预测的结果。

当然，有时数据本身会告诉我们，一个简单的经验规则是不够的。在药理学中，我们常常发现药物从体内的清除并非线性；在高剂量下，系统会饱和，就像高峰时段的高速公路一样。数据——以剂量依赖性暴露的形式——尖锐地指出一个简单的线性模型是错误的。这就是经验观察引导我们走向更具机理性的画面，迫使我们考虑如能力限制性清除或靶介导的药物处置等概念。经验发现是通往更深层故事的线索。

按数据工程

为复杂系统寻找简单规则的同样哲学，也是许多工程学领域的基石。想象你是一位声学工程师，正在设计一个音乐厅或录音室。你需要能吸收声音的材料，但声波在多孔材料复杂纤维中摆动的方式，从头计算起来简直是一场噩梦。于是 Delany–Bazley 模型应运而生。这是一个经典的经验模型，它基于一个简单的、可测量的属性——材料的气流阻力 $\sigma$ ——来预测纤维材料的声阻抗和传播常数。该模型由一组幂律关系组成，如 $Z_c \propto (f/\sigma)^{-0.754}$ ，其中的系数和指数是通过对大量实验数据进行曲线拟合而找到的。它不是关于孔隙中波动力学的深刻理论，但它效果非常好，以至于已成为我们日常使用的材料设计中的标准工具。

这种方法甚至进入了量子世界。穆斯堡尔谱学是一种可以感知特定原子核化学环境的技术。“同质异能移”是一个关键信号，它取决于原子核处的电子密度——一个微妙的量子力学效应。从第一性原理计算这个效应是一项艰巨的任务。然而，对于一个像锡（ $^{119}\text{Sn}$ ）这样的杂质原子被放置在不同的金属基质中时，一个简单的经验模型被发现效果非常好。它根据宿主金属的两个易于查阅的属性来预测同质异能移：其电负性和其摩尔体积。一个复杂的量子问题被一个捕捉了施加在杂质原子上的基本化学和物理压力的线性模型巧妙地绕开了。

也许经验模型最令人叹为觀止的应用来自宇宙。当两个黑洞碰撞时，它们会发出引力波——时空结构本身的涟漪。为了探测这些微弱的信号，我们需要确切地知道它们的样子；我们需要一个模板。为这次剧烈合并求解爱因斯坦方程只有通过大规模的超级计算机模拟才可能实现，即所谓的数值相对论（NR）。但这些模拟太慢，无法实时扫描天空。解决方案是什么？唯象模型，比如“IMRPhenom”系列。这些模型不是从第一性原理推导出来的。相反，它们是复杂的经验拟合——设计巧妙的数学函数，其参数被调整以匹配由解析近似（后牛顿理论）预测的缓慢早期旋进，以及由NR预测的剧烈合并和铃振。在一个绝妙的转折中，这个经验模型的“数据”竟是我们最佳物理理论的输出！正是这种经验上的独创性，构成了引力波天文台的核心，使其能够在几秒钟内发现数亿光年外的黑洞合并事件。

新前沿：混合模型与对理解的探索

在现代，经验模型的格局正在被机器学习所改变。其核心思想是相同的——从数据中学习模式——但工具却强大得多。这使得机理模型和经验模型之间的关系来到了一个引人入胜的新十字路口，尤其是在我们所知的最复杂的系统中。

考虑为基于CRISPR的基因编辑工具设计向导RNA的挑战。我们想要一个在其靶点上高效，但不会在基因组其他任何地方切割的向导。我们可以用两种方式来处理这个问题。生物物理模型试图根据热力学定律计算向导与DNA的结合自由能（ $\Delta G$ ）。另一方面，经验模型则采用数据驱动的方法。它学习一种统计关系——通常使用机器学习——将向导和靶点的特征（如错配的数量和位置）直接映射到观察到的切割效率，而无需明确计算能量。两者都很强大，该领域通过使用和比较这两种哲学而蓬勃发展。

然而，最激动人心的发展是我们不再需要在两者中择其一。我们可以构建混合模型。这是从肿瘤学到工程学等不同领域的前沿。想象一下，为喷气发动机或发电厂构建一个“数字孪生”。我们可以从一个基于已知热力学和流体动力学定律的物理模型开始。这构成了一个尊重基本守恒定律的坚固骨架。但这个模型会有未知的参数，并且会遗漏一些复杂的现实世界效应。然后我们可以使用数据驱动的经验方法，从系统的实际运行数据中“学习”这些缺失的部分——本质上，是使用机器学习来填补我们物理理论的空白。

这种混合方法正在彻底改变系统生物学。为了模拟肿瘤生长，我们可以使用细胞增殖和氧气等营养物质扩散的方程来构建一个机理模型。这提供了基本结构。然后，我们可以使用来自特定患者的数据——例如医学影像（MRI）和基因组数据（scRNA-seq）——来经验性地学习模型的患者特异性参数，从而个性化预测。其结果是一个既基于基本的“癌症标志”又为个体量身定制的模型。它兼具机理模型的稳健性和经验模型的灵活性。

这把我们带到了关于科学方法的最后一个深刻观点。有时，非常不同的底层过程可以产生完全相同的模式。在生态学中，这被称为“等效终局性”（equifinality）。许多关于为什么物种丰富度在赤道最高的不同机理理论，都可以预测观测到的纬度多样性梯度。如果我们构建一个灵活的经验模型，它可能会对丰富度数据达到极佳的拟合，比任何单一的机理模型都要好。但这是否意味着它是“正确的”？不一定。这意味着它对模式的描述非常好。更好的拟合并不自动意味着更好的解释。经验模型在这里的真正价值是双重的。首先，它为我们的机理理论设定了一个需要达到的基准。其次，也是更重要的，它向我们提出挑战。如果我们最喜欢的理论不能像一个简单的统计拟合那样好地解释这个模式，也许我们的理论遗漏了什么。为了打破等效终局性的僵局，我们必须对我们的模型提出更高的要求，要求它们不仅预测一个模式，还要预测许多独立的模式——不仅是物种有多少，还包括它们的进化关系和功能性状。

最终，经验模型是我们探索自然模式的向导。它们向我们展示世界做什么。它们不总是告诉我们为什么，但它们为我们指明了正确的方向，挑战了我们的理论，并与我们追求更深层次理解的探索美妙地合作，揭示了一个既奇妙复杂又出奇简单的世界。