基于物理的模型

玻尔百科

定义

基于物理的模型是指利用能量守恒等基础物理定律建立的数学模型，旨在确保模拟结果符合物理逻辑。这类模型通过在简化物理导致的系统误差与数据噪声敏感性之间寻找平衡，实现了对新场景的可靠泛化能力。该技术广泛应用于虚拟设计、环境分析以及数字孪生和可解释人工智能的核心构建。

核心要点

基于物理的模型利用能量守恒等基本定律，确保物理上的合理性，并能在新场景下进行可靠的泛化。
建模涉及一个关键的权衡，即偏差（由简化的物理原理导致的系统性误差）和方差（对训练数据中噪声的敏感性）之间的权衡。
混合模型将物理学的结构完整性与数据的自适应学习能力相结合，创造出既稳健又精确的强大工具。
应用范围从虚拟设计实验室和环境分析，到作为数字孪生和可解释人工智能的智能核心。

引言

在我们探索理解和预测周围复杂世界的过程中，涌现出了两种强大的哲学思想。一种依赖于从海量数据中学习，创建出模仿能力极强但其推理过程通常不透明的模型。另一种则建立在支配宇宙的基本规则之上，创建出植根于物理定律的模型。虽然数据驱动的“黑箱”模型取得了令人难以置信的成功，但它们无法泛化到未见过的条件以及缺乏透明性，这在高风险的科学和工程领域构成了重大挑战。

本文探讨的是第二条路径：基于物理的模型的世界。这些模型通过将自然界的基本原则编码到其结构中，为创建稳健、可解释和可靠的预测提供了一个框架。我们将首先探讨其核心的原理与机制，揭示普适不变量、偏差-方差权衡以及混合数据集成等概念如何赋予这些模型独特的力量。然后，我们将见证这些原理在实践中的应用，探索它们多样化的应用与跨学科联系——从设计下一代电子产品到管理地球健康，再到构建值得信赖的智能系统。

原理与机制

想象一下，你想预测一个被抛出的球的路径。你可以采取两种截然不同的方法。第一种，你可以聘请一位世界级的棒球外野手，他们对球的落点有着不可思议的直观感觉。他们无法为你写下方程式，但在观察了成千上万次投掷后，他们的大脑已经建立了一个极其复杂的内部模型。这就是数据驱动模型的精神：它是一位模仿大师，直接从大量观测数据中学习复杂的模式和相关性。

第二种方法是，你可以坐下来，拿出一张纸，援引 Isaac Newton 等科学家发现的运动和引力定律。你会写下描述力如何使球加速以及重力如何将其向下拉的方程式。这就是基于物理的模型的精髓：它是一个规则制定者，试图通过应用被认为是支配世界行为的基本原理来描述世界，而不是通过模仿观测。

本章将探讨第二条路径。我们将深入基于物理的模型的世界，以理解它们的原理、力量、局限性，以及它们与数据世界之间美妙的合作关系。

现实的基石：普适定律

是什么赋予了基于物理的模型其特殊性质？它不仅仅是任何一套规则，而是建立在物理定律这一基石上的一套规则。这些定律——如能量、质量和动量守恒——是我们宇宙的宪法。它们并非仅仅是建议；它们是不变量，是在任何地方、任何时间都成立的属性，从星系的舞蹈到苏打水罐中的气泡皆是如此。

当我们为地球气候等建立模型时，我们并非从零开始。我们建立在一个控制算子之上，我们称之为 $M$ ，它代表了这些离散化的守恒定律。这个算子是我们模型的引擎，根据传热和流体动力学的基本物理原理，推动大气和海洋的状态随时间演变。

这种方法的力量是巨大的。建立在这些不变量之上的模型具有一种完整性。它不能凭空创造能量，也不能让质量消失。这在极端情况下尤为关键。考虑模拟像聚合物溶液这样的复杂流体在极高速度下流动的挑战——一个被称为高魏森伯格数问题的著名难题。一个纯数据驱动的模型，若只在温和的流场上进行训练，当被要求预测在剧烈的拉伸流中会发生什么时，可能会产生完全无意义的、爆炸性的结果。相比之下，一个强制执行热力学第二定律的物理知识驱动模型则有一个内置的安全网。第二定律坚持系统不能无中生有地创造能量，提供了一个“能量估计”，防止模拟崩溃并使其保持物理上的合理性，即使在它从未被明确训练过的区域也是如此。这些基本定律是模型的良心，使其保持诚实。

精美而有缺陷的杰作：偏差与方差

当然，没有模型是完美的。地图并非疆域。在我们捕捉现实的探索中，我们总是面临一个基本的权衡，统计学家称之为偏差-方差权衡。

想象我们正在尝试为一个简单的环境循环建模，这个循环有一个主要的节律（如季节），还有一个由更复杂过程引起的较小的次级波动。假设真实的信号是 $g(x) = \sin(\pi x) + 0.3 \sin(2\pi x)$ 。

现在，我们可以根据我们对主导物理过程的理解，建立一个简单的“机理”模型，它只考虑主要节律： $\hat{y}_{\text{mech}}(x) = \hat{a}\sin(\pi x)$ 。这个模型结构简单。因为它无法表示次级波动，所以无论我们给它多少数据，它总是会系统性地出错。这种系统性误差就是它的偏差。然而，由于其刚性，它不容易被数据中的随机噪声所左右。它的预测是稳定和稳健的。我们说它具有低方差。

或者，我们可以使用一个更灵活的“经验”模型，它允许更强的复杂性： $\hat{y}_{\text{emp}}(x) = \hat{\beta}_{1}\sin(\pi x) + \hat{\beta}_{2}\sin(2\pi x)$ 。这个模型足够复杂，可以完美地捕捉真实的底层信号，所以它的偏差为零。但这种灵活性是有代价的。它有更多的旋钮可以调节，使其对训练它所用的特定数据中的随机噪声更加敏感。如果我们用另一组噪声数据来训练它，它的预测会有更显著的变化。它具有较高的方差。

在一个绝妙的思想实验中，可以证明在一定的噪声水平和有限的数据量下，简单而有偏差的机理模型有时能做出比“正确”但过于灵活的模型更好的整体预测。总误差是偏差、方差和不可约噪声之和。机理模型有很大的偏差但方差极小。经验模型偏差为零但方差较大。建模的艺术往往在于在这个权衡中找到最佳点——创建一个足够灵活以捕捉本质真实，但又不过于灵活以至于迷失在追逐噪声中的模型。

洞见的谱系：从黑箱到透明箱

“物理”和“数据”之间的区别不是一条清晰的界线，而是一个丰富且连续的谱系。

在一端，我们有黑箱模型。这是我们的模仿大师。我们给它输入，它给我们输出。它可能极其精确，但其内部工作原理是不透明的。大型神经网络就是一个典型的例子。其数百万个参数并不对应任何我们可以命名的物理量；它们只是复杂优化过程的结果。

在另一端，我们有白箱模型，我们也可以称之为纯粹基于物理的模型。它的结构完全源于第一性原理。理论上，每个参数都有物理意义——质量、刚度、反应速率。它的逻辑是透明的。我们可以看透其内部，看到基于物理定律的“推理”过程。

在这两者之间，是广阔而肥沃的灰箱模型地带。这些模型是一种融合，一种混合体。它们使用已知的物理结构，但将某些参数留给数据来学习。例如，我们可以将一个机械系统建模为质量-弹簧-阻尼器系统，这是一个由物理学决定的结构，但使用数据来估计质量、刚度和阻尼系数的具体值。这种方法让我们两全其美：既有物理学的稳固支架，又有数据的自适应灵活性。

安全跨越的秘诀：泛化与不变性

也许，基于物理的模型的最大优点是其泛化能力——在从未遇到过的情况下做出可靠预测的能力。纯数据驱动的模型就像一个背熟了教科书上所有问题答案的学生。如果考试题目完全一样，他们会得满分，但如果遇到一个需要应用基本原理的新问题，他们就会束手无策。

而基于物理的模型则学习原理本身。考虑在托卡马克（一种用于核聚变的装置）中防止破裂这一巨大挑战。人们可以利用来自某个特定托卡马克的数百万个信号来训练一个黑箱模型。它可能在预测该特定机器的破裂方面变得非常出色。但如果你试图将它用于一个新的、不同尺寸的托卡马克，它很可能会失败。它学到的是一台机器的怪癖和特性，而不是等离子体稳定性的普适物理学。

基于物理的方法则不同。它会关注那些与装置无关的无量纲数——如归一化比压 ( $\beta_{N}$ ) 或安全因子 ( $q_{95}$ )——这些量捕捉了等离子体稳定性的本质物理，与特定机器的尺寸或构造无关。一个建立在这些无量纲参数阈值上的模型，更有可能从一个托卡马克“迁移”到另一个。它能够泛化，因为它建立在更普适的真理之上。

同样的原理也适用于为电动汽车设计电池。如果我们有大量关于现有电池化学成分的数据，黑箱模型在进行微小的设计调整时可能会既快速又准确。但如果我们正在探索一种全新的化学成分，并需要知道它在从未测试过的炎热沙漠气候中将如何表现呢？这时，数据驱动模型就如同盲人摸象。而一个基于电池热力学和电化学构建的物理知识驱动模型，是我们唯一可靠的向导。它可以外推到新的温度范围，因为热力学定律不会因为你跨越了一个州界而改变。

强大的联盟：当物理与数据携手

我们已经看到，纯物理模型有其局限性（它们有偏差，会忽略未解析的细节），而纯数据模型也有其局限性（它们不透明，泛化能力差）。在许多领域，未来属于它们的综合体：物理-数据混合模型。

其理念很简单：用物理来做它最擅长的事，用数据来做它最擅长的事。物理提供了模型坚固、稳定的骨架，而数据则用具体、细致的细节来充实它。

回想一下我们的地球系统模型。我们有来自物理学的控制算子 $M$ ，但我们知道它并不完美。它没有捕捉到每一次云的形成或海洋的涡旋。因此，我们可以添加一个统计分量，一个学习到的函数 $f_{\phi}$ ，它充当一个“修正趋势”。这个函数从历史数据中学习，以纠正物理核心的系统性偏差。

这种联盟可以更加深刻。在为忆阻器（一种新兴的电子元件）建模时，一个简单的物理模型可能会假设一种线性关系。一个更复杂的模型会增加非线性项，这些项代表已知的物理效应，比如该器件在其工作边界附近行为的变化方式。这是一种灰箱方法。更进一步，我们甚至可以允许一个神经网络来学习整个非线性函数，但有一个严格的条件，即它必须遵守像热力学第二定律这样的物理约束。在这种情况下，物理不再是模型本身；它成了老师，成了规则制定者，确保那个强大但难以驾驭的数据驱动学生不会违反自然法则。

知其所不知：诚实的模型

一个成熟的科学模型的最终标志是带有一丝谦逊。一个真正伟大的模型不仅给你一个答案，它还会告诉你这个答案有多值得信赖。它量化了自身的不确定性。

这在气候建模等复杂领域尤为重要。科学家们不依赖于单一模型；他们使用一个多模式系综，这是由世界各地的团队开发的许多不同模型的集合。其中一些模型具有根本不同的结构（“族”），而在每个族内部，参数可以被调整，从而创建一个庞大的“扰动物理系综”。

通过使用像层次贝叶斯模型这样的复杂统计框架，科学家们可以分析整个系综。他们可以梳理出不确定性的不同来源：有多少是由于我们对地球初始状态的认知不完善？有多少是由于我们选择的特定参数值？以及最重要的是，有多少是由于结构不确定性——即不同模型族所做的物理假设之间的深层差异？

这是基于物理的建模的前沿。它正在从寻求一个单一的“完美”模型，转向对我们所知、我们所不知以及最大问题所在之处进行诚实、透明的描述。这是科学的最佳状态：一种严谨、自我意识强且永无止境的对理解的追求。

应用与跨学科联系

在探索了基于物理的模型的基本原理之后，我们现在来到了探索中最激动人心的部分：观察这些模型在实际中的应用。它们存在于何处？它们能做什么？你会发现，它们并非束之高阁的理论家黑板上的陈旧遗物。相反，它们是处于科学和工程前沿的、充满活力且不可或缺的工具。它们是您口袋中技术背后的无声建筑师，是解读地球健康状况的可靠翻译者，也是我们最智能系统的智力核心。让我们开始一次对它们广泛多样的应用的巡礼，并在此过程中，见证物理定律在惊人的尺度和学科范围内的卓越统一性。

虚拟实验室：通过模拟进行设计与发现

想象一下，能够在单个硅片被蚀刻之前，逐个原子地构建和测试一种新型计算机芯片。或者在一种新药分子在实验室合成之前，就能观察到它如何与细胞相互作用。这就是“虚拟实验室”的力量，也是基于物理的模型最直接和深远的应用之一。通过将自然界的基本定律编码到一个计算框架中，我们可以创建出具有前所未有保真度的模拟，使我们能够以曾经只存在于科幻小说领域的方式进行设计、测试和发现。

思考一下现代电子学的核心：晶体管。像最先进的硅锗异质结双极晶体管（SiGe HBT）这样的器件是纳米级工程的奇迹。要准确预测其行为，不能简单地使用欧姆定律。相反，设计者必须构建一个详细的、基于物理的模型，这简直是物理原理的交响乐。他们必须考虑到，在如此高的掺杂浓度下，电子不再遵循经典统计，而是遵循费米-狄拉克统计的量子规则。他们必须包括电子和空穴复合的主要方式，例如通过缺陷（肖克利-里德-霍尔复合）和在拥挤环境中的三体碰撞（俄歇复合）。他们必须模拟大量带电原子如何实际扭曲半导体能带结构的构造，这种效应被称为带隙变窄。至关重要的是，他们必须精确模拟电子跨越不同材料之间精细界面——即“异质结”——的输运过程，在这里，像热电子发射这样的量子效应支配着电流的流动。正如一位大厨选择完美的食材组合一样，器件物理学家必须选择正确的物理模型集来构建一个忠实再现现实的模拟。其结果就是能够设计出为我们的世界提供动力的更快、更高效的芯片。

虚拟实验室不仅限于确定性方程。许多物理过程本质上是随机的，受概率和几率支配。想象一个高能电子在制造微芯片过程（称为电子束光刻）中射入材料。电子的路径是一条疯狂的之字形路线，是与材料原子碰撞的随机游走。我们如何可能模拟这个过程呢？我们的方法是将每次碰撞视为一个随机事件，其概率由量子力学定律决定。一个基于物理的蒙特卡洛模拟正是这样做的。它模拟数百万个单个电子的旅程，在每一步“掷骰子”来决定电子的命运：它会与原子核发生弹性散射吗？还是会与原子电子发生非弹性散射，损失能量并产生一个次级电子？这些事件的概率是根据第一性原理计算的，使用相对论性莫特散射截面进行弹性散射计算，并使用材料介电响应的复杂模型进行非弹性损失计算。通过数百万次运行这个“游戏”，我们建立了一个关于电子能量沉积位置的精确统计图像，使我们能够以极高的精度雕刻出纳米尺度的图案。

诠释世界：从微观物理到宏观现象

除了设计新技术，基于物理的模型是我们诠释周围世界的主要工具。它们就像一块罗塞塔石碑，让我们能够将复杂、大规模的观测结果转化为对底层微观过程的理解。这就是“反演”的本质，即我们从结果反向推导其原因。

想象一颗卫星环绕地球运行，向一片广阔、偏远的森林发送雷达脉冲。卫星测量后向散射信号——一种回波。这个回波能告诉我们关于森林健康和生物量的什么信息呢？单凭它本身，信息不多。但是，如果我们有一个基于物理的模型，例如水云模型（WCM），我们就可以开始解码它。WCM明确地模拟了散射过程：有多少雷达信号被树冠的叶子和树枝散射，有多少穿透过去，从地面反射回来，并在返回途中被衰减。通过将我们的分析建立在微波散射的物理基础上，我们可以反演这种关系，并从卫星的测量中估计出一个具有巨大生态重要性的量——森林的地上生物量。

这种方法与纯数据驱动的方法形成对比，后者可能只是简单地发现卫星信号与实地测量的生物量之间的统计相关性。虽然强大，但这类数据驱动模型很难外推到其训练数据中未见过的新类型森林或条件。而基于物理的模型，因为它建立在普适原理之上，所以往往更稳健。它还自然地解释了像信号饱和这样的现象，即在非常高的生物量下，树冠变得如此密集，以至于雷达信号无法再穿透它，这对我们能从太空中测量什么设定了基本的物理限制。

新科学革命：物理与数据的共生

我们生活在一个理论、实验和计算之间的界限日益模糊的时代。基于物理的模型不再是孤立的理论构造。它们现在是与数据驱动方法和先进计算科学构成的一个动态、共生的生态系统的一部分。这种融合正在解锁新的能力，并推动我们所能认知和所能做到的前沿。

从数据中学习，由物理来指导

没有模型是完美的。物理方程通常包含我们可能无法完全准确知道的参数——材料常数、反应速率等。我们如何为这些参数找到最佳值？经典的方法是将模型拟合到实验数据上。但我们可以做得更好。我们可以要求模型不仅要匹配数据，还要遵守它本应代表的物理定律。

在一种称为物理知识驱动的模型校准的技术中，我们可以构建一个“评价函数”供优化算法最小化。这个函数有两部分。第一部分惩罚模型预测与测量数据之间的不匹配——这是标准的数据保真度项。然而，第二部分是惩罚对底层物理定律本身的违反。对于一个由微分方程 $\frac{dy}{dt} = -k y$ 控制的系统，这第二项可以是当测量数据代入方程时方程的残差平方。优化器的任务就是找到一个参数 $k$ ，以达到最佳平衡，产生一个既与数据一致又与物理一致的解。这种优雅的综合确保了我们校准的模型不仅擅长曲线拟合，而且具有物理意义。

驯服复杂性：面向快速世界的快速模型

我们一些最强大的基于物理的模型是宏伟而复杂的巨兽。例如，锂离子电池的伪二维（P2D）模型是一个耦合的、非线性的偏微分方程组，描述了锂离子和电子在电池内跨越多个尺度的复杂舞蹈。求解这些方程能提供令人难以置信的洞见，但计算成本高昂——对于实时控制或大规模设计优化等任务来说太慢了。

在这里，物理与计算之间的协同作用提供了两种优雅的解决方案。第一种是基于物理的降阶模型（ROM）。这种方法使用复杂的数学技术，如伽辽金投影，将完整、复杂的控制方程投影到一个更简单、低维的子空间上。其结果是一个小得多的方程组，求解速度可以快上几个数量级，同时其构造方式使其继承了关键的物理属性，如质量和电荷守恒，或与热力学定律的一致性。

第二种方法是数据驱动的代理模型。在这里，我们使用高保真度的物理模型作为“老师”，生成一个包含输入和相应输出的大型数据集。然后，我们训练一个机器学习模型，如神经网络或高斯过程，直接学习这种输入-输出映射。这个代理模型之后几乎可以瞬间做出预测，而在推理时无需解任何微分方程。像算子学习这样的现代技术甚至允许我们创建能够学习整个函数之间映射（如输入电流曲线和输出电压曲线）的代理模型，使它们变得极其灵活和强大。

与不确定性共存：多保真度建模的力量

通常，我们对一个系统不只有一个模型；我们有一整个层次的模型，从廉价、简化的“卡通”模型到极其详细但昂贵的“杰作”模拟。我们如何最好地利用这个模型动物园，尤其是在我们的输入不确定时？

多层蒙特卡洛（MLMC）方法提供了一个绝妙的答案。假设我们想计算飞机机翼上的预期阻力，其中攻角和空气属性等因素是不确定的。高保真度的 RANS 模拟准确但缓慢。一个简单的势流模型快速但不准确。MLMC 方法巧妙地将它们结合起来。它用廉价模型运行大量模拟，以获得平均阻力的大致估计。然后，它用中等保真度模型（如欧拉求解器）与廉价模型之间的差异进行较少次数的模拟。最后，它用昂贵的高保真度模型与中等模型之间的差异进行极少数的模拟。通过加上这些修正，它以远低于仅运行昂贵模型的计算成本，得到了高保真度期望值的高度准确估计。这是一个绝佳的例子，说明了如何利用一系列基于物理的模型来有效地管理和传播不确定性。

前沿：基于物理的模型作为智能系统的大脑

我们现在来到了前沿领域，在这里，基于物理的模型不再仅仅是用于分析的离线工具，而是正在成为实时、智能和自主系统内部的“大脑”。

数字孪生：一个活生生的、会呼吸的模型

考虑一下电动汽车中的大型电池组。随着其老化，其性能和健康状况会随时间变化。我们如何对其进行优化管理？答案是创建一个数字孪生：一个与真实电池并行运行的高保真度物理模型。这不是一个静态模拟。它是一个活生生的模型，不断地从物理电池的传感器——电流、电压、温度——中接收实时数据流。

信息在一个连续的闭环中流动。传感器数据被送入一个估计器（如卡尔曼滤波器），该估计器利用模型预测与实际测量之间的任何差异来校正模型的内部状态（例如，充电状态、内阻）。这个更新、同步的模型现在是物理资产的真正“孪生体”。一个决策模块（如模型预测控制器）然后可以使用这个超精确的孪生体在毫秒内模拟数千种未来的可能性，找到在保证安全的同时最大化性能的最佳充电或放电策略。命令被发送到真实电池，系统演化，循环重新开始。基于物理的模型已经成为一个信息物理系统的智能核心。

照亮黑箱：物理学促进可解释人工智能

人工智能的兴起为我们带来了极其强大的“黑箱”模型，它们能够做出惊人准确的预测，但对于为什么做出这些预测却毫无洞察。这在像气候科学这样的高风险领域是一个问题，因为在这些领域，理解“为什么”至关重要。我们如何建立对人工智能的信任？基于物理的模型再次可以提供答案。

想象我们有一组可信、易于理解的基于物理的气候模型。我们可以把它们当作一个“教师”小组。当一个复杂的人工智能模型做出预测时，我们可以要求每个教师模型给出自己的归因——哪些输入特征（如温度或湿度）对其自身的预测最重要。通过对整个系综的归因取平均，我们可以提炼出一个共识性的解释。更强大的是，通过观察教师之间的方差或分歧，我们可以量化解释本身的认知不确定性。这使我们不仅能说“湿度是最重要的因素”，还能说“湿度是最重要的因素，并且我们的物理模型系综对此有高度共识”。这个考虑了不确定性的重要性分数然后可以用来通过香农熵等度量来衡量解释的焦点。通过这种方式，我们的物理知识库为人工智能的新世界提供了基石般的真理和信任。

从晶体管的核心到智能机器的心智，基于物理的模型证明了人类理性理解和塑造世界的力量。它们是我们为了与自然对话而发展出的语言，一种持续以美丽和意想不到的方式演变的语言，将永恒的物理定律与数据和计算的前沿工具编织在一起。