
在一个数据泛滥的世界里,人们很容易相信观察一个系统就等同于理解它。然而,纯粹的数据驱动方法通常充当“黑箱”,它们模仿结果却不理解其根本的因果关系。这造成了关键的知识鸿沟,尤其是在我们需要预测新场景下的行为、诊断故障或发明新技术时。本文深入探讨一种替代且互补的理念:基于物理的建模,即根据支配系统行为的基本定律来构建模型的实践。通过关注“是什么”背后的“为什么”,这种方法提供了无与伦比的准确性、可解释性和泛化能力。
本次探索分为两部分。第一章“原理与机制”将揭示该方法论的精髓,从其基于第一性原理和守恒定律的基础,到近似的艺术和数学语言的关键选择。随后的“应用与跨学科联系”一章将展示该方法在广阔的科学和工程领域中的深远影响,揭示这些模型如何让我们能够设计、预测和控制我们周围的世界。我们首先考察区分这一强大建模范式的基本信条。
假设你是一名厨师。你有两种学习烹饪的方式。第一种,你可以观看成千上万个其他厨师的视频,试图模仿他们的每一个动作,却完全不理解他们为什么在这里加一撮盐或在那里加一点酸。这样,你就是一名数据驱动的厨师。第二种,你可以学习烹饪的第一性原理:热量如何使蛋白质变性,酸和脂肪如何相互平衡,盐如何增强风味。这样,你就是一名基于物理的厨师。虽然第一种厨师或许能完美复刻一道特定的菜肴,但只有第二种厨师才能创造新食谱,修正出问题的菜肴,并适应使用不熟悉食材的厨房。
基于物理的建模就是这第二种厨艺。它是一门艺术,也是一门科学,其核心是不仅基于观察,更要基于支配世界的根本法则来构建对世界的数学描述。它关乎理解“是什么”背后的“为什么”。
从核心上讲,基于物理的模型是基本原理的体现,其中最重要的是守恒定律。这些是宇宙中不可违背的规则:你无法创造或毁灭质量、能量或动量;你只能移动它们或改变其形式。无论是恒星、飓风还是电池的模型,都必须首先遵守这些定律。这正是它与纯粹的数据驱动模型的区别所在,后者从数据中学习统计相关性,但对这些约束没有任何内在认知。
想象一下,你是一位材料科学家,拥有一个包含10000种假设晶体结构的数据库,你想找到一种导热性极高的结构。一个完整的基于物理的模拟,或许基于量子力学,可以为任何给定结构提供“基准真相”的答案。但这个过程极其缓慢,每个结构需要数百小时。另一方面,一个基于先前样本训练的机器学习(ML)模型,可以在瞬间做出预测。ML模型速度快,但可能会出错——它可能错过一种有前途的材料,或者更糟的是,将一个无用之物标记为优胜者。一种常见的策略是使用快速的ML模型进行初步筛选,然后使用缓慢但精确的物理模型来验证最有希望的候选者。这种混合方法完美地说明了这种权衡:物理模型提供了现实的最终基准,是无可指摘的基准真相,即使获取它的成本很高。
然而,基于物理的方法的真正力量不仅在于准确性,还在于可解释性和泛化能力。思考一下制造微芯片的挑战。在印刷电路图案的光刻工艺中,可能会出现微小的“热点”或缺陷。一个基于物理的模型会根据光学和化学定律模拟光波及其与光刻胶材料的相互作用。如果它预测到一个热点,它可以告诉你为什么会发生——也许是焦距略有偏差,或者来自相邻特征的干扰导致光线模糊。一个在过去缺陷图像上训练的ML模型也可能预测到热点,但它无法提供同样清晰的因果解释“为什么”。它是一个黑箱。此外,如果制造工艺稍有改变,物理模型通常只需调整一个参数(如光波长)就能适应。然而,ML模型可能会完全失效,因为它从未见过来自这个新工艺的样本。它的知识无法泛化到其训练数据之外的范围。
“基于物理”并不意味着“无限精细”。物理学的一个奇妙之处在于,其原理适用于不同尺度,使我们能够为特定任务选择合适的细节层次。这就是近似的艺术。你不需要用量子色动力学来建一座桥,也不需要模拟每一个原子来设计一个晶体管。
这种模型层次结构的思想在半导体设计领域得到了完美的体现。为了发明一种新型晶体管,工程师们使用技术计算机辅助设计(TCAD)。TCAD仿真在代表器件几何形状的精细网格上,求解半导体物理学的基本偏微分方程(PDE)——如漂移-扩散方程和泊松方程。它展示了电子和空穴如何在硅内部移动和相互作用。这非常强大,但也极其缓慢。
现在,想象一下,你想仿真一个包含数十亿个这种晶体管的完整微处理器。为每一个晶体管运行TCAD仿真是计算上不可能的。取而代之的是,电路设计者使用紧凑模型。紧凑模型是一组精心设计的代数方程,用于描述晶体管的终端行为——即其终端电压与流过电流之间的关系。这些方程不是对数据的随意拟合;它们源自与TCAD模型相同的底层物理学,但经过了简化和浓缩。它们捕捉了核心行为(例如晶体管如何开启和关闭),而无需模拟所有内部细节。紧凑模型仍然是基于物理的,但它代表了建模层次中一个更高、更抽象的层次。它牺牲了内部场的细节,以换取电路仿真所需的速度上的巨大提升。因此,基于物理的建模是一个谱系,是在保真度和计算成本之间,根据你试图回答的问题而进行的持续权衡。
模型中的“物理”不仅体现在像 这样的著名方程中,它还融入了模型本身的数学结构之中。选择正确的数学语言对于正确表达物理现实至关重要。
一个引人入胜的例子来自处理非整数阶导数(如半阶导数)的分数阶微积分。这类概念对于建模具有记忆效应的系统(如粘弹性材料)非常有用。定义分数阶导数有多种方法,最常见的两种是 Riemann-Liouville 定义和 Caputo 定义。对于物理学家或工程师来说,选择是明确的:几乎总是首选 Caputo。为什么?因为常数的 Caputo 导数为零,就像普通导数一样。而常数的 Riemann-Liouville 导数不为零。这个看似深奥的数学细节具有深远的物理意义。因为常数的 Caputo 导数为零,我们可以使用我们从入门物理学中熟悉并喜爱的相同初始条件来设定分数阶微分方程的初值问题:初始位置 和初始速度 。这些量保留了它们直接、直观的物理意义。而使用 Riemann-Liouville 方法,初始条件会变成奇怪、不直观的分数阶积分,难以测量或解释。选择 Caputo 导数就是选择一种能够表达我们物理直觉的数学“方言”。
这一原则也延伸到随机性建模。物理系统常常受到嘈杂、波动的力的影响。当这些波动发生得非常快时,我们通常将它们建模为数学上的“白噪声”。但这里有一个微妙的陷阱。这种噪声是真正的瞬时噪声,还是一个具有微小记忆量的极快但非无限快的物理过程的极限?这一区别导致了两种不同的随机微积分:Itô 和 Stratonovich。这不仅仅是数学家的游戏。如果你要为一个在扩散系数随位置变化的介质中扩散的粒子(乘性噪声)建模,微积分的选择会改变最终的方程,并且至关重要的是,会改变粒子平稳分布的预测。一个具有短时记忆的真实物理过程(“有色噪声”)的白噪声极限,应由 Stratonovich 解释来正确描述。如果忽略这一点而使用 Itô 形式,将会导致对粒子最可能出现位置的物理上不正确的预测。噪声的物理特性决定了正确的数学工具。
在很长一段时间里,基于物理的建模和数据驱动的建模被视为对立的理念。但现代前沿在于它们的融合,即创建能够利用两者优势的混合模型。
AlphaFold 在预测蛋白质结构方面的巨大成功就是一个很好的例子。给定一个氨基酸序列,它能以惊人的准确性生成三维结构。这是否证明蛋白质折叠本质上是一个“信息科学”问题,而非物理问题?完全不是。由 Christian Anfinsen 首次阐述的物理原理是:序列会折叠成能够最小化其自由能的唯一结构——这是一个热力学问题。AlphaFold 训练所用的数据——一个庞大的已知蛋白质结构库——并非形状的随机集合,而是物理规律作用的记录。AlphaFold 并没有取代物理学,而是学习了其结果。它发现了一条通往答案的极其有效的捷径,而这个答案是宇宙通过统计力学定律计算出来的。
这为一种强大的合作关系指明了方向。思考一下电池建模问题。如果你有一种全新的电池化学体系,实验数据很少,那么纯数据驱动的模型将会举步维艰,尤其是当你想预测其在从未测试过的温度下的性能时。一个基于电化学和热力学原理构建的物理信息模型,提供了一个稳健的框架——一种“归纳偏见”——允许对这些未见过的条件进行合理的推断。其结构植根于物理定律,即使在你没有数据的地方,物理定律依然成立。反之,如果你有一种现有电池技术,拥有大量来自实际使用的数据,那么一个快速的数据驱动模型可能对于快速仿真更为实用,只要你停留在已知的操作条件内。
当今最激动人心的发展是正式结合这两种方法的混合模型。例如,在气候建模中,大尺度的大气动力学由流体动力学的核心守恒定律支配。这些定律是已知的、不可违背的,由传统的基于物理的求解器处理。然而,诸如云形成和湍流等关键的小尺度过程极其复杂,无法通过全球模型的粗网格来解析。这些“亚网格尺度”过程是机器学习的完美目标。其策略是构建一个混合体:基于物理的模型提供坚固的骨架,强制执行基本的能量和质量守恒,确保模型的稳定性和物理合理性。而机器学习组件,则通过高分辨率模拟或观测数据进行训练,充当一种“参数化”方案,填补复杂的、未解析的物理过程。这是两全其美的最佳方案:已知物理学的严谨基础,加上机器学习强大的表达能力,共同捕捉现实中混乱而复杂的细节。这是一个既懂第一性原理又品尝过百万道菜肴的厨师所构建的模型,将深刻的理解与丰富的经验融为一体。
既然我们已经探讨了构成基于物理的建模核心的原理与机制,现在我们可以踏上一段旅程,看看这些思想将我们引向何方。欣赏一座时钟精密的机械结构是一回事,而看它报时、用它导航、靠它协调整个世界则是另一回事。一个科学思想的真正力量与美,并非体现在其无菌的孤立状态中,而在于它能够延伸、连接并以意想不到的方式照亮世界的能力。
这是一个何等精彩的世界!从电池内部离子的微观舞蹈,到塑造我们脚下岩石的无声巨压;从我们思想的电信号低语,到我们最关键基础设施的数字守护者——基于物理的模型是连接这些看似迥异领域的通用语言和智识纽带。让我们一同游览这片风景,亲眼见证这些原理的杰作。
如此多的现代技术依赖于那些太小、太快或太复杂以至于无法直接观察的现象。我们无法简单地看进电池内部观察其老化,也无法窥探活体大脑看一个念头的形成。在这里,基于物理的模型充当了我们的显微镜和解释器,让我们能够理解和设计这些隐藏的世界。
思考一下不起眼的电池,我们便携世界的引擎。我们要求它能在几分钟内充满电,续航数天,并安全运行。但在其内部,一场战斗正在进行。在负极表面,必须达到一种微妙的平衡。作为电池命脉的锂离子,必须平滑而高效地沉积。然而,在高速充电的压力下,这些离子在表面附近可能会被耗尽。一个基于电化学基本 Nernst 和 Butler-Volmer 方程的物理模型,揭示了一个微妙但危险的后果:随着局部离子浓度下降,电化学电位发生变化。这种变化不仅在热力学上使锂更容易沉积,也使不希望的副反应更容易发生,例如形成称为固体电解质界面(SEI)的寄生层,或生长出金属锂枝晶——这些微小而尖锐的指状物会刺穿电池的内部结构,导致灾难性故障。模型向我们展示,在*热力学驱动力(在这些耗尽区变得更强)和动力学速率*(随着其燃料——离子的耗尽而减慢)之间存在一场竞争。通过模型理解这种相互作用,工程师可以设计出能够安全地驾驭这片险恶电化学环境的充电协议和材料。
从这个微观界面扩展开来,一个整个电池包(例如电动汽车中的电池包)的模型揭示了另一种真相。电池的“标称”能量,即包装盒上的数字,是一个理想值。“可用”能量才是你实际得到的。为什么会有差异?一个简单的基于物理的模型,将电池单元视为一个依赖于其荷电状态 的开路电压源 ,减去其内阻 产生的电压降,便能说明一切。电压并非恒定不变,它会随着电池放电而下降。更重要的是,在重负载(大电流 )下,电压下降得更多。由于电池必须在安全的电压窗口内运行以避免损坏其化学结构,这种增加的电压降意味着当你需要大功率时,你会更快地达到下限截止电压。你只使用了电池总存储电量的一部分,因此提取的能量也更少。这就是为什么手机在玩图形密集型游戏时比闲置时耗电更快的原因。这个解释了基础物理的简单模型,阐明了理想化规格与现实世界性能之间的差距,并且是每个电池管理系统(BMS)赖以建立的基础,用以安全地最大化一个可能包含数千个略有差异的独立电芯的电池包的性能。
将微观物理转化为宏观功能的同样挑战,出现在一个更复杂的系统中:人脑。数十亿神经元的集体行为是如何产生思想的?一个关键步骤是模拟单个神经元如何“决定”发放一个电脉冲。神经元的膜电位由随机的突触输入驱动,这可以被看作是一种“噪声”。但这是哪种噪声?它是一个平滑、快速波动的信号,就像物理滤波器的输出?还是无数离散的、类似粒子的事件(如屋顶上的雨滴)的结果?
物理学家的模型必须忠实于噪声的物理起源。如果我们将突触输入建模为一个平滑的有色噪声过程,统计物理学中的 Wong–Zakai 定理告诉我们,由此产生的膜电位随机微分方程必须在 Stratonovich 意义下进行解释。然而,如果我们将它建模为离散突触事件(一个散粒噪声过程)的极限,中心极限定理会引导我们采用 Itô 解释。这些不仅仅是深奥的数学选择;它们会导致具有不同预测的不同方程。例如,用于散粒噪声的 Itô 公式包含一个在朴素的 Stratonovich 观点中不存在的漂移项,这个项可以从根本上改变神经元的预测放电率。选择正确的数学不是品味问题,而是一个物理假设。这表明,在计算神经科学中,基于物理的建模是一项深刻的实践,旨在确保我们的数学工具忠实地代表现实的结构。
现在,让我们从微观世界中抽身,将注意力转向土木工程和地球物理学的宏观世界。我们如何为我们赖以建造的土地建模?
当一团土壤或岩石承受巨大压力时——来自建筑地基或构造板块的运动——它会变形。它的形状和体积都会改变。为了使计算模型准确,它必须正确地捕捉与这两种不同类型变形相关的能量。连续介质力学的美妙数学提供了一种方法。通过将变形梯度张量 分解为描述纯体积变化的部分(与其行列式 相关)和描述恒定体积下形状变化的部分(等容部分 ),我们可以将材料的应变能函数 进行拆分。我们将其写为一个和:,其中 是等容应变张量。
这不仅仅是一个巧妙的数学技巧,它有两个深远的实际意义。首先,在使用有限元法的计算机模拟中,它有助于防止一种称为“体积锁定”的数值病态,这种情况下,近乎不可压缩材料的模型会变得人为地僵硬,并给出完全错误的答案。其次,它在物理上更真实。它允许建模者为体积部分指定一个非常复杂的非线性行为——例如,描述多孔岩石在压力下孔隙的突然坍塌——而不会不自然地破坏材料对剪切(形状改变)力的响应。这是数学优雅与物理直觉的完美结合,使我们能够建造更安全的水坝和更具弹性的建筑。
这种对地球材料进行建模的能力延伸到了探索地表深处。在可控源电磁法(CSEM)这一地球物理勘探技术中,我们向地下发射电磁场并测量其响应,以绘制出如油藏或地下含水层等地下结构。其支配物理学当然是麦克斯韦方程组。在频域中,场以频率 振荡,通过引入复电导率的概念 ,这些方程可以得到简化。实部 代表材料传导稳恒电流的能力,而虚部 则解释了位移电流,这在高频或低导电性材料中变得重要。这一个复数优雅地将两种不同的物理效应捆绑在一个量中,简化了方程,并使勘探中使用的基于物理的正演模型在计算上既高效又富有深刻见解。
也许,基于物理的建模最激动人心的前沿是它与数据革命的融合,其形式表现为信息物理系统(CPS)及其“数字孪生”。究竟什么是数字孪生?它远不止是一个模拟。一个真正的数字孪生是物理资产——如风力涡轮机、飞机发动机,甚至工厂车间——的一个活生生的、会呼吸的虚拟副本。
它的定义是精确且可操作的。首先,它必须包含其物理对应物的基于物理的虚拟模型。其次,它必须通过连续的、双向的数据流与物理资产相连。它从物理系统接收实时传感器数据,并且至关重要的是,能够将控制命令发回给它。一个只接收数据的模型仅仅是“数字影子”。一个没有实时数据连接的模型只是一个模拟。第三,也是最重要的一点,数字孪生必须拥有同步机制。它必须不断地将其内部状态、模型参数和时间感与它的物理孪生对齐,校正延迟和测量噪声。正是这种闭环、同步的共同演化赋予了数字孪生力量。
构建这样一个复杂的孪生体面临一个挑战:底层的基于物理的模型可能极其复杂且计算成本高昂——太慢以至于无法实时运行。正是在这里,与机器学习的绝妙协同作用应运而生。我们可以使用高保真度的物理模型作为“神谕”,来训练一个速度快得多的代理模型,通常是高斯过程或神经网络。但是运行“神谕”成本高昂,所以我们必须巧妙行事。通过*主动学习*,我们可以利用代理模型本身来指导我们的探索。我们问代理模型:“你对系统行为的哪个部分最不确定?”代理模型可以通过指出其预测方差最高的参数空间区域来回答。然后,我们就在那个精确的点上运行我们昂贵的物理模拟,收集信息量最大的数据来减少代理模型的不确定性。这个智能循环使我们能够用最少数量的昂贵模拟,构建一个高精度、能实时运行的数字孪生,这是基于物理的模型与人工智能协同工作的一个绝佳范例。
然而,伴随这种力量而来的是新的脆弱性。当我们将物理世界与数字世界连接起来时,我们就为具有物理后果的网络攻击打开了大门。保护一个信息物理系统(CPS)不同于保护传统的IT网络。攻击者不仅仅是试图窃取数据(机密性、完整性、可用性),他们还试图造成物理伤害。为了防范这一点,我们必须像物理学家一样思考。CPS的威胁模型必须超越防火墙和密码,它必须包含系统本身的物理特性。虚假数据注入传感器馈送后,是如何通过系统动力学传播的?攻击者能否制造一个看似无害却能激发危险共振的信号?他们能否将系统推向其物理执行器的极限(例如,一个阀门只能以一定的速度关闭),从而使控制器束手无策?要回答这些问题,我们必须使用基于物理的模型进行可达性分析——绘制出攻击者可能迫使系统进入的状态。在这个新世界中,安全不仅仅是一个计算机科学问题,它是一个物理问题。
除了工程和控制,基于物理的建模本身也已成为科学发现的主要引擎。在材料科学和化学等领域,传统的“假设-合成-测试”物理实验室循环极其缓慢。高通量计算筛选(HTCS)已经打破了这一范式。我们不再是深入研究一两种用于新型催化剂或太阳能电池的候选材料,而是可以利用自动化工作流程,在广阔的化学设计空间中进行数千甚至数百万次快速的、基于物理的(通常是量子力学的)计算。
这里的策略是广度优先于深度。基础概率论告诉我们为什么这如此强大。即使对每个候选物的评估是嘈杂或近似的,找到真正异类——即性能卓越的材料——的机会也会随着你筛选的独特候选物数量的增加而急剧增加。HTCS 相当于计算领域的淘金。你不会精细地研究河床上的每一块石头;你用一个快速、高效的过程筛选成吨的砾石,以找到那几颗珍贵的金块。这种方法是现代“设计-制造-测试-学习”循环的基石,正在加速发现将定义我们未来的材料。
最后,在风险最高、我们必须理解极限以确保安全的领域,基于物理的模型是不可或缺的。在核反应堆中,维持链式反应的绝大多数中子是“瞬发”的,几乎在裂变瞬间产生。但有不到百分之一的微小而关键的部分是“缓发”的,由裂变产物衰变在数秒后发射。这个微小的比例 是反应堆控制的关键。一个简单的反应堆堆芯点动力学模型显示,只要引入的反应性 小于 ,反应堆的功率水平就由缓发中子的慢时间尺度所主导,从而给控制系统充足的反应时间。但如果 一旦超过 ,反应堆就会进入“瞬发临界”状态。链式反应仅靠瞬发中子就能自我维持,功率水平在毫秒级时间尺度上呈指数级爆炸,对于机械控制来说速度太快。简单模型的“瞬发跳跃近似”在这个阈值处失效,预示着向一个新的、剧烈的物理状态的转变。这一源自基础物理模型的独特见解,是核安全的一项基本原则,它尖锐地提醒我们,模型具有揭示安全与灾难之间锋利边界的力量。
从最小的组件到最庞大的基础设施,从我们创造的材料到我们必须保护的世界,基于物理的建模不仅仅是一个工具。它是一种通用的思维方式,一个用于严谨想象的框架,让我们能够理性地思考世界、塑造世界,并以远见和理解力驾驭世界。它证明了物理定律非凡的、统一的力量。