首页通用微分方程

通用微分方程

玻尔百科

定义

通用微分方程是一种通过通用方程形式或将科学模型与神经网络结合来描述物理系统的数学框架。该方法利用缩放和无量纲化等经典技术将不同系统简化为统一形式，同时也作为一种现代科学发现工具发挥作用。在当代应用中，通用微分方程允许研究人员通过从实验数据中学习缺失的模型组件，从而揭示隐藏的物理定律。

核心要点

诸如标度变换和无量纲化等经典技术，可以将不同物理系统（如 Thomas-Fermi 模型中的原子）的微分方程简化为单一的通用形式。
单个微分方程，例如描述宇宙密度涨落的方程，可以拥有普适的行为模式，支配其所描述的所有系统的演化。
现代通用微分方程（UDE）通过将已知的科学模型与神经网络的灵活学习能力相结合，代表了一种新的范式。
UDE 作为科学发现的工具，使研究人员能够通过学习模型中缺失的部分，从实验数据中揭示隐藏的物理定律和机制。

引言

对统一性的不懈科学追求——即在纷繁表象之下寻找共通原理的探索——往往在微分方程的语言中得到最有力的表达。这些方程描述了从最小的原子到整个宇宙的系统动力学。然而，尽管它们已被巧妙地应用于经典物理学中优雅的封闭系统，但在面对生物学等开放系统的压倒性复杂性时，一道巨大的鸿沟出现了。当游戏规则尚不完全明了时，我们如何才能找到普适规律？

本文旨在梳理微分方程中普适性概念的演变历程，从已建立的理论到前沿方法。在“原理与机制”一节中，我们将揭示经典物理学家的“魔术”，展示巧妙的数学变换如何为所有重原子揭示一个单一的通用方程，以及基本行为模式如何支配宇宙结构的增长。然后，我们转向现代复杂性的挑战，为“应用与跨学科联系”一节做好铺垫。在这一节，我们将探讨这些普适性原理在量子物理和统计物理领域的深远影响，然后深入探讨一个新的前沿领域：通用微分方程（UDE），这是一个融合了机理模型和机器学习的突破性框架，旨在发现我们世界中隐藏的物理规律。

原理与机制

当物理学家观察两个明显不同的事物时，他们有一个奇特而美妙的习惯，那就是问：“这里有什么是相同的？”以一个金原子和一个铀原子为例。一个是稳定的贵金属；另一个是巨大的放射性元素。它们的质子、中子和电子数量不同，化学性质也大相径庭。然而，物理学家会歪着头思考，在某个基本层面上，它们是否只是同一底层对象的不同尺寸版本。这种对统一性的不懈追求，即在纷繁表象之下寻找隐藏的普适原理，是科学的引擎。而在这场探索中，最强大的工具之一便是微分方程——描述变化的语言。

物理学家的巧技：通过标度变换实现普适性

让我们从原子的世界开始我们的旅程。在量子力学早期，试图为拥有数十个电子的原子求解薛定谔方程是一项不可能完成的任务。因此，像 Llewellyn Thomas 和 Enrico Fermi 这样的物理学家发展出一种巧妙的近似方法，即一种统计模型，将原子的电子云视为一种带电荷的流体。这引出了 Thomas-Fermi 方程，一个描述电势 $V(r)$ 如何随离原子核距离 $r$ 变化的微分方程。

现在，这个方程有一个小小的麻烦：它明确地依赖于原子序数 $Z$ 。这意味着金（ $Z=79$ ）的方程与铅（ $Z=82$ ）的方程不同，而铅的方程又与铀（ $Z=92$ ）的方程不同。这感觉就像我们为元素周期表中的每一种元素都建立了一套独立的理论。这不是我们所追求的优雅统一性！

但奇迹就在这里发生。如果我们能为每种原子找到一种“自然”的测量方式呢？如果我们不为每个原子都用米来测量距离，而是为金定义一个特定的标尺，为铀定义一个不同的、按比例缩小的标尺呢？如果我们不用伏特来测量电势，而是用每种原子特有的某种自然电势单位呢？这就是无量纲化的核心思想。

通过引入一个标度化的距离 $x$ 和一个标度化的势函数 $\phi(x)$ ，一个显著的转变发生了。我们将实际距离 $r$ 定义为与新的无量纲距离 $x$ 成正比，通过一个依赖于原子序数的比例因子，具体为 $r = c_r Z^{-1/3} x$ 。在这个表达式中， $c_r$ 是一个常数长度，但关键部分是 $Z^{-1/3}$ 的依赖关系。我们对电势也做了类似的处理。当我们将这些新变量代入原始的、依赖于 $Z$ 的 Thomas-Fermi 方程时，会涌现出一大堆项。但当尘埃落定时，每一个 $Z$ 都被消掉了。它们如同魔术般消失了。

我们最终得到的是一个关于函数 $\phi(x)$ 的单一、通用的方程。这一个方程描述了任何重原子中的电子屏蔽效应。函数 $\phi(x)$ 对金、对铅、对铀都是相同的。元素之间的差异并没有被忽略；它们被吸收到坐标的标度变换中。我们发现，从深层次意义上说，一个金原子只是一个铅原子的“放大”版本，而两者都由相同的基本蓝图所描述。这就是普适性的经典愿景：找到一种巧妙的视角转换，从而揭示隐藏在一整类物理系统之下的简单、共同的真理。

普适行为：宇宙的模式

有时候，普适性并非通过将多个方程合并为一个来发现，而是通过发现单个方程所允许的基本“模式”行为。让我们离开微小的原子世界，前往可以想象的最大尺度：膨胀的宇宙。

大爆炸之后，宇宙极其光滑，但并非完美无瑕。存在着微小的密度涨落，即一些区域的密度比平均值略高。引力作用于这些涨落，将更多物质吸引进来，使它们增长。这个过程是所有宇宙结构——星系、星系团和巨大的宇宙网——的起源。这些密度涨落的演化由变量 $\delta$ 描述，其变化由一个微分方程控制，该方程将其变化与宇宙的膨胀（由标度因子 $a$ 表示）联系起来。

乍一看，这个方程有点吓人：

\frac{2}{3} a^2 \frac{d^2\delta}{da^2} + a \frac{d\delta}{da} - \delta = 0

我们不试图为某个复杂的初始涨落求解它，而是问一个更简单的问题：是否存在任何简单的、“自然”类型的解？让我们尝试一个幂律解 $\delta(a) = a^p$ ，看看它是否有效。我们将这个猜测代入方程，做一点代数运算，然后发现了惊人的事情。该方程只有在指数的两个特定值上才能满足： $p=1$ 和 $p=-3/2$ 。

这是一个深刻的结果。它意味着任何初始的密度涨落，无论其形状或大小，都将演化为仅仅两种基本行为的组合。一个是增长模式，其中 $\delta \propto a^1$ ，意味着密度对比度与宇宙的大小成正比增长。这是构建结构的模式。另一个是衰减模式，其中 $\delta \propto a^{-3/2}$ 。随着宇宙的膨胀，这种模式会迅速消亡，其记忆被宇宙膨胀所抹去。宇宙结构的命运是由这两个普适角色上演的一出戏剧。即使初始条件不同，原理也是普适的。

从物理到生命：一种新的复杂性

Thomas-Fermi 原子的优雅标度变换和宇宙结构的清晰模式是某种物理学的胜利——这种物理学研究的系统通常是封闭的、守恒的，并且可以用少数几个参数来描述。但是，当我们将目光转向一个活细胞时，会发生什么呢？

细胞不像一个安静、孤立的原子。它是一个开放系统，一个由分子机器组成的熙熙攘攘的大都市，不断与其环境交换物质、能量和信息。它的行为由巨大、纠缠的基因和蛋白质网络所支配，这些网络由数十亿年杂乱的进化所塑造，而不是由一个简单、优雅的势函数所决定。试图以我们处理原子的方式为细胞找到一个“通用方程”，似乎是徒劳的。

这时，像生物学家 Ludwig von Bertalanffy 这样的思想家的远见变得至关重要。他倡导一般系统论，该理论提出，即使在这些极其复杂的系统中，我们也应该寻求普适的组织原则。也许普适性不在于具体的方程，而在于反复出现的模式——反馈回路、层级结构、网络基序——生命一次又一次地使用这些模式。这种哲学上的转变为我们指明了方向。它告诉我们，不要再寻找一个简单的方程，而应开始寻找一种处理复杂性的新方法。

通用逼近器：当你不知道规则时

这种新方法来自一个起初看似完全不相关的领域：计算机科学。想象你是一位研究细胞如何应对压力的生物学家。你手头有大量数据，显示了几种蛋白质的浓度随时间的变化。你知道它们的动力学由一个微分方程组 $\frac{d\vec{y}}{dt} = F(\vec{y}, t)$ 控制，但你完全不知道函数 $F$ 是什么。它可能涉及数十个未知的相互作用和反馈回路。

现代的方法既大胆得令人难以置信，又有效得出奇，那就是说：“我不知道函数 $F$ 是什么，所以我让机器来为我学习它。”这就是神经普通微分方程 (Neural ODE) 的诞生。我们用一个神经网络来代替未知的函数 $F$ ，神经网络是一种高度灵活的数学对象，可以被训练来逼近其他函数。

这不仅仅是一个充满希望的猜测；它有强大的数学保证作为后盾。微分方程的通用逼近定理指出，对于任何行为良好（但可能非常复杂！）的常微分方程组，都存在一个神经网络，可以在有限时间内以任意期望的精度学习模仿其行为。神经网络作为一个通用函数逼近器，能够仅通过观察动态系统的运行（即从数据中学习），来学习任何动力学游戏的规则。

这是一种全新的普适性。在经典的 Thomas-Fermi 案例中，我们利用人类的智慧找到了一个巧妙的变量替换，从而揭示了一个单一、简单、预先存在的通用方程。在现代的神经 ODE 案例中，我们使用一个通用的学习机器（神经网络），它有能力成为任何系统动力学的表示，无论多么复杂。我们不需要预先知道规则。

科学在环：发现未知

至此，你可能会感到一丝不安。如果神经网络只是一个学习拟合数据的“黑箱”，我们真的学到了什么吗？我们只是在绘制一个非常复杂的图形，还是在做科学研究？这就是故事通过通用微分方程 (UDE) 的概念回到原点的地方。

UDE 框架认识到，我们事实上并非完全无知。数十年的生物学研究为我们提供了部分的、不完整的但有价值的机理模型。UDE 允许我们将我们已知的与我们未知的结合起来。我们以混合形式写出方程：

\frac{d\vec{y}}{dt} = \text{(我们当前的机理模型)} + \text{(一个用于修正误差的神经网络)}

想象一下，我们有一个关于蛋白质磷酸化循环的简单模型，但我们知道它不完全正确，因为它与我们的实验数据不符。我们可以创建一个 UDE，其中神经网络的唯一任务就是学习“缺失的生物学机制”——即我们简单模型未能捕捉到的那部分动力学。

我们用数据训练这个混合模型。神经网络尽职地学习一个函数来修正模型的预测。但最精彩的部分在于：我们随后可以审视这个学习到的网络。我们可以分析它发现的函数。在这样一个案例中，研究人员发现神经网络学到了一个对应于隐藏反馈回路的项——它发现了一个科学家们曾假设为固定的速率常数，实际上会根据蛋白质的浓度而变化。

这是最终的回报。UDE 不仅仅是拟合了数据；它利用数据揭示了科学拼图中的新一块。它增强并修正了我们现有的知识，为更完整的机理理解指明了方向。这种现代综合方法将经典、基于机理的微分方程的严谨性与机器学习令人难以置信的灵活性和强大功能相结合，不仅创造了一种预测工具，而且创造了科学发现本身的新引擎。对普适性的探索仍在继续，现在我们拥有了比以往任何时候都更强大的工具。

应用与跨学科联系

物理学的一大乐趣在于这样的顿悟时刻：世界的复杂织锦被揭示是由几根简单的线编织而成。我们努力透过特定情境中令人困惑的细节——这个原子与那个原子，这个宇宙与另一个宇宙——去寻找真正普适的基本原理。微分方程是我们探索过程中最强大的工具之一。在探讨了这些方程的原理和机制之后，我们现在可以通过观察它们如何帮助我们在一系列惊人的学科中发现和描述这种普适性，来领略其深远的影响。

这是一个关于标度变换的故事，关于在从原子之心到宇宙边缘的巨大不同背景下，看到相同基本模式重复出现的故事。

物理学家的梦想：单一法则，万千世界

想象一下，你正试图描述一个重原子核周围的电子云。你可能会认为，一个拥有 79 个电子的金原子与一个拥有 82 个电子的铅原子是根本不同的物种。在很多方面，确实如此。但在 20 世纪 20 年代，Llewellyn Thomas 和 Enrico Fermi 发现了一件非凡的事情。通过将电子云视为一种量子气体并运用一些巧妙的推理，他们发现这个问题可以归结为一个单一的、普适的、非线性微分方程。

这个方程的解给出了电子屏蔽效应的一个普适形状。它告诉我们，随着你远离原子核，原子核的电场是如何逐渐被抵消的。令人惊讶的是，这个“屏蔽函数”对于每一个重的中性原子都是相同的。在这个优雅的图像中，铅原子和金原子的电子云之间的唯一区别，仅仅是一个简单的距离和电势的标度因子，这个因子取决于核电荷数 $Z$ 。其底层的物理学，被一个无参数的微分方程所捕捉，是普适的。一条解曲线描述了所有这些原子。

现在，让我们从原子的尺度跃迁到整个宇宙的尺度。宇宙学家经常研究简化的“玩具”宇宙模型来理解我们自己宇宙的动力学。人们可以考虑一组注定要坍缩的封闭宇宙，每个宇宙起始时物质含量略有不同。就像原子一样，这些宇宙看起来是不同的。然而，支配它们膨胀的 Friedmann 方程也有类似的秘密。通过一种依赖于每个宇宙初始物质密度的方式重新调整时间和距离，它们所有不同的生命历程——它们的膨胀和最终的坍缩——都可以被映射到一条单一的、普适的轨迹上，这条轨迹由一个无参数的微分方程描述。

这种宇宙普适性并不止于整体膨胀。我们今天看到的所有结构——星系、星系团、巨大的宇宙网——的形成，都始于早期宇宙中微小的密度涨落。引力导致这些密度稍高的区域增长，吸引越来越多的物质。这种“密度对比”的演化，用变量 $\delta$ 表示，由一个优美的二阶微分方程控制。这一个方程讲述了星系种子在数十亿年间如何生长的故事。虽然方程中系数的具体形式会根据宇宙的构成——无论是只有物质，还是物质加上宇宙学常数，甚至是像 quintessence（精质）这样更奇异形式的暗能量——而改变，但方程的基本结构保持不变,,,。原理是普适的：一场放大扰动的引力与试图冲刷掉它们的宇宙膨胀之间的斗争，全部被一个微分方程所捕捉。

量子与统计领域的普适性

这种通过微分方程揭示的普适性原理，并不仅限于引力和电磁学的经典世界。它有时以更惊人的力量出现在量子和统计领域。

考虑一个看似平凡的物体：一根在极低温度下的细薄、无序的金属线，这是一个由量子力学主宰的地方。你让一股电流通过它。由于金属线中随机散布的杂质和缺陷，电子的路径是混乱的。你可能会期望电导是金属线特定的、混乱构型的某个复杂函数。确实如此。但如果你测量许多这样的金属线的电导，或者对单根金属线的实验条件进行微调，你会发现一些惊人的事情。电导的涨落并非随机。它们的统计大小——它们的方差——会稳定在一个普适常数，在适当的单位下，这个数值接近 $2/15$ ，而这与金属线的长度、具体材料或杂质的确切排列无关。这种被称为普适电导涨落 (Universal Conductance Fluctuations, UCF) 的惊人现象，是量子波干涉的深刻结果。解释它的理论依赖于一个强大的微分方程——DMPK 方程，它描述了随着金属线长度增加，量子输运性质的统计演化。从一个描述统计演化的微分方程中，一个单一的、普适的数字从混乱中浮现出来。

现代物理学中对普适性最深刻的表达，见于对相变的研究——物质发生剧烈变化的过程，比如水沸腾成蒸汽。恰在相变的临界点上，系统在所有放大尺度下看起来都一样；它变得“标度不变”。在这一点上，系统忘记了其构成成分的所有微观细节，并由普适规律所支配。驱动这一思想的数学引擎是重整化群 (Renormalization Group, RG)。RG 方程是微分方程，但不是关于时间或空间的，而是关于标度的。它们描述了一个系统的有效物理定律如何随着我们放大或缩小而“流动”。这个流的一个不动点对应一个标度不变的临界点，而在这个不动点附近的行为产生了称为临界指数的普适数。

同样的想法与共形场论 (Conformal Field Theory, CFT) 的优美数学联系在一起，CFT 已成为二维临界现象的语言。像网格上的磁性、聚合物的聚集、水在多孔岩石中的渗透等各种各样的问题，都可以在它们的临界点上用 CFT 来描述。例如，一个矩形上的随机网络形成一条连接顶部和底部的路径的普适概率，是由 CFT 中的一个特定微分方程——Belavin-Polyakov-Zamolodchikov (BPZ) 方程的一个解所支配的。再一次，一个微分方程为超越微观细节的普适真理提供了钥匙。

新前沿：发现未知的宇宙

到目前为止，我们的旅程颂扬了一种经典的普适性观念：知道物理原理使我们能够写出一个微分方程，其标度变换或极限形式揭示了普适行为。但是，如果我们不知道完整的物理定律呢？如果我们的微分方程是不完整的呢？

这里，我们站在一个新的前沿，普适性的概念在这里获得了新的、强大的意义。这就是现代通用微分方程 (UDEs) 的领域，一个传统科学建模与机器学习的融合体。

其核心思想既 brillant 又简单。我们写下我们基于物理学基本原理（如能量守恒或动量守恒）所确知的微分方程部分。对于我们不知道的部分——一个复杂的摩擦项、一个未表征的化学反应、一个神秘的生物反馈回路——我们嵌入一个通用逼近器——一个神经网络。

这里的“通用”指的是神经网络的一个数学特性，即它们原则上可以逼近任何连续函数。UDE 之所以“通用”，在于它提供了一个能够发现和表示几乎任何缺失的物理动力学的框架。然后，我们可以用实验数据来训练这个混合模型。神经网络不仅仅是盲目地拟合数据；它学习微分方程本身中缺失的部分。它以一种与我们已经信任的定律相一致的形式发现了隐藏的物理学。

其应用是无限的，并已在改变科学。

在生物学中，药理学家可以利用已知的输运和代谢定律来模拟药物浓度在体内的变化，同时让一个 UDE 来学习细胞内复杂的、特定于患者的、以前无法建模的相互作用。
在气候科学中，研究人员可以基于对流体动力学和辐射的深入理解建立模型，但使用 UDE 直接从卫星数据中学习云或海洋生物学错综复杂且知之甚少的反馈效应。
在材料科学中，人们可以利用已知的弹性定律来模拟新合金中的应变，并让一个神经网络去发现控制材料在应力下疲劳和断裂的未知非线性方程。

这种新型的通用方程不仅描述世界，它还帮助我们发现世界。它不仅是一个应用的工具，更是一个启示的工具。它代表了一种美丽的综合： encoded in differential equations 的数百年物理学智慧，与现代机器学习无与伦比的模式发现能力相结合。这是我们阅读自然之书的下一步，即使是那些尚未写就的篇章。