力学中的变分法：原理与应用

玻尔百科

定义

力学中的变分法：原理与应用是将物理系统重新表述为优化问题的分析框架，通过确定使能量或作用量等物理量取驻值的路径或状态来研究力学行为。该领域涵盖了虚功原理、最小势能原理以及描述动力学轨迹的哈密顿驻作用量原理等核心准则。这些变分方法是瑞利-里茨法和有限元法等工程近似技术的数学基础，为经典力学、材料科学和生物物理学等不同领域提供了统一的数学语言。

核心要点

变分原理将物理学问题重构为优化问题，物理系统遵循的路径会使某个量（如作用量或能量）达到驻值。
核心原理包括用于平衡问题的虚功原理，用于稳定保守系统的最小势能原理，以及用于动力学轨迹的哈密顿驻值作用量原理。
这些原理是科学与工程领域中强大近似技术的基础，其中最著名的是瑞利-里兹法和有限元法（FEM）。
变分法提供了一种统一的数学语言，揭示了经典力学、生物物理学、量子化学和材料科学等看似无关领域之间的深刻联系。

引言

在对物理世界的研究中，我们通常通过追踪物体在每一时刻所受的力来描述其运动和平衡——这便是我们所熟悉的牛顿方法。然而，还存在一种截然不同且同样强大的视角：变分法。该框架假定，自然界在本质上是“经济”的，总是选择一条能使某个量（如能量或作用量）最小化或取驻值的路径或构型。本文将深入探讨这一优美的世界观，旨在回答一个根本性问题：在无穷多种可能性中，一个系统为什么会遵循某条特定的轨迹？我们将首先在原理与机制一章中探索其核心思想，从用于静态系统的虚功原理开始，逐步深入到最小势能原理，并最终通向宏大的适用于动态路径的驻值作用量原理。在这一理论基础之上，应用与跨学科联系一章将展示这些原理巨大的实际效用，从解决经典的优化问题、驱动像有限元法（FEM）这样的现代计算方法，到揭示力学、生物物理学和量子理论之间的深刻联系。

原理与机制

想象你是一位身处丘陵地带的徒步者，目标是到达附近山谷的最低点。你会怎么做？你不会去解复杂的微分方程，而只会在每一步环顾四周，然后朝着下山最陡峭的方向前进。在某种程度上，你正在本能地解决一个优化问题：最小化你的海拔高度。自然界，在其宏伟的复杂性中，其行为常常就像这位徒步者。在物理学的广阔领域中，从光线的路径到电子的量子态，系统似乎都遵循着阻力最小、时间最短或某个量最小的路径。这种“经济原则”是变分法的哲学核心。变分原理不像牛顿定律那样鼓励我们去追踪每一瞬间的力和加速度，而是提出了一个更宏大的问题：在系统可能表现出的所有方式中，它实际上会选择哪一种？事实证明，答案几乎总是那条能使某个全局量——“作用量”或“能量”——取驻值的路径。

“虚”世界：从力到功

让我们从一个处于完美平衡，即平衡态（equilibrium）的系统开始。想象一个从天花板上垂下的吊灯。作用于其上的每一份力——向下拉的重力，向上拉的链条拉力——都完美地相互抵消。现在，我们来做一个思想实验。想象一下，给吊灯一个微小的、虚构的任意方向的推动——一次虚位移（virtual displacement）。由于吊灯已处于平衡状态，它自身没有移动的趋势。它位于其局部能量谷底。任何微小的、虚构的推动都需要你做一点功来移动它，如果你放手，这部分功会立即被返还。用物理学的语言来说，所有力对任意虚位移所做的总虚功（virtual work）为零。这便是虚功原理（Principle of Virtual Work）的精髓。

这个思想由 d'Alembert 形式化，甚至可以推广到运动中的系统。他提出，牛顿定律 $F=ma$ 可以改写为 $F - ma = 0$ 。他将 $-ma$ 这一项称为“惯性力”。通过这个技巧，动力学问题在每一瞬间都变成了一个平衡问题。于是，虚功原理表明，对于任何与系统约束相容的虚位移，所有真实力（重力、弹簧力等）和所有惯性力所做的总虚功为零。

这个原理异常强大。它使我们能够处理具有许多相互连接的部件和约束的复杂系统，而不会迷失在繁杂的力图之中。例如，当我们需要在结构的不同部分之间施加复杂的关系时，比如确保可变形体上的两个点一起移动，我们可以扩展虚功原理。拉格朗日乘子（Lagrange multipliers）方法让我们能够优雅地做到这一点，其中乘子本身可以被解释为施加所需行为所必需的约束力。

能量景观：阻力最小的路径

“功”的概念与“能量”密切相关。对于一类特殊的力，称为保守力（conservative forces）——如重力或理想弹簧的力——将物体从一点移动到另一点所做的功与路径无关。这使我们能够定义一个称为势能（potential energy）的量，你可以将其视为储存的功。被压缩的弹簧具有势能；被举到高处的书本也具有势能。

对于仅由保守力支配的系统，虚功原理转变为一个更直观的原理：最小势能原理（Principle of Minimum Potential Energy）。它指出，处于稳定平衡状态的系统会自行调整以最小化其总势能。吊灯垂直向下悬挂，因为这是其引力势能最低的位置。球会停在碗底。这正是自然界如同我们的徒步者一样，总是在寻找最低点。

这个简单的想法带来了深远的影响。考虑一根一端固定、另一端自由的柔性杆。固定端的条件 $u(0)=0$ 是一个本质边界条件（essential boundary condition）。它是对系统几何形状的基本约束。我们必须将它构建到我们对杆的挠曲形状所做的任何猜测中。然而，另一端的条件——它不受任何推力或拉力——是一个自然边界条件（natural boundary condition）。我们不必强制施加它，最小势能原理会为我们完成！当我们找到使总能量最小化的形状时，该形状将自然地满足杆端点无力的条件。变分原理“知道”力的边界条件应该是什么。

然而，我们必须谨慎使用“最小”这个词。一个完美平衡在山顶上的球也处于一个微小推动所产生的功为零的点——它的能量是驻值。但这是一个不稳定的平衡。要使系统稳定，其平衡状态必须对应于势能的一个真正的局部最小值，这意味着任何微小的偏离都会增加能量。对于许多简单的工程结构，任何驻值点都会自动成为一个稳定的最小值。但是，当我们考虑更复杂的现象，如柱的屈曲时，驻值点（平衡）和最小值（稳定平衡）之间的区别就成了核心问题。屈曲恰好发生在平衡状态不再是最小值的时候。

宏伟蓝图：驻值作用量原理

到目前为止，我们一直在观察世界的静态快照。那么完整的影片呢？——一个粒子从起始时间 $t_1$ 到结束时间 $t_2$ 的整个轨迹呢？是否存在一个单一的原理来支配整个路径？答案是肯定的，而且它是整个科学中最优美、最深刻的思想之一。

首先，我们必须引入一个奇特的量，称为拉格朗日量（Lagrangian），记作 $L$ ，它就是动能（ $T$ ）减去势能（ $V$ ）： $L = T - V$ 。乍一看，这似乎是一个任意而奇怪的组合。为什么不是求和？深刻的答案是，这正是那个有效的量。通过对 d'Alembert 原理进行时间积分，我们发现自然界受这个特定组合的支配。

接下来，我们定义一个称为作用量（action）的总览量， $S$ ，它是拉格朗日量在运动时间区间上的积分： $S = \int_{t_1}^{t_2} L(t) dt = \int_{t_1}^{t_2} (T - V) dt$ 这个作用量是一个表征整个路径的单一数字。现在，想象一个粒子在给定时间内从起点到终点可能采取的所有路径。它可以走直线，可以绕个圈，可以走之字形，任何路径都可以。对于这无穷多种可能的路径，我们都可以计算其作用量。

哈密顿原理（Hamilton's Principle），也被称为驻值作用量原理（Principle of Stationary Action），宣称粒子实际采取的路径是作用量为驻值的那一条。也就是说，如果你采用真实路径，并对其进行微小的、任意的变分，作用量的一阶近似值不会改变。再次注意，是“驻值”，而非“最小”。对于静态问题，我们最小化势能。对于时空中的动态路径，我们寻找作用量的驻点。这一个陈述取代了牛顿的所有运动定律，是自然界经济原则的终极体现。

对偶性、约束与知识前沿

变分的世界充满了强大的工具和优美的对称性。如果我们想在满足某个约束的条件下找到使能量最小化的构型，该怎么办？例如，在总“振幅平方”为某个固定值的情况下，振动弦的最低能量形状是什么？我们可以使用拉格朗日乘子法。我们构造一个增广泛函，在其中加入能量和乘以新变量 $\lambda$ 的约束项。寻找这个新泛函的驻值点会自动找到原始问题的有约束最小值。在此过程中，拉格朗日乘子 $\lambda$ 本身往往揭示为一个具有重要物理意义的量，比如振动的频率平方或结构的临界屈曲载荷。

另一个优雅的思想是对偶性（duality）。我们通常用位移和应变（一种“原始”描述）来描述系统。但是，如果我们尝试纯粹用力和应力（一种“对偶”描述）来描述它们呢？这就引出了余能（complementary energy）的概念。使用一种称为勒让德变换（Legendre transform）的数学工具，我们可以从一个基于应变的能量函数 $U(\boldsymbol{\epsilon})$ 转换到一个基于应力的余能函数 $U^*(\boldsymbol{\sigma})$ 。这给了我们一个全新的变分原理——最小余能原理——它对于某些类型的问题通常更为方便。

然而，当变形变得大而复杂时，这种优美的对偶性面临挑战。底层的能量函数可能会失去一些良好的数学性质（如凸性），使得一个简单的、纯应力的描述变得不可能。这正是现代研究的前沿所在，即发展复杂的混合变分原理，在一个更强大、更灵活的框架中将位移、应变和应力作为独立变量来处理。

最后，我们必须承认这个基于势能的世界的局限性。所有这些优美的原理——最小势能原理、驻值作用量原理——都依赖于力是保守的。那么非保守力呢，如摩擦力，或可能作用在火箭喷管上的奇怪的、方向随动的“追随力”呢？对于这些力，不存在一个单一的势能泛函，其最小化能给出正确答案。当能量景观没有单一的“下坡”方向时，我们不能简单地告诉我们的徒步者去寻找最低点。在这些情况下，我们必须回归到更基本，尽管可能不那么优美的虚功原理，即使在能量原理失效时，它仍然有效。

从简单地寻找最小能量到宏伟的驻值作用量原理，变分法提供了一种统一的语言来描述物理世界。这种语言并不仅限于力学；它也是电磁学、量子场论甚至是爱因斯坦广义相对论的语言。例如，在量子力学中，著名的瑞利-里兹原理通过改变试验波函数来最小化能量的期望值，以寻找系统的基态。一种更现代的方法，密度泛函理论，建立在 Hohenberg-Kohn 变分原理之上，它通过改变电子密度本身来最小化能量泛函。其核心思想总是一样的：当面临选择时，自然界会选择那条在某种深刻意义上最优的路径。寻找那条最优路径，正是变分原理所提供的激动人心的发现之旅。

应用与跨学科联系

现在我们已经了解了变分原理宏伟的机制，你可能会靠在椅子上问：“这一切固然优美，但它到底有何用处？” 简而言之，答案是：几乎无所不包。自然界是一个优化者，不断寻求最小化或使某个量保持驻值的想法，不仅仅是一种哲学思辨；它是我们理解和预测世界最强大、最实用的工具之一。从抛出石块的弧线到活细胞的形状，从桥梁的稳定性到分子的结构，作用量泛函的幽灵潜藏其中，悄悄地引导着进程。

这个原理是我们的金钥匙。它解决了纯粹的优化问题，它驱动着科学和工程领域最强大的近似方法，而且最美妙的是，它提供了一种统一的语言，揭示了看似迥异的领域之间的深刻联系。现在，让我们踏上这段应用的旅程，去看看这个原理在现实世界中是如何运作的。

追求最佳：自然界与设计中的优化

从本质上讲，变分法是一台用于寻找“最佳”的机器——最短的路径、最快的时间、能量最低的形状。这一切都始于一个曾让17世纪最伟大头脑困惑不已的问题。

想象一下，你将一个珠子放在一根金属线上，让它在重力作用下从A点滑到更低的B点。这根线应该是什么形状，才能使这段旅程尽可能快？你最初的猜测可能是一条直线，即距离最短的路径。但是，如果一个更陡峭的初始俯冲可以积蓄速度，从而足以弥补更长的路径呢？这就是著名的最速降线问题（Brachistochrone problem）。由牛顿和伯努利兄弟等人首次找到的答案，不是直线或抛物线，而是一条相当优美的曲线，称为摆线（cycloid）——一个滚动的轮子边缘上的一点所描绘的路径。这是变分法的第一次伟大胜利，它揭示了最快下降的路径并不总是最显而易见的。为任意给定的起点和终点找到这个摆线曲线的精确参数，至今仍是一个将物理原理与具体数值任务联系起来的有趣练习。

对最优形状的同样追求也出现在最意想不到的地方：你的身体内部。想想单个活细胞的细胞膜。它是由脂质分子构成的薄如蝉翼、类似流体的双层结构，并处于不断运动之中。是什么决定了它的形状？事实证明，细胞膜，就像滑动的珠子一样，也在试图最小化某个东西：它的自由能。这个能量主要有两部分。一部分来自膜抵抗弯曲的能力，由弯曲模量 $\kappa$ 描述；另一部分来自膜内的张力 $\sigma$ 。膜所采取的任何形状都是一种妥协，是一种根据 Helfrich 能量泛函使其弯曲能和张力能之和最小化的构型。

我们可以通过一个优美的实验看到这个原理的作用。如果你用一个微小的吸管轻轻地牵引一个大的、松软的囊泡（一个简单的细胞模型），你可以拉出一条细长的膜管，称为“tether”。系统处于平衡状态。这个膜管有多粗？拉动它需要多大的力？通过写出一个半径为 $R$ 、长度为 $L$ 的圆柱形管的能量 $F_{\text{tether}} = (\frac{\kappa}{2R^2} + \sigma) (2\pi R L)$ ，并要求自然界找到在给定长度下使该能量最小化的半径 $R$ ，我们就可以解决这个问题。结果惊人地简单：平衡半径为 $R=\sqrt{\kappa/(2\sigma)}$ ，拉动膜管所需的力是一个常数 $f=2\pi\sqrt{2\kappa\sigma}$ 。这不仅仅是一个理论上的奇观；它是现代生物物理学的主力工具，让科学家通过从活细胞上拉出膜管来测量其力学特性。从重力的赛道到细胞膜的精妙之舞，同样的变分原理在主导一切。

“足够好”的艺术：近似方法的强大引擎

大自然或许有奢侈的条件去完美地解决它的变分问题，但我们凡人工程师和科学家常常面对如此复杂以至于无法找到精确解的方程。一个加载的飞机机翼、一个振动的建筑、一种湍流流体——这些系统由偏微分方程控制，这些方程让我们直接求解的尝试屡屡受挫。在这里，变分原理为我们提供了另一种魔法：近似的艺术。

这个由 Lord Rayleigh 和 Walter Ritz 首创的想法，简单得有些出人意料。如果我们找不到精确解，那就猜一个。我们写下一个试验解，一个带有几个可调旋钮（参数）并且看起来可能是正确形状的数学函数。然后，我们运用最小势能原理。我们计算试验解的能量，并转动旋钮，直到找到我们的猜测所能达到的最低能量。结果并非精确解，但变分原理保证了它是在我们所选择的形状族中最好的近似解。

想象一个简单的、边缘固定的圆形板，就像鼓面一样，被一个分布压力推动。要找到每一点的精确挠度，需要解一个棘手的四阶微分方程。但是使用瑞利-里兹法，我们可以简单地猜测挠曲形状看起来像 $w(r) = c(1-r^2/a^2)^2$ ，这个猜测很巧妙地满足了固定的边界条件。唯一的未知数是振幅 $c$ 。通过将这个猜测代入板的总势能表达式（应变能减去载荷所做的功），并找到使之最小化的 $c$ 值，我们就能在完全不碰微分方程的情况下，得到中心挠度的一个极好的估计值。

这种能力伴随着责任。我们近似的质量完全取决于我们初始猜测的质量。计算机科学有句名言：“垃圾进，垃圾出。” 在这里同样适用。一个发人深省的结构稳定性问题完美地说明了这一点。如果我们尝试用物理上合理并满足边界条件的试验函数来寻找一个柱的屈曲载荷，我们会得到一系列可靠改进的近似值，并且保证总是偏于安全（即高于真实的屈曲载荷）。但如果我们选择一组“不完备”的函数——例如，如果我们试图用一组都与第一屈曲模态正交的函数来近似它——我们的计算将固执地收敛到错误的答案。此外，我们如何施加边界条件也至关重要。用“罚”方法弱施加边界条件有时会导致不安全的预测，即一个低于真实值的答案。变分法不是一个可以盲目转动的曲柄；它是一种精密仪器，需要对问题有深刻的物理理解才能得到回报。

在研究结构失稳之后会发生什么时，这一点尤其正确。使用同样的能量方法，我们可以探索梁的屈曲后行为。通过在能量泛函中引入几何非线性并使用瑞利-里兹近似，我们可以推导出压缩载荷与梁的侧向挠度之间的关系。这类模型一个引人入胜的方面是它们对初始假设的敏感性。重要的是要记住，预测结果（例如屈曲后承载能力是增加还是减少）关键取决于所选能量泛函中编码的物理模型——这有力地提醒我们，即使是最强大的数学工具，其好坏也取决于我们输入其中的物理内容。

宏大统一：一个原理统摄一切

也许变分原理最深刻的方面是它们的统一力量。同样的数学结构一次又一次地出现，将科学的织物缝合在一起。最惊人的例子是连接经典力学世界与奇异的量子力学领域的桥梁。

在1920年代，Erwin Schrödinger 提出了他著名的方程 $\hat{H}\psi = E\psi$ ，这是支配原子和分子行为的主方程。它告诉我们一个量子系统的允许能级（ $E$ ）。对于比氢原子更复杂的任何东西，解这个方程都极其困难。然而，事实证明，这也伪装成了一个变分问题！任何量子系统的基态能量——它可能拥有的最低能量——是一个称为瑞利商（Rayleigh quotient）的泛函的绝对最小值。寻找一个分子的基态在数学上等同于寻找最速降线曲线的形状。这种线性变分法是现代量子化学的绝对基石。化学家将波函数 $\psi$ 近似为简单原子轨道的组合，然后利用变分原理找到最佳组合，从而得到分子能量和结构的近似值。

这种使用简单函数来近似复杂现实，并由一个变分原理引导的思想，已经被自动化并武装到可能是这些思想最重要的实际成果中：有限元法（FEM）。有限元法的核心思想是，将一个复杂的对象——汽车底盘、涡轮叶片、一块演化中的材料——分解成一个由简单的小多面体组成的网格，即“有限元”。在每个单元内部，我们用一个非常简单的函数（例如，线性或二次多项式）来近似未知场（如位移或温度）。然后利用变分原理写出控制方程，不是一次性针对整个物体，而是以一种可以逐个单元应用的积分“弱形式”。由此生成一个巨大的代数方程组，由计算机求解，以找到遍及整个网格的最佳近似解。

这个统一的变分框架的强大之处在于，它允许我们构建物理世界惊人复杂的“数字孪生”，这些模型可以将多种物理过程编织成一个单一、连贯的整体。

一种金属合金在冷却时如何演化，形成复杂的微观结构？我们编写一个单一的自由能泛函，其中包含不同相的化学能和因原子不能完美契合而产生的弹性势能。然后，变分原理为我们提供了一组耦合方程，可以同时预测材料不断变化的成分及其内应力。
裂纹是如何在脆性材料中扩展的？这是一个涉及移动不连续面的臭名昭著的难题。相场法通过定义一个从0（完整）平滑过渡到1（断裂）的连续“损伤场”来解决这个问题。然后我们写一个 Ginzburg-Landau 型能量泛函，其中包括体弹性势能和产生“损伤”区域的能量成本。当这个泛函被最小化时，裂纹就会出现并生长，其路径和速度自然地从模拟中涌现出来，而全程无需明确追踪裂纹尖端。裂纹面的无应力特性不是一个强加的边界条件，而是完全损伤区域能量退化的一个涌现属性。

变分法的统一触角甚至可以跨越原子离散世界与工程力学连续世界之间的根本鸿沟。在像准连续介质（QC）方法这样的多尺度方法中，我们从一个基于离散原子晶格通过原子间势相互作用的能量描述开始。通过援引 Cauchy-Born 法则——其本身就是一个变分假设，即晶格根据连续介质变形进行局部变形——我们可以推导出连续介质能量密度的表达式。从那里，变分力学的标准规则允许我们直接从底层的原子模型推导出连续介质的量，如应力张量。这是一个深刻的联系，一座允许信息从纳米尺度传递到宏观尺度的数学桥梁。

从线上的小珠到分子的能量，从细胞的形状到结构的失效，我们都看到同一个宏伟的原理在发挥作用。它证明了物理世界深刻而微妙的统一性。驻值作用量原理及其在变分法中的众多衍生原理不仅仅是一些巧妙技巧的集合；在非常真实的意义上，它们是自然用以书写其定律的语言。通过学习这门语言，我们不仅能够描述世界，更有能力在其中进行预测、设计和创造。