哈密顿原理

玻尔百科

定义

哈密顿原理是经典力学和场论中的一个核心原理，它指出物理系统会沿着作用量（拉格朗日量随时间的积分）保持平稳的路径演化。这一全局性原理能够推导出各种系统的局部运动方程，并为广义相对论等现代物理理论以及数值模拟方法奠定了基础。虽然该原理的纯粹形式主要适用于保守系统，但通过虚拟功原理的扩展，其基本思想也可以应用于包含摩擦力等非保守力的分析。

核心要点

哈密顿原理指出，物理系统会沿着作用量为驻值的路径演化，其中作用量是拉格朗日量（动能减去势能）对时间的积分。
这单一的全局性原理可以为经典力学和场论中的众多系统推导出局部的、瞬时的运动方程（如牛顿定律）。
该原理的纯粹形式仅限于保守系统；要将其扩展以包含摩擦力等非保守力，则需要借助更具普适性的虚功原理。
该原理的影响力超越了理论范畴，为稳健的计算模拟方法奠定了基础，并为广义相对论等现代理论提供了基石。

引言

一个系统从一点运动到另一点，在所有可能的路径中，为何只选择其中一条特定的路径？哈密顿原理为此提供了一个极为优雅的答案：大自然是节俭的。它假定，系统所走的真实路径是使一个称为“作用量”的物理量取驻值的路径。这种从局部的、因果式的力的观点，转变为全局地寻找最有效轨迹的视角，代表了整个物理学中最强大、最统一的思想之一。它不是通过询问“下一步会发生什么？”来解决运动的基本问题，而是通过确定连接已知起点和已知终点的整个运动历史来解决问题。本文将深入探讨理论物理学的这一基石。第一部分“原理与机制”将解析驻定作用量的核心概念、通过拉格朗日量进行的数学表述、其与牛顿定律的关系，同时也会探讨其局限性。随后，“应用与跨学科联系”部分将展示该原理的巨大威力，说明它如何支配着从行星轨道、振动弦到时空结构本身以及现代计算模拟架构的一切事物。

原理与机制

宇宙级的“懒惰”

想象一下你向朋友扔一个球。它在空中划出一道优美的弧线。在球可能走过的无数条路径中——疯狂的Z字形、过山车式的回环、或者先直线落地再弹起——为什么它偏偏选择了那条特定的抛物线？18至19世纪的物理学家，特别是 William Rowan Hamilton，偶然发现了一个极其优雅且强大的视角来回答这个问题。其核心思想是，大自然极其“懒惰”。它不一定选择最短的路径或最快的路径，而是选择最小作用量——或者更准确地说，驻定作用量的路径。

这个被称为作用量的神秘物理量是什么？它不是能量，也不是时间，而是两者的奇妙组合。对于系统可能采取的任何路径，我们都可以计算出一个数字，即作用量，用符号 $S$ 表示。为此，我们首先需要一个称为拉格朗日量 $L$ 的物理量。对于大多数简单系统，拉格朗日量是两种我们熟悉的能量形式之差：动能 $T$ （运动的能量）和势能 $U$ （由位形决定的储存能量，如拉伸的弹簧或在高处被引力场作用的岩石中的能量）。

$L = T - U$

作用量 $S$ 则是在从起始时间 $t_0$ 到结束时间 $t_1$ 的整个过程中累积的总拉格朗日量。用数学语言来说，它是一个积分：

$S = \int_{t_0}^{t_1} L \, dt = \int_{t_0}^{t_1} (T - U) \, dt$

然后，哈密顿原理做出了一个惊人的宣告：大自然实际遵循的路径，是使这个作用量 $S$ 为驻值的路径。 “驻值”是什么意思？想象一个由所有可能路径构成的景观。真实路径位于这个景观中的一个“平坦”点上——它可能是一个谷底，一个山峰，或者更常见的是一个鞍点，就像山隘的中心。如果你将真实路径进行微小的“扭动”，使其变为一条邻近的、假设的路径，那么作用量的变化在一阶上为零。我们用一个优雅简洁的公式来表达这个深刻的论断：

$\delta S = 0$

这一个简单的方程，作为变分法的“前哨”，掌握着揭示从摆动的单摆到行星轨道的万物运动定律的关键。

微妙之美：驻定，而非最小

其历史名称“最小作用量原理”其实有点用词不当，并容易引起混淆。虽然作用量有时确实是最小的，但并非总是如此。真正的条件是作用量为驻定。这是一个关键的区别，它将随时间演化的路径的动态世界与静态的平衡世界分离开来。

考虑一个在碗里滚动的球。它最终会停在碗底。在那个点，它的引力势能处于一个真正的最小值。这是一个最小原理。物理学中的许多静态或平衡问题，如肥皂膜的形状或冷却结构的最终状态，都由某种形式的能量最小化来决定。

哈密顿原理则不同。它支配的是整个轨迹，即系统运动的历史。它找到的路径不一定是作用量景观中的“最低点”，而只是在该点上“平坦”的一条路径。将作用量路径想象成一个鞍点通常更为准确。这似乎是一个微小的数学细节，但它却是动力学深层结构的核心。它使我们从简单地寻找最小值，转向在所有可能历史构成的空间中，寻找一个更为微妙和强大的平衡点。

游戏规则：固定端点

在应用哈密顿原理时，有一条至关重要的规则：我们必须指定系统在起始时间 $t_0$ 和结束时间 $t_1$ 的位形。它不是一个根据初始状态预测未来的原理，而是一个寻找连接已知起点和已知终点的唯一路径的原理。

为何有此奇怪的要求？这不是一个随意的怪癖，而是使整个机制得以运作的数学必然。为了找到作用量为驻值的路径，我们必须观察当我们改变路径时会发生什么。当我们进行这种变分时，涉及动能的项 $\int \delta T \, dt$ 需要一个称为分部积分的数学技巧。这个技巧是揭示动力学的关键，但它会留下一些在时间边界 $t_0$ 和 $t_1$ 处取值的剩余项。

为了分离出在整个路径期间都必须成立的运动方程，这些边界项就成了麻烦。那么，我们如何摆脱它们呢？我们只需声明它们为零！我们通过约定只比较那些起点和终点位形完全相同的路径来实现这一点。如果我们比较的所有路径的两端都被固定住，那么它们之间的任何“扭动”或变分在这些端点处都必须为零。这使得讨厌的边界项消失，从而让真正的运动定律从积分中浮现出来。这听起来可能像是在作弊，但它是一个特性，而非一个缺陷。它定义了我们正在解决的问题：在所有连接 A点（在时间 $t_0$ ）和 B点（在时间 $t_1$ ）的路径中，系统究竟会选择哪一条？

从作用量到牛顿：定律的展开

哈密顿原理真正的魔力在于，这个关于路径经济性的单一、抽象的陈述，其内部蕴含了整个经典力学。让我们简要说明一下 $\delta S = 0$ 如何导出牛顿著名的第二定律 $\mathbf{F} = m\mathbf{a}$ 。

变分陈述是 $\int_{t_0}^{t_1} (\delta T - \delta U) \, dt = 0$ 。

我们来看这两个部分。动能部分，在进行关键的分部积分并利用端点处变分为零的事实后，变成了一个形如 $-\int m\ddot{x} \cdot \delta x \, dt$ 的项。这是质量乘以加速度，即“惯性力”。

势能部分 $\delta U$ 与力有关。回想一下，保守力是势能的负梯度（最陡下降方向）， $\mathbf{F} = -\nabla U$ 。因此，变分 $-\delta U$ 变成了一个形如 $\mathbf{F} \cdot \delta x$ 的项。

将这些代回作用量原理，我们得到：

$\int_{t_0}^{t_1} (-m \ddot{\mathbf{u}} \cdot \delta \mathbf{u} + \mathbf{F} \cdot \delta \mathbf{u}) \, dt = 0 \quad \text{或者，更熟悉的形式} \quad \int_{t_0}^{t_1} (\mathbf{F} - m\mathbf{a}) \cdot \delta \mathbf{u} \, dt = 0$

（这里，我们用 $\mathbf{u}$ 表示位移，并从质量 $m$ 切换，以暗示更复杂的系统，但对单个粒子而言思想是相同的）。由于这个方程必须对端点之间的任何任意微扰 $\delta \mathbf{u}$ 都成立，要使积分为零，唯一的途径就是括号内的项在所有时刻本身都为零。于是，就像从帽子里变出兔子一样，我们得出了牛顿第二定律：

$\mathbf{F} = m\mathbf{a}$

这是一个惊人的结果。牛顿定律将运动描述为瞬时的、局部的因果关系。哈密顿原理则从全局上重新表述了物理学，将其视为在整个时间区间内寻找最经济路径的过程。这两种截然不同的视角能够导出完全相同的物理规律，揭示了宇宙结构中深刻而美丽的统一性。

超越完美世界：摩擦力、随动力与虚功

哈密顿原理的纯粹形式，及其优雅的拉格朗日量 $L=T-U$ ，有一个致命弱点：它只适用于保守系统。它要求所有力都能从一个势能函数 $U$ 推导出来。那么，像摩擦力或空气阻力这些以热量形式耗散能量的、我们所熟悉的现实世界中的力呢？又或者像火箭推力这种更为奇特的非保守力——即使火箭在太空中翻滚，推力也始终沿着其自身轴线（一种“随动力”）？这些力不储存能量，因此无法用势函数 $U$ 来表示。

对于这些混乱的现实场景，单一驻定作用量的优美经济性便不再适用。为了解决这个问题，我们必须求助于一个更古老、甚至更普遍的思想：虚功原理，或其动力学对应物——达朗贝尔原理。

我们不再试图将所有力都塞进一个势函数中，而是将非保守力分开处理。我们通过它们的虚功 $\delta W_{nc}$ 将其效应加入到变分原理中。虚功是指这些力在一次无穷小的虚位移中所做的功。修正后的或称广义的哈密顿原理表述为：

$\delta S + \int_{t_0}^{t_1} \delta W_{nc} \, dt = 0$

这个方程表明，驻定作用量的路径现在受到了存在的任何非保守力的虚功的扰动。对于像空气阻力这样的简单阻尼力，它与速度成正比 ( $f_d = -b \dot{y}$ )，其虚功的积分是 $\int_{t_0}^{t_1} (-b \dot{y}) \delta y \, dt$ 。当我们把这个修正后的原理代入数学推导中，它能正确地得出包含所有力的牛顿第二定律： $m\mathbf{a} = \mathbf{F}_{\text{conservative}} + \mathbf{F}_{\text{non-conservative}}$ 。这个广义原理或许在美学上不那么纯粹，但其普适性和威力是不可否认的。它表明，在某种意义上，虚功的概念甚至比作用量原理本身更为基本。

正确的视角：跟随物质

当我们从简单的粒子转向复杂的变形体，如扭曲的金属梁或被压扁的橡胶块时，坐标系的选择变得至关重要。我们有两个主要视角：

欧拉描述：你站在桥上观察河流。你描述的是你下方空间固定点的水流速度。这是欧拉视角。
拉格朗日描述：你将一只橡皮鸭放入河中，并追踪它顺流而下的具体旅程。这是拉格朗日视角，或称物质视角。

对于哈密顿原理而言，这个选择至关重要。想象一下试图计算一个变形橡胶块的总动能。在欧拉视角下，你必须对物体当前变化的形状进行积分。积分的边界本身就在运动！对一个积分域本身也在变化的积分进行“变分”，是一场数学噩梦，会产生额外的项和与运动边界相关的复杂问题。

但在拉格朗日描述中，我们将坐标系与物质本身绑定。我们描述的是每一个物质质点的运动，而这些质点最初位于物体原始的、未变形的形状中。这意味着在计算作用量时，我们的积分域始终是这个固定的、不变的参考形状。变分算子和积分算子可以毫无问题地互换顺序。这种视角的选择将一个极其复杂的问题转变为一个可控的、且常常是优美的简单问题。正是出于这个深刻的实践原因，固体力学中的哈密顿原理几乎总是用拉格朗日框架来表述，即跟随物质的运动轨迹。

原理的局限性

在经典力学中，是否有任何问题能逃脱这个强大框架的掌控？有那么几个，它们揭示了我们原理最深层的假设。最著名的例子涉及非完整约束——这个拗口的术语指的是那些无法简化为位置约束的速度约束。

教科书中的例子是在桌面上无滑滚动的溜冰鞋或球。它可以到达桌面上的任何位置和朝向，所以它的位置不受约束。然而，在任何给定的瞬间，它的速度是受约束的：与桌面的接触点必须具有零速度。如果你天真地试图将哈密顿原理应用于这个系统，即使动用拉格朗日乘子法的全部威力，你也会得到错误的运动方程！。

原因很微妙，与“容许”变分的性质有关。作为基石的达朗贝尔虚功原理，如果应用得当，则可以完美地处理这些情况。这向我们表明，尽管哈密顿驻定作用量原理优美而强大，但它只是力学中一个更深层次真理——虚功原理——的一个引人注目且非常实用的推论。从 Newton 到 Lagrange 和 Hamilton，理解运动的探索之旅，就是一个不断寻找更优雅、更统一视角的故事，每一个新视角都揭示了宇宙精妙而美丽逻辑的新层次。

应用与跨学科联系

在熟悉了哈密顿原理的机制之后，我们现在准备见证其真正的威力。我们即将踏上一段旅程，从我们熟悉的、如钟表般精确的宇宙，走向时空结构本身和现代计算的数字核心。你看，驻定作用量原理不仅仅是对牛顿定律的巧妙重述。它是贯穿几乎所有物理学的一条金线，是一个如此深刻普适而优雅的论断，以至于其全部内涵至今仍在探索之中。它将我们的问题从“现在有什么力在作用？”转变为“整个旅程最经济的路径是什么？” 从这一视角转变中涌现出的答案，简直令人叹为观止。

经典力学的交响曲

让我们从熟悉的领域开始。在上一章中，我们看到了如何为简单系统推导运动方程。但当情况变得复杂时会怎样？想象一个由重物和弹簧组成的系统，比如两个质量块通过三个不同的弹簧连接到墙壁和彼此 ()。如果使用牛顿定律，你必须为每个质量块画受力分析图，一丝不苟地追踪所有的力——拉伸、压缩、推、拉——并希望没有弄错任何一个正负号。这简直是自寻烦恼。

哈密顿原理则提供了一种更从容的方法。你根本不需要考虑力。你只需写下两个数字：运动物体的总动能 $T$ 和储存在拉伸或压缩弹簧中的总势能 $V$ 。拉格朗日量 $L = T-V$ 包含了所有信息。然后，最小作用量原理就变成了一台几乎可以自动运转的机器。它会把完美形式的运动方程送到你的面前，就像放在银盘上一样。事实上，它甚至能直接将你从拉格朗日表述带到哈密顿力学的强大相空间视角，从而统一了经典物理学的这两大支柱。

当我们将系统置于不寻常的环境中时，该原理的优雅之处才真正显现出来。考虑一个单摆，它不是悬挂在固定的天花板上，而是悬挂在一辆加速行驶的火车车厢内 ()。牛顿分析法会要求我们引入非惯性“赝力”，这个概念有时会让人觉得有些刻意。然而，拉格朗日方法则能优雅地处理这种情况。我们只需写下火车上的观察者所看到的动能和势能，并在势能中加入一项来解释火车的加速度。该原理不作评判；它只是接受你给出的能量，然后返回正确的运动方程。其底层规则保持不变，展现出一种优美的稳健性。

这种化繁为简的能力在具有耦合运动的系统中最为明显，比如弹性摆——一个弹簧上的质量块，它既能来回摆动，又能上下振动 ()。径向（弹簧）运动和角向（摆动）运动以一种令人眼花缭乱的方式相互影响。一个方向上的力取决于另一个方向上的位置和速度。但能量却很简单：一部分是径向运动的动能，一部分是角向运动的动能，一部分是弹簧的势能，一部分是重力的势能。一旦你有了这些，哈密顿原理就会机械地分离变量，并提供两个耦合方程来支配整个复杂的行为。它就像一位总指挥，为管弦乐队的每个部分下达恰当的指令，从而奏出一曲和谐的交响乐。

从粒子到场：连续世界

到目前为止，我们讨论的都是离散物体——质点、单摆。但是对于连续物体，比如吉他弦、鼓面或钢梁，情况又如何呢？这些是具有无限自由度的系统。弦上的每一点都可以移动。我们的原理在这里肯定会失效吧？

恰恰相反，这正是它实现惊人飞跃的地方。我们不再使用拉格朗日量，而是定义一个拉格朗日密度 $\mathcal{L}$ ，它代表单位长度（或面积、或体积）的能量。作用量就变成了这个密度在整个空间和时间上的积分。将哈密顿原理应用于这个由“物质”构成的场，得到的不是常微分方程，而是偏微分方程——这正是波和连续介质的语言。

考虑一根在恒定张力 $T$ 下、具有非均匀质量密度 $\mu(x)$ 的振动弦 ()。动能密度很简单：它取决于每个小段的运动速度，即 $\left(\frac{\partial y}{\partial t}\right)^2$ 。势能密度储存在弦的拉伸中，对于小振动，它取决于局部斜率，即 $\left(\frac{\partial y}{\partial x}\right)^2$ 。将得到的拉格朗日密度代入变分法的机器中，著名的波动方程便应运而生： $\mu(x) \frac{\partial^2 y}{\partial t^2} = T \frac{\partial^2 y}{\partial x^2}$ 。支配行星轨道的同一原理，现在也支配着波的传播。

这是一个深刻的统一。同样的框架可以扩展到远为复杂的场景。以弹性梁的弯曲和振动为例，这是土木与机械工程的基石 ()。现在的势能不再取决于斜率，而是取决于梁的曲率。当我们应用哈密顿原理时，奇妙的事情发生了。它不仅得出了支配梁运动的四阶偏微分方程，还自动生成了边界条件。它告诉你固定端必须满足什么条件（位移和斜率为零），以及自由端必须满足什么条件（弯矩和剪力为零）。这个原理理解了整个系统（包括边界）的物理。

其范围甚至更广。在适当的假设下，人们可以为一个理想流体构建拉格朗日量，并从最小作用量原理推导出流体动力学的欧拉方程 ()。水和空气的流动，在其最基本的层面上，可以被看作是在时空中寻求一条最优路径的过程。

通往数字世界的桥梁：计算与模拟

在这里，故事发生了一个有趣的转折，将这个抽象的19世纪原理与21世纪技术的硅谷核心联系起来。当工程师和物理学家模拟复杂的动力系统时——从轨道卫星到振动分子——他们通常使用计算机一步步求解运动方程。标准方法的一个常见问题是，微小的误差会随时间累积，导致像系统总能量这样的基本物理量发生漂移，从而在长期模拟中得出完全不符合物理规律的结果。

哈密顿原理提供了一个革命性的解决方案。与其先推导出连续的运动方程，然后再为计算机进行离散化，不如我们先对作用量本身进行离散化？

这就是变分积分器背后的核心思想 ()。我们将作用量积分近似为对微小时间步长的求和。然后，我们将驻定作用量原理应用于这个离散的和。结果是一个数值更新规则，由于其构造方式，它继承了原始拉格朗日力学的深层几何结构。这些算法表现出非凡的长期保真度。它们并不能完美地守恒能量，但能量误差会保持在有界范围内，围绕真实值振荡，而不会漂移。它们尊重物理世界的基本对称性，因为它们诞生于同一个变分种子。

变分原理与数值方法之间的这种深刻联系是普遍存在的。有限元法 (FEM) 是一个强大的工具，在整个工程领域被广泛用于模拟从桥梁应力到汽车气流的各种问题。事实证明，有限元法中使用的许多基本时间步进格式，如中心差分法，都可以通过构造一个离散的拉格朗日量并应用离散形式的哈密顿原理来严格推导出来 ()。这个原理不仅仅是理论物理学家的工具，它也是构建稳健可靠计算引擎的强大工具。

终极舞台：时空与基本定律

我们现在来到了宏大的终章。我们已经看到该原理支配着粒子、波、流体的运动，甚至指导我们的计算机模拟。但它还能走得更远吗？它能描述所有这些戏剧上演的舞台本身——宇宙本身吗？答案是响亮的“是”。

1915年，David Hilbert 与 Albert Einstein 同期独立地证明了广义相对论的定律可以从一个作用量原理推导出来。爱因斯坦-希尔伯特作用量在某种意义上是优美而简单的 ()。其拉格朗日密度本质上就是时空的标量曲率 $R$ ，它是衡量宇宙几何内蕴弯曲程度的量。

想一想这意味着什么。我们将时空几何本身——由度规张量 $g_{\mu\nu}$ 编码——视为待变分的场。我们问：在所有可能的弯曲时空中，哪一个能使总作用量取驻值？变分法给出的答案，正是爱因斯坦的场方程。

$R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R + \Lambda g_{\mu\nu} = 0$

（在真空中，可能带有宇宙学常数 $\Lambda$ ）。这个方程描述了在没有物质的情况下时空如何自我弯曲。当包含物质时，该原理仍然成立，并导出支配物质与几何之间动态相互作用的完整方程。找到抛物运动轨迹的同一原理，也决定了黑洞的几何形状和宇宙的膨胀。

从单摆到宇宙，哈密顿驻定作用量原理揭示了自然法则中深刻而优雅的统一性。它表明，我们观察到的各种现象，都只是一个强大指令的不同表现形式：在所有可能性的空间中所选择的路径，在某种深刻的意义上，是最经济的那一条。它是支撑我们物理现实的基本数学之美的低语。