最小能量原理

玻尔百科

核心要点

物理系统会自然地稳定在一个使其总势能最小化的稳定平衡状态，这是一个被称为变分原理的强大概念。
该原理的有效性取决于关键的数学条件，如超弹性和正定性，这些条件确保了唯一且稳定的最小能量状态的存在。
这种能量最小化方法是有限元法（FEM）等强大计算工具的基础，该方法通过寻找这种最优构型来解决复杂问题。
该原理的影响范围远超力学，为理解电磁学、断裂力学、人工智能以及信息热力学中的现象提供了一个统一的框架。

引言

在整个物理学中，一个优美而简单的思想反复出现：自然是“懒惰的”。从一束光选择最快的路径，到一个肥皂泡形成一个球体，物理系统倾向于稳定在一种能最小化某个量的构型上，这个量通常是能量。这不仅仅是一种诗意的奇想，它是变分原理的基础，一个强大的数学框架，它重构了物理定律。我们不再需要求解复杂的局部方程，而是可以寻找一个单一的全局构型，它代表了所有可能性中能量最低的状态。这种方法简化了问题的解决过程，并为我们理解世界为何如此运作提供了更深刻的见解。

本文探讨了最小能量原理，这是这些变分原理中最基本的一个。我们将首先深入探讨原理与机制，解析势能和余能的核心概念、确保该原理成立的对称性和凸性等数学条件，以及其失效的边界。随后，在应用与跨学科联系中，我们将见证该原理非凡的力量，看它如何提供一条统一的线索，连接起结构设计、电流动、材料断裂、计算机中的自然模拟，乃至信息本身的基本热力学成本。

原理与机制

在物理学的大部分领域中，贯穿着一个深刻而优美的思想：在某种意义上，自然是“懒惰的”。一束光从一点传播到另一点，会选择耗时最短的路径。一个肥皂泡在给定体积下，会把自己排列成一个球体以最小化其表面积。山顶上的一个球会滚到尽可能低的位置并停在那里。这个反复出现的主题——物理系统倾向于稳定在使某个量最小化的状态——并非偶然。它是宇宙的一个根深蒂固的原理，其数学表述为我们提供了一种极其强大和优雅的方式来理解世界。

这些被称为变分原理，它们将物理定律重构为一种全局性的探索，而不是一系列局部指令（比如“这个粒子在这里受到的力是这么大”）。这种探索旨在从所有可以想象的可能性中，找出那个使某个特定值（通常是能量）达到极值的特殊构型。

稳定性的形态

让我们回到山谷中的球。它的“稳定平衡”状态在最底部。这在数学上意味着什么？如果我们把球的引力势能作为其位置的函数绘制出来，山谷就是一条曲线。山谷的底部是斜率为零的点——能量函数的一阶导数为零。这是一个驻点；微小的推动不会立刻引起能量的巨大变化。

但仅仅是驻点还不足以保证稳定性。一个完美平衡在山顶上的球也处于驻点，但最轻微的一阵风就会让它滚下来。这是一种不稳定平衡。山谷和山顶的区别在于它们的曲率。山谷向上弯曲，像一个碗；而山顶则向下弯曲。对于一个稳定平衡，不仅能量的一阶导数必须为零，二阶导数还必须为正。这意味着能量函数必须处于一个局部最小值。

这个简单的思想具有惊人的普遍性。它不仅适用于山谷中的球，也适用于试图在表面张力影响下最小化其亥姆霍兹自由能的液体表面，并且，正如我们将看到的，它也适用于任何受载的弹性物体。一个稳定系统实际实现的物理状态，就是那个使其总能量最小化的状态。

两种能量的故事：势能与余能

当我们将这些思想应用于可变形物体时，比如承受交通重量的桥梁或被拉伸的橡皮筋，我们需要定义我们所说的“总能量”是什么。在固体力学中，有两种主要且优美对偶的方式来看待这个问题。

最小势能原理

第一种也是更直观的方法是基于物体的变形，或称位移。总势能，用希腊字母 $\Pi$ 表示，由两部分组成：

内部应变能 ( $U$ )：这是材料在被拉伸、压缩或扭曲时储存在内部的能量。它就像你拉动弹簧时感受到的弹性势能。对于线性弹性材料，这个能量是应变的一个正的二次函数，很像简单弹簧的能量是 $\frac{1}{2}kx^2$ 。
外加载荷的势 ( $V$ )：这代表了施加的力（如重力或压力）所做的功。关键在于，总势能定义为 $\Pi = U - V$ 。这个负号很重要；它意味着当外力做正功时（例如，重力将物体向下拉），系统的势能会减少。

最小势能原理指出，在物体所有可能的变形方式中，它实际变形的方式是使总势能 $\Pi$ 最小化的那一种。这将一个复杂的内力和应力问题，重新构建为一个寻找单一函数——位移场——以最小化单一数值的问题。

最小余能原理

第二种方法是“硬币的另一面”。如果我们不关注位移，而是专注于材料内部的力，即应力，会怎么样？这引导我们走向最小余能原理。

这个原理涉及到一种不同的能量，即余能，其泛函用 $\Pi^*$ 表示。细节更为抽象，但核心思想是考虑物体内部所有可能与外部施加载荷处于平衡状态的应力分布。从这众多可能性中，真实的物理应力分布是使总余能最小化的那一个。对于线性弹性材料，这个泛函主要由余应变能密度 $U^*$ 构成，它本身是应力的二次函数，由 $U^*(\boldsymbol{\sigma}) = \frac{1}{2}\boldsymbol{\sigma}:\mathbb{S}:\boldsymbol{\sigma}$ 给出，其中 $\mathbb{S}$ 是材料的柔度张量。

这两个原理，势能原理和余能原理，构成了一种优美的对偶性。一个处理位移，要求试验解满足几何条件；另一个处理应力，要求试验解满足力的条件。在适当的条件下，两者都导向同一个物理事实。

游戏规则：什么使一个场“容许”？

这些原理的一个关键部分是“所有可能的构型”这个概念。这个集合并非没有限制，它有规则。

对于最小势能原理，我们在运动学容许的位移场集合中进行搜索。“运动学”与运动和几何有关。一个位移场是运动学容许的，如果它足够光滑以具有明确定义的应变能，并且最重要的是，如果它满足任何规定的位移边界条件。如果一根梁的一端被螺栓固定在墙上，那么任何“容许”的变形都必须保持该端固定。

对于最小余能原理，我们在静力学容许的应力场集合中进行搜索。“静力学”与力和平衡有关。一个应力场是静力学容许的，如果它在每一点都与自身（内力平衡）以及与施加的外力和体力处于平衡状态。

这些容许性约束定义了寻找最小能量状态的“游戏规则”。

秘密成分：对称性与凸性

为什么这些优美的原理会起作用？它们又在何时起作用？答案在于两个基本属性，一个关乎材料本身，另一个关乎问题的数学结构。

对称性与势的存在：要使一个“能量势”存在，系统必须是保守的。在材料的背景下，这意味着将材料从状态A变形到状态B所做的功与路径无关。如果材料的本构张量具有一种称为主对称性（ $\mathbb{C}_{ijkl} = \mathbb{C}_{klij}$ ）的特定对称性，这个属性就能得到保证。具有此属性的材料被称为超弹性的。如果缺少这种对称性，就像在某些非保守的理论模型中一样，就无法定义单一的能量势，最小能量原理也就崩溃了。这种对称性的要求是深刻的；同样的原因，对于许多涉及对流的流体力学问题，由于其底层的数学算子不是对称的，最小化原理也不存在。
正定性与唯一的最小值：为了使驻点成为一个稳定、唯一的最小值，能量“山谷”必须在任何地方都像一个碗一样——它必须是严格凸的。对于线性弹性的二次能量泛函，如果刚度张量 $\mathbb{C}$ （对于势能）或柔度张量 $\mathbb{S}$ （对于余能）是正定的，这个属性就能得到保证。这个数学条件有一个直接的物理意义：它意味着材料对于任何变形（或应力）都会储存正能量，从而确保材料的稳定性。如果材料不是正定的，它就可能通过变形自发地释放能量，使其变得不稳定。当这个条件失效，张量仅为半正定时，可能导致非唯一的解，从而使该原理无法挑出那个唯一的真解。

当魔法失效时：原理的局限性

了解一个原理在哪里失效与知道它在哪里适用同样重要。优雅的最小能量原理世界有其边界。最重要的边界是弹性行为与非弹性行为之间的界限。

考虑弯曲一个回形针。如果你轻轻弯曲它，它会弹回——这是弹性的。如果你急剧弯曲它，它会保持弯曲——这是塑性。在塑性变形过程中，能量被永久损失，大部分以热的形式散失。系统不再是保守的。你采取的路径变得至关重要，并且没有一个单一的“势能”对应于最终的弯曲状态。因此，这些简单的、全局的最小能量原理不适用于塑性。问题变得远为复杂，需要增量的、依赖于历史的定律，并且通常涉及约束优化问题，而不是简单的无约束最小值搜索。

从优雅到应用：一个统一的视角

最小势能原理和最小余能原理不仅仅是对牛顿定律在可变形体上的优雅重述。它们代表了我们解决问题方式的范式转变。我们不必直接处理一个复杂的偏微分方程组，而是可以寻找一个单一的函数来最小化一个单一的标量：能量。

这个视角是现代工程和科学中最强大的工具之一——有限元法（FEM）的基石。在有限元法中，一个复杂的物体被分解成“有限数量”的简单单元。然后，计算机从一个庞大但有限的简单函数库中智能地“猜测”一个位移场（或应力场），并迭代地调整它，直到找到使整个系统达到最小能量状态的组合。存在一个唯一的最小值（得益于凸性）以及我们的近似值会随着函数库的丰富而越来越接近真解的保证，都是这些基本原理的直接结果。

因此，一个球滚到山谷底部的简单想法，在被形式化和推广之后，不仅为我们提供了对自然运作的深刻洞见，也为预测我们周围世界的行为提供了一个实用而强大的框架。它是物理学内在美和统一性的证明。

应用与跨学科联系

宇宙的运作方式有一种奇妙而懒散的优雅。如果你扔一个球，它不会走一条风景优美的路线；它会遵循一条非常具体的路径。如果你拉伸一根弹簧，它会以一种精确的方式储存能量。在大量的情况下，特别是那些已经稳定下来的情况，自然似乎找到了能量最低的构型。这不仅仅是一个诗意的观察；它是一个深刻而实用的工具，被称为最小能量原理。

在探讨了这一原理的机制之后，我们现在可以踏上一段旅程，看看它的影响范围有多广。你可能会感到惊讶。这一个想法提供了一条统一的线索，将桥梁的设计、电流的流动、材料的断裂、计算的前沿，甚至一个思想的热力学成本联系在一起。这是那种既因其简单而美丽，又因其应用而强大的罕见概念之一。

工程世界：结构、电路与最小努力

让我们从我们可以建造的东西开始。想象一位工程师正在设计一个简单的屋顶桁架。当一个重物——比如说，一堆雪——放在它的顶点时，桁架会轻微下陷。它下陷了多少？一种方法是费力地计算所有的力并解一个复杂的方程组。但有一种更优雅的方法。最小势能原理告诉我们，桁架会变形到刚好足以达到总能量最低的状态。这个总能量是两样东西的组合：储存在被拉伸和压缩的构件中的弹性应变能，以及重物向下移动时损失的势能。桁架最终的稳定形状是那个达到完美平衡，使这个组合能量泛函最小化的形状。通过将能量写成挠度的函数并用微积分求其最小值，工程师可以精确预测结构在载荷下的行为。实际上，结构本身就在解决一个优化问题。

同样的“懒散”也出现在电路中。考虑一股电流从一点流向另一点，通过两条电阻相同的平行电线。电流如何决定在它们之间分配？原则上，它可以将 $0.75$ 的电流通过一根电线，将 $0.25$ 通过另一根。但它没有。电流精确地对半分。为什么？因为我们原理的一个动态对应物，通常被称为Thomson原理，它指出电流将以最小化总能量耗散率（焦耳热）的方式分布。一个快速的计算表明，当电流均等分配时，以热的形式损失的总功率恰好是最小的。任何其他分布都会产生更多的废热。看来，自然不仅懒散，而且高效[@problem_-id:1299119]。

场的无形之舞：电磁学与流体

当我们从桁架和电阻器这样的离散物体转向连续、无形的场的世界时，这个原理才真正大放异彩。考虑一个平行板电容器，其中两块板保持在不同的电压下。它们之间空间的电场形状是什么？答案，你可能知道，是一个由拉普拉斯方程的解所描述的完美均匀场。但为什么是那个解？Thomson定理，即最小能量原理在静电学中的一个应用，给了我们更深层的原因：电场会自行排列，以便在给定的边界条件下，在两板之间的体积中储存最小的可能能量。

我们可以通过一个思想实验来证明这一点。想象一下真实的、线性的电势分布，并在其上添加一个小的、虚构的波动——比如说，一个正弦波。然后我们计算这个新的、波动的场中储存的总能量。我们发现，对于任何非零的波动，总能量都高于简单的直线解。回到最小能量状态——实际存在的状态——的唯一方法就是让波动消失。拉普拉斯方程的解不仅仅是一个数学上的奇特现象；它是自然选择的独特构型，因为它是能量上最有利的。

这种自组织原理延伸到流体的复杂舞蹈中。当两种不混合的不同液体，如油和水，在通道中一起流动时，它们会以一种特定的方式排列自己。如果它们由相同的压力梯度驱动，什么决定了它们之间界面的高度？答案再次是一个最小化原理。对于给定的流速，系统将采取使因粘性摩擦而产生的总能量耗散率最小化的构型。对于一个流体粘度和流速相等的对称情况，我们的直觉正确地猜测界面将恰好在中间——这个猜测通过最小化耗散泛函得到了证实。

物质的构造：从断裂点到设计材料

最小能量原理不仅支配着结构的响应方式；它还支配着构成结构的材料本身的构造。以断裂现象为例。为什么裂纹会扩展？著名的Griffith准则给出了答案，这是一个基于能量推理的杰作。只有当从大块材料中释放的弹性势能足以“支付”创建新裂纹表面所需的能量时，裂纹才会扩展。现代计算方法，如相场模型，已经完全接受了这个思想。它们将裂纹建模为一条弥散的损伤带，而不是一条清晰的线，而这个损伤场的演化由一个总势能的最小化所支配，该势能既包括体弹性势能，也包括一个代表断裂能的项。裂纹的扩展仅仅是系统寻求一个新的、能量更低的状态，即使那个状态是一个破碎的状态[@problem_-id:2668008]。

这个原理也为我们提供了强大的工具来理解和设计新材料。考虑一种复合材料，由两种不同相的随机混合物制成，比如聚合物与玻璃纤维混合。它的整体性能，如热导率，取决于其复杂的微观结构细节，而我们可能并不知道这些细节。我们能说些什么有用的东西吗？可以。植根于能量最小化的Hashin-Shtrikman变分原理，允许我们仅使用组成相的属性和体积分数，来计算复合材料有效性能的严格上限和下限。这些界限非常有价值，因为无论具体的微观排列如何，它们都是成立的。同样的想法也是“结构超材料”均匀化理论的基石，其中复杂周期性晶格的宏观性能是通过在单个重复晶胞上解决一个能量最小化问题来确定的。

数字领域：模拟自然与人工智能的兴起

如果自然利用能量最小化来找到其平衡状态，那么我们在模拟自然时也应该这样做。这正是现代工程的主力工具——有限元法（FEM）的基础。在有限元法中，我们用一组定义在小“单元”上的简单函数来近似连续的位移场。然后通过最小化系统的总势能来找到这些函数的未知系数。

这个视角为我们改进模拟提供了一条清晰的路径。例如，简单的矩形单元在模拟弯曲时表现得非常差。为什么？因为它们有限的数学形式迫使它们进入高能量、非物理的剪切应变状态，从而人为地使模型变硬。解决方案？我们可以通过添加额外的“不协调模式”——存在于单元内部的特殊函数——来丰富单元的描述能力。通过为系统提供更多的自由度，我们扩展了它可以探索的可能构型空间。在寻找最小能量的过程中，它现在可以找到一个能量更低的状态，这个状态是对现实更好的近似，从而有效地解决了人为刚度的问题。

这种对物理原理的直接运用现在正在推动一场科学机器学习的革命。在一种被称为物理信息神经网络（PINNs）的激动人心的新方法中，神经网络被用作一个高度灵活的函数来近似物理问题的解。如何训练这样一个网络？与其仅仅给它看数据，你可以要求它直接最小化系统的势能。能量泛函本身成为人工智能的“损失函数”。对于一个超弹性体，我们可以通过要求网络找到最小化总势能离散化版本的参数来训练它找到位移场。这种方法优雅地将深度学习的描述能力与物理学的基本定律结合起来。然而，一个迷人的微妙之处出现了：虽然原始的能量泛函可能是凸的（在所有可能函数的空间中只有一个唯一的最小值），但网络参数对应的损失景观却是极其非凸的。这意味着，虽然自然毫不费力地找到真正的最小值，但我们的优化算法可能会陷入一个虚假的局部最小值——这是物理学和人工智能交叉领域一个深刻而持续的挑战。

终极联系：信息、热力学与生命

这个指导着恒星和钢铁的原理，是否也能告诉我们一些关于抽象信息世界的事情？答案是响亮的“是”，它引出了现代科学中最深刻的思想之一。

考虑一个存储器中的一位信息，模型化为一个被隔板分开的盒子里的粒子。如果粒子在左边，该位是'0'；在右边，它是'1'。 “擦除”该位的行为意味着将其重置为一个已知状态，比如'0'，无论其初始状态如何。一个巧妙的热力学循环可以实现这一点：首先，移除隔板（随着其状态变得更加不确定，系统的熵增加），然后等温地将气体压缩到盒子的'0'侧。在这次压缩过程中，必须对系统做功，并且为了保持温度恒定，必须向环境中排出一定量的热量。一个完整的分析表明，在这个擦除一位信息的不可逆过程中耗散的最小热量恰好是 $Q_{dissipated} = k_B T \ln 2$ 。这就是Landauer原理。它在信息和热力学之间建立了一个基本的、不可打破的联系：信息是物理的，操纵它有不可避免的能量成本。

这种联系开启了惊人的跨学科可能性。这种信息处理的基本成本是否可能是进化中的一个驱动力？我们可以构建一个模型来比较像水母那样的弥散神经网与一个中心化大脑的热力学效率。一个弥散网络可能需要许多神经元参与“共识”来处理一位信息，每个神经元在此过程中都会擦除内部的位。而一个中心化系统，另一方面，可能会使用专门的层次进行感觉过滤和决策，可能用不同总数的位擦除达到相同的结果。通过将Landauer原理应用于这两个模型，我们可以就头颅化（头部进化）的能量优势提出一个定量的假说。

从桥梁的稳定性到算法的结构，从河流的流动到思想的成本，最小能量原理作为一个深刻而统一的真理浮现出来。它证明了自然法则不仅仅是一套任意的规则，而是一个潜在的、优雅的、并且美丽高效的秩序的体现。