try ai
科普
编辑
分享
反馈
  • 力学中的变分原理

力学中的变分原理

SciencePedia玻尔百科
核心要点
  • 变分原理指出,物理系统的演化路径会使一个称为“作用量”的特定物理量保持驻定。
  • 变分法提供了数学工具,可将此全局优化原理转化为局域微分方程,例如欧拉-拉格朗日方程。
  • 这些原理催生了强大的近似技术,如瑞利-里兹法,该方法通过最小化能量泛函来求解复杂问题。
  • 该框架具有普适性,将工程学、材料科学、断裂力学、量子化学和生物物理学中的概念统一在一个优雅的思想之下。

引言

在对运动和力的研究中,存在两种截然不同的视角。第一种视角植根于 Isaac Newton 的工作,它瞬时地描述世界,即某一瞬间的力导致下一瞬间的加速度。这是一种对现实的局域、分步描述。然而,还有第二种更具整体性的观点,它提出了一个不同的问题:在一个系统从起点到终点的所有可能路径中,它实际选择的是哪一条?答案存在于优雅而深刻的变分原理世界中。变分原理提出,自然是经济的,总是选择一条“最小阻力”或“驻定作用量”的路径。本文旨在填补人们所熟知的基于力的力学与这一强大的、统一的优化框架之间的知识鸿沟。它将引导您了解定义这种方法的核心概念,并展示其惊人广泛的适用性。在接下来的章节中,我们将首先探讨构成这一思想的数学和概念基础的“原理与机制”。然后,我们将踏上探索其多样化“应用与跨学科联系”的旅程,揭示这一单一原理如何为工程学、材料科学乃至量子生物学中的问题提供一把万能钥匙。

原理与机制

想象你正站在山顶,想要到达下面山谷中的某一点。你可以采取无数条路径。有些蜿蜒漫长;有些陡峭直接。但如果你只是放开一个球让它滚下去,它会遵循一条非常特定的路径。为什么是那一条?一个简单的答案是“重力”。一位遵循 Isaac Newton 传统的物理学家会描述在每一瞬间作用在球上的力——向下的引力和山坡向上的支持力——并一步步计算出其轨迹。这是一种“局域”的观点,基于从一个瞬间到下一个瞬间的因果关系。

但是,还有一种完全不同、更为深刻和优美的方式来看待这个问题。我们可以说,球遵循的路径在某种意义上是最“经济”的。这正是​​变分原理​​的核心。我们不再关注每一瞬间的力,而是采取一种全局的视角。我们着眼于从起点到终点的整个旅程,并提出大自然有一条规则,用以从所有可能性中挑选出最佳的那一个。这种思维方式彻底改变了物理学,揭示了一种隐藏的统一性,它从光线的路径一直延伸到物质的结构本身。

“如果”的微积分——泛函与变分

要讨论“最佳”路径,我们首先需要一种方法来为每条可能的路径赋予一个单一的数值——可以说是得分。这就是​​泛函​​的工作。普通函数,如 f(x)=x2f(x) = x^2f(x)=x2,接受一个数(xxx)并返回一个数(x2x^2x2)。泛函则更进一步:它接受一整个函数(例如描述路径的曲线 y(x)y(x)y(x))并返回一个单一的数值。

例如,一个简单的泛函是计算两点 (x1,y1)(x_1, y_1)(x1​,y1​) 和 (x2,y2)(x_2, y_2)(x2​,y2​) 之间路径 y(x)y(x)y(x) 总长度的泛函。输入是整条路径,输出是其长度 L=∫x1x21+(y′(x))2dxL = \int_{x_1}^{x_2} \sqrt{1 + (y'(x))^2} dxL=∫x1​x2​​1+(y′(x))2​dx。“最小作用量”的舞台充满了这样的泛函。我们可能感兴趣的是一根变形梁的总势能、光线穿过不同介质所需的时间,或者电子量子态的能量。在每一种情况下,泛函都将一个形状或路径归结为我们想要最小化或更一般地使其​​驻定​​的单个量。

我们如何找到使泛函驻定的函数?我们借鉴了标准微积分中的一个绝妙思想。要找到一个普通函数的最小值,你需要找到其导数为零的地方——即斜率为平坦的点。我们对泛函也做同样的事情。想象我们已经有了真实的、“最佳”的路径。现在,考虑一条略有不同的、“如果”路径——一个偏离真实路径的微小​​变分​​或“扭动”。如果我们原来的路径确实是最小值(或最大值、或鞍点),那么这样微小的扭动至少在一阶近似上不应改变泛函的值。

这个单一的要求——泛函的​​一阶变分​​必须为零——是一个极其强大的约束。当我们应用这个数学条件时,就会得到一个被称为​​欧拉-拉格朗日方程​​的微分方程。这个方程就是最优函数必须遵守的定律。本质上,寻找驻定路径这一全局条件催生了支配系统行为的局域微分方程。我们在寻找物理场的最低能量构型时就能看到这套强大机制的作用。通过在约束条件下最小化能量泛函,欧拉-拉格朗日方程便应运而生,决定了场的形状,就像振动的弦找到其基频模式一样。

最小作用量原理:T与V的交响曲

最优雅、最深远的变分原理之一是​​哈密顿驻定作用量原理​​,通常被诗意地称为“最小作用量原理”。它指出,对于一个在给定时间内从起始构型运动到终止构型的力学系统,其所采取的实际路径是使​​作用量​​驻定的那一条。作用量,用 SSS 表示,是一个称为​​拉格朗日量​​ LLL 的奇特物理量的时间积分,而拉格朗日量就是动能(TTT)减去势能(VVV):

S=∫t1t2L(q,q˙,t) dt=∫t1t2(T−V) dtS = \int_{t_1}^{t_2} L(q, \dot{q}, t) \, dt = \int_{t_1}^{t_2} (T - V) \, dtS=∫t1​t2​​L(q,q˙​,t)dt=∫t1​t2​​(T−V)dt

乍一看,这很奇怪。为什么是动能减去势能?一种直观的理解方式是,大自然以一种聪明的方式偷懒。系统在快速运动(高 TTT)和处于低能量位置(低 VVV)之间进行权衡。所采取的路径是一种妥协,是整个旅程中这两种相互竞争的趋势之间的完美平衡。这个原理不仅仅是一个哲学上的奇思妙想;它可以直接从更“粗暴”的牛顿定律推导出来,正如从达朗贝尔原理到哈密顿原理的转换所示。但作为一个出发点,它要强大得多。一个单一的标量方程 δS=0\delta S = 0δS=0 就可以取代一整套矢量运动方程。

必须注意“驻定”这个词,而不一定是“最小”。对于非常短时间内的路径,作用量确实是最小化的。但对于更长的路径,真实的轨迹可能使作用量成为一个鞍点。在所有可能路径的空间中,该路径的“斜率”为零,但它可能在某些方向向上弯曲,在另一些方向向下弯曲。这种​​最小原理​​和​​驻定原理​​之间的区别是根本性的。静力平衡问题,如一条在自重下悬挂的链子,确实寻求最小化其势能。而由哈密顿原理支配的动力学系统,只寻求使作用量驻定。

从抽象原理到具体现实

变分原理的美妙之处不仅在于其优雅,还在于其巨大的实用价值。它们为寻找精确解和近似解都提供了一条直接的途径。

平衡与瑞利-里兹法

对于静态问题,原理得到了极大的简化:一个处于稳定平衡的系统会自行调整以​​最小化其总势能​​。肥皂膜会形成一个极小曲面以减小其表面张力能;一根重型缆绳会呈现悬链线形状以最小化其引力势能。

但如果由此产生的欧拉-拉格朗日方程难以精确求解怎么办?这时​​瑞利-里兹法​​就派上用场了。变分原理为我们提供了一个绝佳的近似工具。其核心思想是:我们知道真实解具有最低的可能能量。因此,我们能想到的任何其他形状都将具有更高的能量。

所以,我们用一组“试函数”来猜测解的形状。对于一根振动的弦,我们可能会猜测一个抛物线或一个简单的正弦波。然后我们计算我们猜测形状的能量泛函。原理保证了这个能量是真实基态能量的一个上界。最后一步是调整我们的猜测——例如,通过取几个试函数的组合——来找到那个能给出最低可能能量的猜测。这给了我们一个通常与真实答案惊人接近的近似值。关键在于选择的试函数不仅要是一个合理的猜测,还要满足问题的本质边界条件或几何边界条件——例如,一根被夹紧的梁在其端点必须同时具有零位移和零斜率,我们的试函数必须从一开始就反映出这一点。

对偶性的力量与余能

变分原理也揭示了深刻的对偶性。在力学中,我们通常用位移(qqq)或应变(ε\varepsilonε)来描述一个系统。内部的​​应变能​​是这些量的函数,U(q)U(q)U(q)。然后通过求导得到力或应力:P=∂U∂qP = \frac{\partial U}{\partial q}P=∂q∂U​。

但如果我们想从力的角度看世界呢?我们能定义一个作为载荷 PPP 的函数的能量吗?是的,我们可以!它被称为​​余能​​,U∗(P)U^*(P)U∗(P)。它通过一种优美的数学运算——​​勒让德变换​​——与应变能联系起来:U∗(P)=sup⁡q(Pq−U(q))U^*(P) = \sup_q (Pq - U(q))U∗(P)=supq​(Pq−U(q))。从几何上看,如果 UUU 是力-位移曲线下的面积,那么 U∗U^*U∗ 就是其左侧的面积。

奇妙之处在于这种对偶性是完美的。如果应变能的导数给出的是力,那么余能的导数则会反过来给出位移:q=∂U∗∂Pq = \frac{\partial U^*}{\partial P}q=∂P∂U∗​。这种在非线性材料的 Crotti-Engesser 定理中探讨的优雅对称性,提供了一种完全平行的力学问题构建与求解方式,力与位移的角色在其中优美地互换。

处理现实世界的复杂性

现实世界的系统是混乱的。它们有约束,表现出奇异的不稳定性,并且通常过于复杂,无法用纸笔求解。变分原理为应对这些挑战提供了一个稳健的框架。

  • ​​约束与拉格朗日乘子​​:如果一个系统必须遵循一个额外的规则——例如,一个珠子必须待在一根线上,或者一个物体的总体积必须保持不变,该怎么办?我们可以使用巧妙的​​拉格朗日乘子​​法来引入这些约束。拉格朗日乘子可以被看作是强制执行规则的“约束力”。我们用一个新项来扩充我们的泛函:乘子(λ\lambdaλ)乘以约束方程(g=0g=0g=0)。然后我们寻求这个新的增广泛函相对于原始变量和乘子的驻点。这个过程会自动找到最优解以及系统为遵守约束必须付出的“代价”(λ\lambdaλ)。

  • ​​不稳定性与非凸性​​:能量泛函本身的形状讲述了一个深刻的故事。如果势能函数是一个单一、简单的山谷(一个​​凸​​函数),那么就存在一个唯一的稳定平衡点。但如果地形更加崎岖,有多个山谷和山峰(一个​​非凸​​函数)呢?这正是物理学变得有趣的地方。系统可能会有几个可能的稳定或亚稳态。推一根杆可能会导致它突然“啪”地一声变成屈曲形状——它从一个能量谷跳到了另一个。一个受拉的材料可能会突然形成“颈缩”并在一处变形,这表明均匀应变不再是能量最低的状态。这些现象——不稳定性、相变和模式形成——都编码在能量泛函的非凸形状中。变分原理是我们探索这片复杂地形的向导,不仅帮助我们找到驻点,还能找到全局稳定的、具有物理意义的点。

  • ​​计算力学​​:现代工程仿真的世界,特别是​​有限元法(FEM)​​,几乎完全建立在变分原理之上。FEM 代码并不直接求解牛顿定律。相反,它将一个结构离散成小的“单元”,并用简单的试函数(很像瑞利-里兹法)来近似位移场。然后,它最小化整个结构的总势能来找到平衡构型。所求解的庞大方程组无非是“势能的一阶变分为零”这一陈述的离散化版本。用于解决复杂非线性问题的高级方法,如牛顿-拉夫逊格式,是通过对能量泛函进行一阶和二阶变分来逐步寻找平衡路径而推导出来的。

一个普适原理

也许变分法最令人叹为观止的方面是其纯粹的普适性。它不仅仅是解决经典力学问题的一个技巧。

在​​量子力学​​中,薛定谔方程本身可以被看作是一个作用量泛函的欧拉-拉格朗日方程。瑞利-里兹原理是量子化学的基石,用于近似原子和分子的能量。一项革命性的进步,​​密度泛函理论(DFT)​​,赢得了诺贝尔化学奖,它基于 Hohenberg-Kohn 变分原理。它取得了一个巨大的飞跃,因为它表明人们可以最小化一个简单的电子密度(一个三维空间中的函数)的能量泛函,而不是那个极其复杂的多电子波函数(一个3N维空间中的函数)。这一洞见使得精确计算以前无法企及的分子和材料的性质成为可能。

从光的路程(费马最小时间原理)到爱因斯坦​​广义相对论​​中时空的曲率(物体遵循测地线,即极值长度的路径),这个宏伟的思想在整个物理学中回响。它表明,在物理现象表面上的复杂性之下,隐藏着一个极致简洁和优雅的原理:在所有可能发生的事情中,实际发生的那个是特殊的。它是驻定的。

应用与跨学科联系

我们花了一些时间来探索变分原理的优雅机制。我们已经看到,大自然以其无穷的智慧,似乎被一种对经济性的深刻渴望所引导——寻找最小作用量的路径,或最低能量的状态。你可能会认为这只是数学物理中一个优美但相当抽象的部分,仅限于黑板上的推演。事实远非如此。

现在我们将看到这个原理的实际应用。我们将踏上一段旅程,看看这个单一而强大的思想如何成为一把万能钥匙,解开横跨惊人广泛领域的问题。我们将看到它在设计桥梁的工程师、发明新复合材料的材料科学家、惊叹于细胞结构的生物学家以及计算分子形状的化学家手中发挥作用。最值得注意的是,其基本的思维过程始终如一。这个原理不仅仅给出答案;它还提供了对事物为何如此的深刻、直观的理解。

工程师的工具箱:设计和预测结构

让我们从一个坚实而熟悉的世界开始:工程学。想象一下,你的任务是确定一个圆形井盖在上方土壤的重压下中心会下陷多少。你可以写下板理论中复杂的微分方程,但要针对特定的载荷和夹紧边界条件求解它们是一项艰巨的任务。有没有更直接、更物理的方式?

最小势能原理提供了一个绝佳的替代方案。与其寻求精确解,不如我们做一个聪明的猜测。我们知道板的边缘是夹紧的,所以它在那里必须是平的。我们知道它在中间会下陷得最厉害。所以,我们可以写下一个具有这些特征的简单数学函数。这个“试函数”不是真正的解,但它是一个合理的解。现在,对于任何给定的下陷量,我们都可以计算系统的总势能——弯曲板中储存的弹性应变能减去载荷推动它所做的功。原理告诉我们,在所有可能的形状中,大自然实际选择的是势能最低的那一个。通过简单地找到我们试函数中使这个能量最小化的下陷量,我们就可以得到一个对真实挠度的非常准确的估计。这就是著名的瑞利-里兹法的核心,它是工程分析的基石。它将一个困难的求解方程问题转化为一个更容易的寻找函数最小值的问题。

同样的思维方式也让我们能够洞察材料的内部。现代材料,如网球拍中的碳纤维或船体中的玻璃纤维,都是复合材料。它们是不同物质的混合物,比如强纤维嵌入较轻的基体中。这种材料的整体刚度是多少?在微观层面上,它是一堆不同组分的杂合物。

变分原理再次派上用场。与其追踪每一根纤维,我们可以对一块有代表性的材料提出两个简单而极端的问题。首先,如果我们假设应变处处均匀,就好像所有组分都以完美的平行方式一起拉伸?这给了我们一个关于有效刚度的估计,称为 Voigt 界。其次,如果我们假设应力处处均匀,就好像所有组分都是串联加载的?这给了我们另一个估计,即 Reuss 界。最小势能原理和最小余能原理证明,这两个简单的模型为复合材料的真实有效刚度提供了严格的上限和下限,无论其内部结构多么复杂。这是一个极其有力的结果。在不知道混乱细节的情况下,我们已经将现实限定在了两个明确的界限之间。

不归点:稳定性与失效

世界并不总是处于平稳的稳定平衡状态。有时,事物会屈曲、折断和破碎。变分原理是我们理解这些戏剧性事件最可信赖的向导。

考虑一个浅拱,就像一把你从顶部向下按压的微弯的尺子。起初,它会抵抗。但用力按压,它会突然“突跳”成一个倒置的形状。这是一个典型的不稳定例子。我们可以将这个系统的总势能建模为一个地形图。一个稳定的状态是这个地形图中的一个山谷。随着我们增加载荷,山谷变得越来越浅。不稳定的点——“极限点”——就是山谷完全消失的那一刻,系统发现自己处于一个山顶,必须从那里滚落到一个新的、遥远的山谷中。

有趣的是我们如何体验这种不稳定性。如果你用手施加载荷(一个“力控制”实验),你会感觉到这种突跳。但如果你把这个拱放在一个能指定位移的无限刚性机器中,你可以慢慢转动手柄,看着拱平滑地通过“不稳定”的构型。为什么?机器自身的势能成为了系统的一部分。拱加机器系统的总能量地形图保持稳定,机器提供了必要的力来温和地引导拱越过其自身的能量山丘。变分视角揭示了稳定性不仅取决于物体本身,还取决于其整个环境。

这些原理也告诉我们材料何时会断裂。在20世纪初,工程师们对材料为何在远低于理论预测的载荷下断裂感到困惑。罪魁祸首是微小、不可避免的微观裂纹。A. A. Griffith 的绝妙洞见是将断裂视为能量的竞争,这是一个为变分法量身定做的问题。

当裂纹扩展时,它会释放物体中储存的部分弹性应变能——周围的材料会松弛。但创造新的裂纹表面需要消耗能量,就像创造水滴表面一样。只有当释放的能量大于消耗的能量时,裂纹才会前进。作用在裂纹尖端的“驱动力”无非是总势能相对于裂纹长度的变化率。断裂的条件是当这个驱动力 GGG 克服了材料对创造新表面的阻力 2γ2\gamma2γ 时。这是一个支配材料生死存亡的优美、简单的能量平衡陈述。

约束的通用语言

变分原理真正的魔力在于其惊人的普适性。同样的逻辑适用于截然不同的尺度和学科,通常通过使用拉格朗日乘子这一优雅的数学工具来实施约束。

思考一下材料科学的世界,我们希望将原子尺度与工程学的连续介质世界联系起来。准连续介质(QC)方法正是这样做的。它从一个原子模型开始,其中能量是各个原子间势能的总和。通过假设变形是局部均匀的(巧妙的 Cauchy-Born 法则),我们可以推导出一个连续介质的能量密度。然后,利用虚功原理,我们可以找到应力张量——一个连续介质概念——的表达式,作为这个从原子层面推导出的能量的导数。应力是与应变能量共轭的变量,这是变分公式的直接结果。这使我们能够进行在关键区域(如裂纹尖端附近)完全是原子级别的模拟,而在其他地方则是高效的连续介质模型,无缝地连接了这两个世界。

让我们将尺度跳跃到柔软、湿软的生物物理学世界。活细胞的外膜是一个流体脂质双分子层。它有一个抗拒弯曲的弯曲刚度 κ\kappaκ 和一个抗拒拉伸的膜张力 σ\sigmaσ。它的行为受最小化总(Helfrich)能量的支配。如果你用一对微型镊子拉一个囊泡,你可以拉出一条细长的膜管,称为索。是什么决定了这条索的半径?是大自然的优化!弯曲能偏爱大半径(曲率小),而张力能偏爱小半径(面积小)。索最终稳定在能完美最小化单位长度总能量的半径 R=κ/(2σ)R = \sqrt{\kappa/(2\sigma)}R=κ/(2σ)​ 上。你拉动索所需的力是恒定的,f=2π2κσf=2\pi\sqrt{2\kappa\sigma}f=2π2κσ​,这仅仅是总索能量对其长度的导数。实验以惊人的准确性证实了这些预测。你身体里的每一个细胞都在不断地解决变分问题来决定其形状并对力做出反应。

也许最令人惊讶的应用是在量子化学中。当我们想找到一个分子的电子结构时,我们试图找到能使分子总能量最小化的电子波函数(轨道)。然而,这些轨道必须遵守一个基本的量子力学规则:它们必须相互正交。这是一个约束。我们如何解决带约束的最小化问题?用拉格朗日乘子!在限制性开壳层 Hartree-Fock (ROHF) 理论中,决定轨道的方程就包含这些乘子。一个非对角乘子,比如说在闭壳层轨道和开壳层轨道之间的 λco\lambda_{co}λco​,具有深刻的物理意义。它正好等于会驱动这两个轨道混合的“力”或“能量梯度”。在解处,这个非零的乘子将轨道维持在一个约束平衡的状态,防止它们混合而违反正交约束下的能量最小值。将原子维系在一起的力,在深刻的数学意义上,就是拉格朗日乘子。

数字宇宙:计算与未来

在我们的现代世界中,这些原理许多最复杂的应用都存在于计算机内部。有限元法(FEM)是现代工程仿真的主力,它本质上是瑞利-里兹法的大规模应用。一个复杂的物体,如汽车或飞机机翼,被分成数百万个简单的小“单元”。然后将最小势能原理应用于整个组合体,生成一个巨大的方程组,计算机可以求解。

在处理像两个物体接触这样的复杂情况时,我们再次使用拉格朗日乘子。约束很简单:两个物体不能相互穿透。这个“单边”约束由一组优美的不等式,即 Karush-Kuhn-Tucker (KKT) 条件来表述。它们指出,间隙必须为非负,接触压力必须是压缩性的(表面只能推不能拉),并且压力只能存在于间隙为零的地方。在仿真中强制执行物理约束,如橡胶密封件的不可压缩性,也需要仔细的变分处理,以避免像“闭锁”(模拟物体变得人为地僵硬)这样的数值病态。

未来又将如何?即使人工智能和机器学习席卷科学和工程领域,它们也正在被这些永恒的原理所塑造。一类名为物理信息神经网络(PINNs)的新方法旨在求解微分方程。其中最稳健的变分 PINNs (VPINNs),不是通过给神经网络喂数据来训练它,而是要求它最小化方程弱形式的残差——换句话说,网络通过试图满足虚功原理来学习!在一个 fascinating 的新旧融合中,前沿的混合方法使用粗糙的 FEM 网格来捕捉结构的整体行为,而神经网络则提供灵活的“增强”来捕捉复杂的局部细节。整个系统——FEM 系数和网络权重——通过最小化一个单一的总势能泛函来共同优化。

从一个井盖到一种材料的构造,从一个突然失稳的拱到一条不断扩展的裂纹,从一个细胞膜到一个电子的轨道,再到现代科学计算的核心,其道理都是相通的。自然,以及我们对自然的描述,都受一个极其优雅而强大的组织原理所支配。通过寻求最小值,我们找到了真理。