非局部算子

玻尔百科

核心要点

非局部算子描述的是这样一种系统：其中某一点的行为受到整个定义域内相互作用的影响。这与仅考虑紧邻区域的局部算子形成鲜明对比。
非局部性是量子力学的一个核心特征，体现在泡利不相容原理以及先进化学模拟中使用的、本质上非局部的 Hartree-Fock 交换算子中。
在概率论中，非局部算子对应于具有不连续“跳跃”的随机过程（Lévy 飞行），这对建模和边界条件具有深远影响。
尽管计算量巨大，非局部算子在模拟各种现象时不可或缺，例如材料断裂（近场动力学）、量子信息，甚至被傅里叶神经算子等现代人工智能架构所学习。

引言

在经典物理学的世界里，从牛顿定律到热方程，相互作用都是一种密切相关的局部行为。任何一点的未来都由其当前状态及其无限小邻域的状态所决定，这一原理被微分方程优雅地捕捉。但如果这种邻域视角并不完整呢？如果影响可以瞬间跨越遥远的距离，以一种根本性的整体方式将系统的状态联系起来呢？这就是非局部算子的领域，一个挑战我们经典直觉的“鬼魅般的超距作用”的数学框架。

这个概念不仅仅是一个数学抽象，它对于描述局部理论无法解释的现象至关重要，从原子中电子的行为到固体物体的开裂。本文将深入探讨非局部算子这个奇特而强大的世界。第一部分“原理与机制”将解构局域性的概念，介绍分数阶拉普拉斯算子等非局部算子的数学定义，探索它们在量子力学和概率论中的深厚根源，并审视它们带来的深刻计算挑战。随后，“应用与跨学科联系”部分将带领我们遍览这些算子不可或缺的广阔领域，揭示它们在材料科学、量子计算甚至人工智能架构中惊人的普遍性。我们将首先超越“即时性的禁锢”，探索支配着一个相互关联的非局部宇宙的原理。

原理与机制

即时性的禁锢

在很大程度上，我们在物理学中最初认识的世界是一个严格局部的世界。如果你想知道一个台球下一步会怎么运动，你只需观察正在接触它的是什么，或者作用在它上面的力是什么，就在此时此地。宇宙中一小块区域的未来由其当前状态以及其紧邻的、无限小的邻域的状态所决定。这个原理，即局域性，是经典物理学的基石。

这个局部宇宙的语言是微分方程。当我们写下像热方程 $\frac{\partial u}{\partial t} - \alpha \nabla^2 u = 0$ 这样的方程时，我们正在做一个深刻的局部陈述。某一点的温度变化率 $\frac{\partial u}{\partial t}$ 取决于该点温度分布的局部曲率 $\nabla^2 u$ 。拉普拉斯算子 $\nabla^2$ 本身就是局域性的体现；要计算它在点 $x$ 的值，你只需要知道函数 $u$ 在 $x$ 周围一个无限小的泡泡内的行为。你将 $x$ 处的值与其紧邻区域的平均值进行比较。影响的传播就像邻里之间传递的谣言，是一个连续而有序的级联过程。从牛顿定律到麦克斯韦方程组，我们的经典直觉都建立在这个基础上：这里发生的事情由就在这里的情况决定。

鬼魅般的超距作用

现在，让我们考虑一个截然不同、更加奇异的想法。如果在点 $x$ 的状态不仅取决于其紧邻，还取决于遥远的点，这些点散布在整个定义域中，会怎么样？如果为了确定 $x$ 处的演化，必须参考系统中其他所有点 $y$ 的状态，无论多么遥远，又会怎么样？这就是非局部算子所描绘的奇异而美丽的世界。

典型的例子是一个被称为分数阶拉普拉斯算子的算子，记作 $(-\Delta)^s$ ，其中 $s$ 是一个介于 $0$ 和 $1$ 之间的数。与它的经典表亲——标准拉普拉斯算子不同，分数阶拉普拉斯算子不能用局部导数来描述。相反，它由一个遍及整个空间的积分来定义：

(-\Delta)^{s}u(x) = C_{n,s}\,\mathrm{P.V.}\int_{\mathbb{R}^{n}}\frac{u(x)-u(y)}{|x-y|^{n+2s}}\,dy

让我们花点时间来体会一下这个方程告诉我们的信息。为了找到算子在单一点 $x$ 的作用，你必须进行一种全局性的调查。你将你的函数在基点 $u(x)$ 的值与宇宙中其他所有点 $y$ 的值进行比较。每个点 $y$ 都可以投一“票”，其票的强度 $u(x)-u(y)$ 由一个随距离衰减的权重因子 $|x-y|^{-(n+2s)}$ 决定。近处的点有很大的发言权，但没有任何点，无论多么遥远，会被完全 silenced。该算子能同时感知整个函数。

这与经典偏微分方程（PDE）的世界完全不同。在那个世界里，我们通过方程包含的最高阶导数来定义其“阶数”——热方程是二阶的，因为拉普拉斯算子中有二阶导数。分数阶拉普拉斯算子被称为 $2s$ 阶，这通常不是一个整数。但非整数阶并非真正奇特之处，它是一个更深层次范式转变的症候。对经典框架的真正挑战在于，分数阶拉普拉斯算子无法由某一点任意有限数量的局部导数构建而成。它是根本性的、不可约简的非局部算子。

机器中的幽灵：量子力学中的非局部性

你可能会认为这只是数学家的幻想，一种奇特但非物理的构造。那你就错了。这种“鬼魅般的超距作用”不仅仅是一种奇观，它被编织在量子力学的结构之中。

量子非局域性最著名的来源是泡利不相容原理，该原理指出，两个完全相同的费米子（如电子）不能占据同一个量子态。想一想这意味着什么。地球上一个原子中的电子“知道”不能与半人马座阿尔法星上一个原子中的电子处于相同的状态。这不是一种随距离减弱的力，而是一条支配宇宙结构的绝对的、全局性的规则。描述多电子系统的波函数必须是反对称的——如果你交换任意两个电子的坐标，波函数的符号必须反转。

当我们试图建立多电子系统的理论时，这种反对称性要求在方程中产生了一个奇异的项：交换算子。在 Hartree-Fock 近似中，作用于单个电子的有效算子不仅包含来自所有其他电子平均电荷云的经典（或“Hartree”）排斥作用，还包含一个纯粹的量子力学交换项。它作用于电子轨道（波函数） $\psi_k$ 上，由于另一个处于轨道 $\psi_j$ 的电子的存在，其形式如下：

(\hat{K}_j \psi_k)(\mathbf{r}_1) = \left( \int \frac{\psi_j^*(\mathbf{r}_2) \psi_k(\mathbf{r}_2)}{|\mathbf{r}_1 - \mathbf{r}_2|} d\mathbf{r}_2 \right) \psi_j(\mathbf{r}_1)

这是一个非局域性的奇迹！算子在点 $\mathbf{r}_1$ 的作用依赖于一个涉及轨道 $\psi_k$ 在整个空间（ $\mathbf{r}_2$ ）上的积分。但更奇怪的是，结果函数并不与原始轨道 $\psi_k(\mathbf{r}_1)$ 成正比，而是与另一个轨道 $\psi_j(\mathbf{r}_1)$ 成正比！算子实际上“交换”了两个电子的身份。这就是泡利原理在数学上的幽灵。

这个非局部交换算子不是一个小修正，它对于精确描述分子键、材料性质和化学反应至关重要。在密度泛函理论（DFT）的世界里，像局域密度近似（LDA）或广义梯度近似（GGA）这样的简单近似试图用一个简单的、局部的、乘性的势来取代这个复杂的非局部算子。这常常导致显著的误差，例如臭名昭著的“自相互作用误差”，即一个电子错误地与自身相互作用。

为了解决这个问题，现代计算化学家们已经攀登“雅各布天梯”，发展出更复杂的近似方法。所谓的杂化泛函（第四级）和双杂化泛函（第五级）在能量计算中明确地重新引入了一部分真实的、非局部的 Hartree-Fock 交换算子。但这样做是有代价的。标准的 DFT 的 Kohn-Sham 方程是为局部势构建的。一旦你包含一个非局部算子，旧的框架就会崩溃。你被迫采用一个更强大的方案：广义 Kohn-Sham (GKS) 框架，它专门设计用来处理这些非乘性的、非局部的算子，而这些算子正是量子力学的真正标志。

带跳跃的旅程：概率论中的非局部性

还有另一种同样优美的方式来建立对非局域性的直观理解：通过概率和随机游走的视角。

我们熟悉的热方程是局部物理学的典范，它与布朗运动密切相关。想象一个悬浮在水中的微小粒子，被随机碰撞推挤着。它扭动、徘徊，描绘出一条路径。这条路径的一个关键特征是它是连续的。粒子不能瞬移。要从 A 点到 B 点，它必须经过一系列连续的中间点。

现在，让我们想象一种不同的随机过程，称为 Lévy 飞行。一个受此过程支配的粒子可能会在附近进行几次小的、扩散性的步骤，然后突然、毫无预警地进行一次巨大的跳跃，到达系统的一个完全不同的部分。它的路径在根本上是不连续的，充满了各种大小的跳跃。这种“带跳跃的旅程”过程正是一个非局部算子（如分数阶拉普拉斯算子）的概率灵魂。

这种对应关系具有深刻而具体的后果，尤其是在我们考虑有界区域（比如说，一个房间内部）的问题时。

对于像热扩散这样的局部问题（或布朗粒子），要预测房间内的温度，你只需要知道其边界上的条件——墙壁、地板和天花板（ $\partial\Omega$ ）的温度。一个连续运动的粒子必须撞到墙才能出去。
对于非局部问题（或 Lévy 飞行的粒子），这远远不够！粒子可能前一刻还在房间中央，下一刻就通过一次跳跃降落在外面的花园里，完全越过了墙壁。房间内部的过程与外部世界有着内在的联系。因此，要解决这个问题，你不仅必须指定边界上的条件，还必须指定整个外部区域（ $\Omega^c$ ）的条件。这就是为什么会出现不同的数学定义：一个受限或积分分数阶拉普拉斯算子能“看到”整个空间并需要外部数据，而一个人工的谱版本可以通过从一开始就内置零边界条件，来定义一个只存在于域内的算子。

这种差异也体现在解的性质上。局部椭圆方程的解在其定义域内部以光滑著称，而非局部方程的解可能表现出更粗糙的行为，尤其是在边界附近，仿佛被与外部世界的相互作用留下了疤痕。即使是强大的 Harnack 不等式（正则性理论的基石，它关联了解的最大值和最小值）也必须为非局部算子进行修改。它必须包含一个额外的“尾项”，以解释来自紧邻区域之外的持续的、长程的影响。

计算的挑战

这种奇异而美妙的非局部特性不仅是理论上引人入胜的源泉，也是巨大计算难题的根源。

当我们要用计算机求解一个偏微分方程时，我们通常会对其进行离散化，用一个点网格代替连续的定义域。对于像标准拉普拉斯算子这样的局部算子，每个网格点上的方程只涉及其紧邻的邻居。这会产生一个稀疏矩阵——一个绝大部分元素为零的矩阵，其中每一行只有少数非零项。我们有非常高效的算法，比如多重网格方法，专门用于闪电般快速地求解这些稀疏系统。

现在，考虑离散化一个非局部算子。正如我们所见，每个点都与所有其他点相互作用。当我们将此写成矩阵方程时，矩阵是稠密的。每个元素都可能是非零的。一个有一百万个点的系统，对于局部问题来说是微不足道的，现在却涉及一个有一万亿个元素的矩阵。存储它是不可能的，而与之相乘的计算成本也高得令人望而却步。

即使我们能处理矩阵向量乘法的成本，我们最优算法的逻辑本身也可能被颠覆。著名的多重网格方法通过将误差分解为不同频率的分量来工作。它使用一个“光滑子”（如简单的 Jacobi 或 Gauss-Seidel 松弛）来快速衰减高频的、振荡的误差。然后，它在一个更粗的网格上校正剩下的低频、光滑的误差，因为在粗网格上问题规模更小。这种优雅的配合依赖于一个基本假设：局域性。它假设“高频”对应于局部振荡，“低频”对应于光滑、缓变的函数。

对于非局部算子，这种配合就失效了。

一个局部光滑子，它只根据邻居点来更新一个点，对支配系统行为的长程连接是“盲目”的。它无法有效地衰减高能模式。
更糟糕的是，光滑子未能衰减的误差（“代数光滑”误差）不一定是几何光滑的。它可能高度振荡，这意味着它不能在粗网格上被准确表示。

光滑化和粗网格校正之间美妙的互补性被打破了。要驯服这些非局部的野兽，需要我们彻底反思我们的数值工具箱，推动数学家和计算科学家发明新的、更鲁棒的技术，如多项式光滑子或能够“看到”问题非局部结构的复杂代数多重网格方法。非局部性不仅是物理学和数学的新篇章，它还是一个持续挑战我们直觉、理论和机器的前沿。

应用与跨学科联系

在探索了非局部算子的原理和机制之后，我们可能会倾向于将它们视为一种小众的数学奇观。但事实远非如此。事实证明，一旦你开始寻找，你会发现这些“鬼魅般的”积分算子无处不在。它们并非需要避免的奇异复杂性，恰恰相反，它们是描述从固体开裂到量子引力的深奥前沿，再到人工智能架构等大量现象所必需的语言。它们真正的美不在于其抽象的定义，而在于它们以优雅且常常出人意料的方式，统一了科学世界中看似毫不相干的角落。

物质的结构：从裂纹到晶体

让我们从一件你手中可以握住的东西开始。想象一下拉伸一块塑料。起初，它平滑地变形。材料上任何微小部分的受力都由其紧邻的邻居决定——这是一种纯粹的局部行为，是 Isaac Newton 会感到自在的那种。但接着，一道微小的裂纹出现了。在裂纹的尖端，整个“局部邻域”的概念都崩溃了。作为经典连续介质力学基石的光滑导数的概念变得毫无意义。材料是不连续的。

这时，经典的局部理论束手无策。但像近场动力学这样的非局部理论却以一个绝妙简单而强大的想法介入。它说：让我们抛弃一个点只与它无限小的邻居相互作用的想法。相反，我们假设材料中的每个点都感受到其周围一个小的、有限的“作用范围”内所有其他点的力。一个点上的总力是其作用范围内所有邻居影响的积分。突然之间，裂纹不再是理论上的噩梦。裂纹仅仅是点与点之间的“键”已经断裂的区域，而非局部积分算子自然而优雅地计算出这种新构型下的力，而不会遇到任何奇异点 [@problem_d:3371904]。这种非局部的观点不仅解决了一个问题，它还提供了一种更基本的描述，在光滑区域收敛到经典的局部理论，但也能正确处理断裂、损伤和失效的复杂现实。

这种更根本的、非局部的描述思想不仅适用于力学，它还延伸到热流、化学物质扩散以及它们之间的耦合。但在这里，一个深刻的原理浮现出来。你不能随心所欲地写下任何积分算子并称之为物理理论。为了与我们宇宙的基本定律——能量、动量和质量守恒，以及热力学第二定律所描述的熵的必然增加——保持一致，这些非局部算子的数学核函数必须遵守严格的对称性和正定性条件。例如，为了使一个孤立系统的总质量或能量守恒，描述两点 $\mathbf{x}$ 和 $\mathbf{x}'$ 之间“物质”流动的核函数，必须与从 $\mathbf{x}'$ 到 $\mathbf{x}$ 流动的核函数相同。这确保了任何交换都是完美的双向通道，没有净的产生或毁灭。此外，对于交叉现象，例如温差引起的粒子流（索雷效应），非局部算子必须遵守倒易关系，这是对 Onsager 热力学原理的美妙呼应。这些约束表明，非局部性并非任意的，它被编织在物理定律的结构之中。

现在，让我们把视野放大，越过裂纹的尺度，进入支配材料属性的量子领域。当我们尝试使用密度泛函理论等方法计算晶体的电子结构时，我们面临着与裂纹尖端类似的问题：原子核的电势是奇异的，核心电子的波函数剧烈振荡。为了使计算易于处理，物理学家发明了赝势，这是一个聪明的技巧，用一个更光滑、有效的势来取代这个复杂的核心区域。但要使这个技巧奏效——要使“赝”波函数在核心区外的行为与真实价电子波函数一样——这个有效势必须是非局部的。它采用投影算子的形式，这是一种非局部算子，其本质上是在问：“波函数中有多大成分具有 $s$ 轨道、 $p$ 轨道或 $d$ 轨道的特征？”并对每个分量施加不同的势。这种非局部性是泡利不相容原理的直接量子力学后果，该原理迫使价电子波函数与核心电子波函数正交。

对于更高层次的理论，这种非局部特性变得更加关键。像杂化泛函或 $GW$ 近似这样的方法，对于精确预测半导体和其他先进材料的性质是必需的，它们本身就包含固有的非局部算子，例如 Hartree-Fock 交换能。这些计算的准确性敏感地依赖于赝势的非局部特性是否能正确再现电子的行为，不仅在其基态能量下，而且在包括许多对屏蔽和相互作用有贡献的“未占据”态在内的广泛能量范围内。甚至爱因斯坦相对论的基本效应，如对自旋电子学和拓扑材料至关重要的自旋-轨道耦合，也是通过精心构建的非局部、依赖自旋的赝势算子被纳入这些理论的。看来，为了简化对微观世界的描述，我们必须拥抱非局部性。

量子信息与物理学前沿

量子世界的奇异性为非局部思想提供了最自然的家园。在寻求容错量子计算机的过程中，最有前途的途径之一涉及Majorana 费米子，这是一种奇特的、自身即是其反粒子的准粒子激发。在这里，一个量子比特（qubit）并非储存在一个地方。相反，它的信息被非局部地编码在一组空间分离的 Majorana 费米子上。这种非局部的存储使得量子比特对局部噪声和扰动具有难以置信的鲁棒性——当信息没有写在任何单一位置时，要摧毁它就变得很困难！用于读出这些信息的算子，例如测量链中第一个和最后一个 Majorana 费米子组合宇称的算子，本质上是非局部的。然而，这些算子所遵循的美妙代数揭示了，这种非局部测量可以巧妙地通过一系列对相邻对的纯局部测量来重构。在这里，非局部性不仅是动力学的一个特征，而且是信息存储的基本原理。

一个有趣的转折是，非局部性也帮助我们理解了我们对世界进行统计描述的局限性。本征态热化假说（ETH）是一个深刻的思想，试图解释统计力学如何从底层的量子力学定律中涌现。它假定，在一个混沌的多体量子系统中，任何单个高能本征态，在所有实际用途上，都是一个热力学态。这意味着，任何“简单”的局域可观测量（如单个格点的磁化强度）在该单个本征态中的期望值，与通过传统热力学系综平均得到的值相同。ETH 对局域和“少体”算子工作得非常好。但据预测，它对于高度非局部的算子将会失效——这些算子被构造成对波函数的全局、精细结构敏感，比如投影到一个特定的多体态上的算子。这样的算子能够“看”出该本征态是一个纯粹的、相干的量子态，而不是一个随机的热力学混合物。在这里，非局部性是开启热力学涌现的经典世界与底层量子态隐藏的复杂现实之间大门的关键。

那么，最基本的理论又如何呢？甚至我们对时空本身的理解也在用非局部的思想进行重新审视。在构建一个自洽的量子引力理论的尝试中，物理学家们探索了对爱因斯坦广义相对论的修正，这些修正在作用量中引入了非局部项。一个例子可能是形如 $R \Box^{-2} R$ 的项，它通过逆 d'Alembert 算子 $\Box^{-2}$ （一个典型的非局部积分算子）将一个点的时空曲率 $R$ 与所有其他点的曲率联系起来。希望在于，这类将相互作用涂抹在时空区域上的项，或许能够抑制困扰局域量子场论的无穷大问题，并为通往一个在最小尺度上表现良好的引力理论提供一条路径。

从最优控制到人工智能

让我们从这些崇高的理论回到工程、金融和控制的世界。想象一下你正在设计一个管理电网或金融投资组合的系统。你的系统大部分时间平稳演化，但它也可能遭受突然的、不可预测的冲击——发电机故障或市场崩溃。这些“跳跃过程”是时间和状态上的一种非局部性。在这个世界中寻找最佳策略的数学框架是最优控制理论，其核心方程 Hamilton-Jacobi-Bellman (HJB) 方程因此获得了一个非局部积分项。该项考虑了从当前状态突然跳跃到任何其他可能状态的风险，并由一个概率测度加权。求解这些积分-微分方程，并设计保证收敛到正确解的数值方案，是应用数学的一个主要领域，其中处理非局部算子是核心挑战。

这把我们带到了最新的前沿：机器学习。科学家们越来越多地使用神经网络为复杂的物理系统创建“代理模型”，从而实现比传统求解器快数千倍的模拟。该领域的一项革命性方法是算子学习，其目标不是学习针对某一组特定输入的解，而是学习整个求解算子——即从任何有效输入函数到相应输出解函数的映射。其中最成功的架构之一是傅里叶神经算子（FNO）。FNO 的魔力在于它在傅里叶空间中进行学习。FNO 层中的一个关键操作是将经过傅里叶变换的数据与一个学习到的滤波器相乘。根据卷积定理，我们知道傅里叶空间中的这种乘法等同于实空间中的卷积。而卷积，你猜对了，就是一个非局部积分算子！因此，本质上，我们正在训练神经网络去学习最能代表系统物理特性的非局部算子的核函数。这些架构天然地偏爱那种支配着从流体动力学到量子力学等一切事物的非局部相互作用，并且它们可以与物理信息引导的训练技术相结合，以确保其预测遵守基本定律。

从管道中的一道裂缝到时空的结构，从量子比特的逻辑到人工智能的架构，非局部算子的概念提供了一条统一的线索。这样一个单一、优雅的思想竟能找到如此多样化和深刻的应用，描述着真正支配我们世界的错综复杂和深远悠长的联系，这正是数学力量的证明。