不动点迭代法

玻尔百科

核心要点

不动点迭代法通过对一个猜测值反复应用函数 $g(x)$ 来求解方程，最终收敛到满足 $p = g(p)$ 的解 $p$ 。
如果函数是压缩映射，即其导数的绝对值 $|g'(x)|$ 在不动点附近小于 1，则保证收敛。
该方法的速度，或称收敛阶，由不动点处的第一个非零导数决定；如果 $g'(p) = 0$ ，则可实现极快的二次收敛。
这一迭代原理是一个基本概念，它统一了从牛顿法、常微分方程求解器到谷歌的 PageRank 算法和经济均衡模型的各种算法。

引言

寻找平衡点——即在变换下保持不变的状态——是贯穿科学、工程和数学的一个基本挑战。许多复杂问题，从预测结构稳定性到模拟经济行为，都可以表示为寻找形如 $p = g(p)$ 方程的解 $p$ 。当这类方程无法直接求解时，我们需要一种稳健的数值策略来找到这个“不动点”。本文对不动点迭代法进行了全面探索，这是一种简单而强大的技术，正是用于解决此类问题。第一章“原理与机制”将剖析该方法的核心工作方式，建立其收敛的关键条件，分析其速度，并揭示其与牛顿法等其他著名算法的深层联系。在此之后，“应用与跨学科联系”一章将展示这一概念惊人的广度，说明寻找不动点如何成为从谷歌的 PageRank 算法到复杂物理系统模拟和社会均衡建模等一切事物的理论基础。

原理与机制

想象你有一张折叠的大学校园地图。如果你将这张地图放在校园内的某个地方，地图上是否有一个点恰好位于其所代表的物理位置的正上方？这感觉上是直观正确的，事实也的确如此。这个特殊的点就是一个“不动点”——即映射（从真实校园到纸质地图）下保持不变的点。这个简单的想法是一种极其强大的方程求解技术的核心。许多科学和工程问题，从寻找卫星的平衡温度到模拟化学反应，都可以归结为寻找一种平衡状态，即在某种变换下保持固定的点。在数学上，我们将其写成一个不动点问题：找到一个数 $p$ ，使得 $p = g(p)$ 。

函数 $g(x)$ 代表这个变换，而数字 $p$ 就是我们的平衡点。但我们如何找到它呢？如果我们不在不动点上，我们可以尝试通过一个极其简单的过程来到达那里：只需一遍又一遍地应用这个变换。我们从一个初始猜测值 $x_0$ 开始，生成一个序列：

$x_1 = g(x_0)$ $x_2 = g(x_1)$ $x_3 = g(x_2)$ ...依此类推，遵循规则 $x_{k+1} = g(x_k)$ 。

这就是不动点迭代法。我们希望这个点序列能像一条小径，引导我们越来越接近目的地——不动点 $p$ 。但这段旅程总能通往正确的地方吗？甚至，它会通往任何地方吗？

对平衡的求索：目的地是否正确？

在我们开始迭代之旅前，我们必须绝对确定自己走在正确的道路上。通常，我们并非从一个不动点问题开始，而是从一个我们想要求解的更传统的方程开始，比如 $f(x) = 0$ 。要使用我们的迭代法，必须首先将这个方程重排成 $x = g(x)$ 的形式。

有很多方法可以做到这一点。对于像 $x^3 + 4x^2 - 10 = 0$ 这样的方程，我们可以分离出一个 $x$ 项。例如，我们可以写成 $4x^2 = 10 - x^3$ ，得到 $x = \sqrt{\frac{10 - x^3}{4}}$ 。或者，正如一种可能的设置中所探讨的，我们可以写成 $x^2(x+4) = 10$ ，这给出 $x = \sqrt{\frac{10}{x+4}}$ 。每种重排都给出了一个不同的函数 $g(x)$ 。

但这种自由也是危险的来源。我们必须检查我们的重排是否有效。核心要求是，我们原始问题 $f(x)=0$ 的一个解，必须是我们新函数 $g(x)$ 的一个不动点。如果我们想求 6 的立方根，我们实际上是在解 $x^3 - 6 = 0$ 。一个学生可能会巧妙地将其重排为 $3x = x^2 + 6/x$ ，从而提出迭代式 $x_{k+1} = g(x_k)$ ，其中 $g(x) = \frac{1}{3} (x^2 + 6/x)$ 。这看起来似乎可行。但让我们来验证一下。如果我们代入真实答案 $\alpha = \sqrt[3]{6}$ ，它是一个不动点吗？我们发现 $g(\alpha) = \frac{1}{3}(\alpha^2 + 6/\alpha) = \frac{1}{3}(\alpha^2 + \alpha^3/\alpha) = \frac{2}{3}\alpha^2$ 。要使 $g(\alpha)$ 等于 $\alpha$ ，我们需要 $\alpha = \frac{2}{3}\alpha^2$ ，而这对 $\alpha = \sqrt[3]{6}$ 并不成立。所以，这个迭代无论运行多久，都永远不可能收敛到 6 的立方根，因为 6 的立方根不是它的目的地。这是我们最关键的第一课：你选择的路径必须确实通往你想去的地方。

看门人：收敛的条件

假设我们已经正确选择了 $g(x)$ ，使得我们期望的解 $p$ 确实是一个不动点。那么迭代 $x_{k+1} = g(x_k)$ 能保证我们到达那里吗？不一定。有些不动点就像山谷的底部——任何在附近滚动的球最终都会停在那里。我们称之为吸引不动点。另一些则像完美平衡的针尖——最轻微的触碰都会让你飞速离开。这些是排斥不动点。

考虑一个优美的问题：寻找一个等于其自身余弦值的数： $x = \cos(x)$ 。这里， $g(x) = \cos(x)$ 。如果我们从，比方说， $x_0=1$ 开始，我们会得到 $x_1 = \cos(1) \approx 0.54$ ，然后 $x_2 = \cos(0.54) \approx 0.85$ ，依此类推。这个序列来回摆动，但稳步地逼近解，约为 $0.739$ 。这是一个吸引不动点。

现在，将其与寻找 $x = 2\tan(x)$ 的非零解作对比。在 $p \approx 1.166$ 附近有一个解。但如果我们从附近开始迭代，比如从 $x_0 = 1.17$ 开始，我们发现 $x_1 = 2\tan(1.17) \approx 4.75$ ，这比我们的起点离不动点远得多！每一步都把我们推得更远。这是一个排斥不动点。

是什么区分了吸引不动点和排斥不动点？秘密在于函数 $g(x)$ 在不动点处的斜率，即其导数 $g'(p)$ 。不动点迭代法通过在每一步减小误差来工作。第 $k$ 步的误差是 $e_k = x_k - p$ 。下一步的误差是 $e_{k+1} = x_{k+1} - p = g(x_k) - g(p)$ 。根据中值定理，我们知道 $g(x_k) - g(p) = g'(c)(x_k - p)$ ，其中 $c$ 是介于 $x_k$ 和 $p$ 之间的某个数。所以， $e_{k+1} = g'(c) e_k$ 。

如果斜率的绝对值 $|g'(x)|$ 在不动点邻域内始终小于 1，那么该函数就是一个压缩映射。每一步都会缩小误差： $|e_{k+1}| \lt |e_k|$ 。迭代就像走进山谷。如果 $|g'(p)| > 1$ ，函数会放大误差，我们就会被推开。这就是基本的收敛条件：

如果迭代 $x_{k+1} = g(x_k)$ 从足够接近不动点 $p$ 的地方开始，并且满足 $|g'(p)| 1$ ，则保证收敛到 $p$ 。

对于 $g(x) = \cos(x)$ ，其导数为 $g'(x) = -\sin(x)$ 。在不动点 $p \approx 0.739$ 处，我们有 $|g'(p)| = |-\sin(p)| \approx 0.67 1$ 。它是一个压缩映射！对于 $g(x) = 2\tan(x)$ ，其导数为 $g'(x) = 2\sec^2(x)$ 。在不动点 $p \approx 1.166$ 处，我们发现 $|g'(p)| \approx 12.9 > 1$ 。它是一个排斥子。

如果 $|g'(p)| = 1$ 怎么办？这是一个微妙的临界情况。对于 $g(x) = 1-x$ 的迭代是一个警示性的例子。不动点是 $p=0.5$ ，且 $g'(x) = -1$ ，所以 $|g'(p)|=1$ 。如果我们从 $x_0=1$ 开始，会得到 $x_1=0, x_2=1, x_3=0$ 等等。序列永远在振荡，永远不会更接近解。

吸引盆

条件 $|g'(x)| 1$ 是一个局部性质。它保证了如果你从“足够近”的地方开始，迭代就会收敛。但多近才算足够近呢？这就定义了吸引盆。考虑函数 $g(x) = \frac{1}{4} + \frac{1}{2}x^2$ 。它有两个不动点， $p_s = 1 - \frac{\sqrt{2}}{2} \approx 0.293$ 和 $p_l = 1 + \frac{\sqrt{2}}{2} \approx 1.707$ 。其导数为 $g'(x) = x$ 。在较小的不动点处， $|g'(p_s)| = p_s \approx 0.293 1$ 。它是一个吸引子。在较大的不动点处， $|g'(p_l)| = p_l \approx 1.707 > 1$ 。它是一个排斥子。 $p_s$ 的吸引盆是所有能收敛到它的初始点的集合。在这个例子中，事实证明，如果你从区间 $(-p_l, p_l)$ 内的任何地方开始，你都会收敛到 $p_s$ 。例如，区间 $[0, 0.5]$ 是一个安全区：对于此区间内的任何 $x$ ， $g(x)$ 都保持在该区间内，并且导数 $|g'(x)| = x \le 0.5 1$ 。因此，任何在 $[0, 0.5]$ 内的起始点都保证能成功收敛。

对于一些极好的函数，其吸引盆非常巨大。对于 $g(x) = \cos(x)$ ，任何初始猜测值 $x_0$ 都会产生 $x_1 = \cos(x_0)$ ，它位于 $[-1, 1]$ 内。从那一点开始，迭代始终保持在 $[-1, 1]$ 内，其中条件 $|g'(x)|=|\sin(x)| \le \sin(1) 1$ 成立。收敛基本上是全局的。类似地，对于像 $x_{k+1} = \sqrt[4]{x_k+10}$ 这样的迭代，可以证明对于任何非负起始点，迭代都会收敛到唯一的正不动点。有些方法是局部的，需要一个好的初始猜测，而另一些方法则在很大的定义域上是稳健全局的。

旅程的速度：收敛阶

那么，我们的迭代收敛了。但它是爬行还是冲刺呢？答案在于对误差进行更详细的分析，使用 $g(x)$ 在不动点 $p$ 附近的泰勒级数展开： $e_{k+1} = g(x_k) - p = g(p+e_k) - p = \left( g(p) + g'(p)e_k + \frac{g''(p)}{2}e_k^2 + \dots \right) - p$ 因为 $g(p)=p$ ，这可以简化为： $e_{k+1} \approx g'(p)e_k$

如果 $g'(p) \neq 0$ （但其绝对值仍小于1），误差在每一步都会以一个大致恒定的因子减少。这被称为线性收敛。你在每一步获得的正确数字位数是恒定的。它很可靠，但如果 $|g'(p)|$ 接近 1，可能会很慢。

但是，如果我们能设计函数 $g(x)$ 使得 $g'(p) = 0$ 呢？那么我们误差展开中的第一项就消失了！误差传播变为： $e_{k+1} \approx \frac{g''(p)}{2}e_k^2$ 新的误差与前一个误差的平方成正比。如果你的误差很小，比如 $10^{-4}$ ，下一个误差将在 $(10^{-4})^2 = 10^{-8}$ 的量级。正确的小数位数在每次迭代中大致翻倍！这被称为二次收敛，速度快得惊人。

如果奇迹般地， $g'(p)=0$ 和 $g''(p)=0$ 都成立，那么误差传播将更加惊人： $e_{k+1} \approx \frac{g'''(p)}{6}e_k^3$ 这是三次收敛，其中正确数字的位数在每一步都会增加两倍。收敛阶由 $g(x)$ 在不动点处的第一个非零导数决定。

万能钥匙：统一牛顿法

实现 $g'(p)=0$ 只是一个白日梦吗？完全不是。这正是使科学界最著名的算法之一——牛顿法——如此强大的根本原理。

用于求解 $f(x)=0$ 的牛顿法使用迭代式 $x_{k+1} = x_k - \frac{f(x_k)}{f'(x_k)}$ 。仔细看，这正是一个不动点迭代！迭代函数是 $g(x) = x - \frac{f(x)}{f'(x)}$ 。让我们看看是什么让它如此特别。我们计算它的导数： $g'(x) = 1 - \frac{f'(x)f'(x) - f(x)f''(x)}{[f'(x)]^2} = \frac{f(x)f''(x)}{[f'(x)]^2}$

那么，这个导数在解 $p$ 处（即 $f(p)=0$ ）的值是多少？ $g'(p) = \frac{f(p)f''(p)}{[f'(p)]^2} = \frac{0 \cdot f''(p)}{[f'(p)]^2} = 0$ （假设 $f'(p) \neq 0$ ，即它是一个单根）。

这是一个惊人的结果。牛顿法并非某种不相关的技巧；它是一种被专门设计来使其迭代函数的一阶导数在根处为零的不动点迭代。这就是它为何具有二次收敛性的原因。这个统一的原理揭示了看似不同的数值方法之间的深层联系，并凸显了不动点框架的优雅。同样的想法甚至可以推广到求解多变量方程组，其中导数被一个称为雅可比矩阵的偏导数矩阵所取代。

实践附言：知道何时停止

我们的迭代之旅终须结束。一种自然的停止方式是检查我们是否已经停止移动：当连续步骤之间的距离 $|x_{k+1} - x_k|$ 小于某个微小的容差时，我们终止迭代。但正如我们在振荡迭代 $g(x)=1-x$ 中看到的那样，这并非万无一失。迭代值可以在 0 和 1 之间跳跃，所以差值总是 1，算法会永远运行下去，永远无法满足停止准则。这就是为什么任何稳健的数值算法都必须包含一个安全网：一个最大迭代次数。如果方法在合理的步数内没有收敛，我们就停止它并报告出了问题。这是一种最终的、谦逊的承认：即使我们最优雅的数学路径有时也会把我们引向歧途，而知道何时放弃寻找是明智的。

应用与跨学科联系：回声室中的宇宙

我们已经探讨了不动点迭代的机制，一个极其简单的想法：获取一个输入，应用一个函数，然后将输出作为下一个输入反馈回去。就像回声室里的声音一样，这个过程不断重复，声音来回反弹，直到它稳定下来，成为一个稳定不变的音调。这个最终的、稳定的状态就是不动点。既然我们理解了“如何做”，让我们踏上一段旅程，去发现“在哪里”和“为什么”。你会惊讶地发现，这种自我参照和收敛的简单概念不仅仅是一个数值上的奇闻；它是一个编织在数学、工程学、计算机科学甚至经济学结构中的基本模式。它是理解平衡系统的一个统一原则。

从数学奇观到工程解决方案

让我们从一个纯粹的、近乎异想天开的问题开始。是否存在一个数，它恰好等于自身的余弦？也就是说，我们能否找到方程 $x = \cos(x)$ 的解？这不是一个用高中代数就能解的方程。然而，只需从一个猜测——任何猜测——开始，并重复应用余弦函数，我们就能创建一个序列，它会毫不留情地盘旋逼近一个唯一的答案，一个约为 $0.739...$ 的神秘数字，通常被称为多蒂数（Dottie number）。不动点迭代为通向这个完美自我映射的点提供了一条直接而优雅的路径。

这远不止是一个派对戏法。科学和工程领域核心的许多问题，都涉及到像我们的余弦问题一样无法通过简单重排求解的方程。考虑一下预测细长柱在重载下何时会屈曲的挑战。植根于 Euler 工作的结构稳定性理论，导出了一个将临界载荷与柱的属性联系起来的“超越方程”。对于某些支撑条件，这个方程可能看起来像 $\tan(\beta) = \alpha/\beta$ ，其中 $\alpha$ 是一个已知的刚度参数，而 $\beta$ 是我们必须找到以计算屈曲载荷的未知数。同样，没有简单的方法可以分离出 $\beta$ 。但通过将其重构为一个不动点问题，例如 $\beta = \arctan(\alpha/\beta)$ ，我们就可以运用我们的迭代方法来找到临界值。

当然，简单的回声室有时需要很长时间才能安静下来。当收敛缓慢时，我们可以做得比被动倾听更好。像 Steffensen 加速法这样的方法就像一个智能音响工程师，通过听前几个回声来预测它们最终会稳定在哪里，然后直接跳到那个点。这极大地加快了寻找不动点的速度，将一个缓慢收敛的过程转变为一个二次快速收敛的过程。

现代计算的宏伟机器

当我们从单个方程转向支撑现代科学的庞大系统时，不动点迭代的真正威力就显现出来了。许多物理现象，在为计算机进行离散化后，会产生包含数百万甚至数十亿个线性方程的系统，简洁地写为 $A\mathbf{x} = \mathbf{b}$ 。

直接求解如此庞大的系统在计算上通常是不可能的。取而代之的是，我们转向迭代方法。其中最著名的两种方法，雅可比法和逐次超松弛(SOR)法，无非是高维空间中的不动点迭代。系统 $A\mathbf{x} = \mathbf{b}$ 被重写为 $\mathbf{x} = T\mathbf{x} + \mathbf{c}$ 的形式，然后我们进行迭代： $\mathbf{x}^{(k+1)} = T\mathbf{x}^{(k)} + \mathbf{c}$ 。每一次迭代都会“按摩”整个未知数向量，使其越来越接近最终解。不动点概念为这一整类强大的算法提供了一个通用的框架。

也许最著名的现代应用是谷歌的 PageRank 算法，这个引擎首次驯服了万维网那无序的混乱。其核心思想是绝妙的自指：一个网页的重要性由链接到它的网页的重要性决定。这定义了一个巨大的、相互关联的系统，其中每个页面的“排名”是其邻居排名的函数。这种关系可以表示为一个巨大的不动点方程： $\mathbf{x} = \alpha P \mathbf{x} + (1-\alpha) \mathbf{v}$ ，其中 $\mathbf{x}$ 是所有 PageRank 分数的向量。这个“声望流”的稳定平衡点，也就是解，是通过简单的不动点迭代找到的。每当你进行一次谷歌搜索，你都在享受着一个在拥有数十亿个节点的图上找到的不动点所带来的好处。

模拟变化世界中的动力学

宇宙处于永恒的运动之中，由微分方程的语言所描述。但是，我们如何能确定像 $\frac{dy}{dt} = f(t, y)$ 这样的微分方程确实有解呢？法国数学家 Émile Picard 使用不动点迭代给出了一个深刻的答案。他证明了微分方程可以转化为一个等价的积分方程， $y(t) = \int_0^t f(s, y(s)) ds + y_0$ 。这具有 $y = \mathcal{T}(y)$ 的形式，其中 $\mathcal{T}$ 是一个算子，它接受一个函数（整个解的路径）并将其映射到一个新的函数。

从对解的一个粗略猜测开始，比如 $y_0(t) = 0$ ，并重复应用积分算子 $\mathcal{T}$ ，Picard 迭代生成一个函数序列 $y_1(t), y_2(t), \ldots$ ，收敛到真实解。这不仅是一种计算技巧；它还是一个构造性的证明，证明了唯一解的存在，构成了常微分方程理论的基石。

在实践中，当我们模拟航天器的轨道或化学反应的演变时，我们使用数值方法来步进时间。虽然简单的“显式”方法易于实现，但它们可能不稳定。通常需要更稳健的“隐式”方法，如后向欧拉法。一个隐式步骤由一个像 $y_{n+1} = y_n + h f(t_{n+1}, y_{n+1})$ 这样的方程定义。请注意，未知值 $y_{n+1}$ 出现在等式两边！即使只是为了在时间上向前迈出一步，我们也必须在那一刻为 $y_{n+1}$ 求解一个不动点问题。在这里，我们的迭代法成为更大型模拟中一个必不可少的工具，一个为了追踪动态系统演化而必须被调用数千次的子程序。

平衡的逻辑：从管道到人

对平衡的探索不仅限于数学和物理学；它也是工程学和社会科学的核心主题。

考虑一位设计管道的工程师。决定压力损失的达西摩擦系数 $f$ 取决于流体的速度。但反过来，速度又由压力损失决定。这个鸡生蛋还是蛋生鸡的问题被隐含的 Colebrook-White 方程所捕捉。工程师必须找到与它产生的流量相一致的 $f$ 值——他们必须找到系统的不动点，以便正确地确定泵和管道的尺寸。

令人惊讶的是，同样的逻辑也适用于人类互动。在经济学中，纳什均衡描述了一种稳定的社会状况，其中考虑到其他所有人的行为，没有个体有动机改变自己的行为。考虑一个场景，几个人可以为一个公共物品做出贡献。每个人的最优贡献量取决于其他人贡献的总量。均衡是一种状态，其中每个人的贡献都是对总量的“最佳响应”。这种均衡状态是集体最佳响应函数的一个不动点，它可以通过一个迭代过程找到，在这个过程中，参与者（或模拟他们的计算机）反复调整他们的策略，直到没有人希望改变。

在计算工程的前沿，不动点迭代协调着多物理场模拟的复杂舞蹈。想象一下模拟风吹动旗帜。这是一个流固耦合（FSI）问题。气压使旗帜变形，但旗帜的新形状立即改变了空气的流动。为了解决这个问题，分区方法在两个独立的求解器之间建立了一种“对话”：一个流体求解器和一个结构求解器。流体求解器计算当前旗帜形状上的压力，并将其传递给结构求解器。然后，结构求解器计算由该压力产生的新形状，并将其传回。这种来回交互是关于界面形状的不动点迭代。它持续进行，直到形状和压力相互一致——直到它们收敛到一个不动点，即流体和结构之间的完美平衡。

从最抽象的数字到最切实的工程挑战，从互联网的结构到社会均衡的结构，不动点迭代法揭示了自己不仅仅是一种算法。它是一个深刻而统一的原则，描述了任何通过自我反思过程找到平衡的系统。