黄金分割搜索

玻尔百科

定义

黄金分割搜索是一种利用黄金比例来寻找单峰函数最小值的数值优化技术。该方法属于计算数学领域，其核心机制是在初始设置后每次迭代仅需进行一次新的函数评估，使其在处理高精度任务时具有对数级的时间复杂度。它在工程参数调节、计算金融模型校准以及机器学习超参数优化中有着广泛的应用，并常被用作多维优化算法中的线搜索子程序。

核心要点

黄金分割搜索利用黄金比例来高效地找到单峰函数的最小值，在初始设置后每次迭代仅需一次新的函数求值。
该方法展示了对数成本扩展的力量，使其比暴力（线性搜索）方法效率高出指数级别，尤其是在高精度任务中。
它在许多多维优化算法中充当关键的“线搜索”子程序，用于确定在给定方向上应采取的最佳步长。
通过结合平均或使用中位数等统计技术来处理噪声测量，可以使基础算法在实际应用中更加稳健。
它具有广泛的实际应用，包括工程中的参数调优、计算金融中的模型校准以及机器学习中的超参数优化。

引言

寻找“最佳”设置——最小误差、最低成本、最稳定配置——是贯穿科学和工程领域的一项基本追求。虽然简单的暴力搜索看似直接，但它往往效率惊人地低下，即使是对于精度要求不高的结果，也会消耗大量计算资源。这就提出了一个关键问题：是否存在一种更智能的方法来寻找函数的最小值，而无需详尽地检查每一种可能性？

本文介绍了黄金分割搜索，一种为这个问题提供了响亮“是”的优雅而强大的算法。它深入探讨了该方法背后的数学之美，展示了对效率的简单要求如何直接引出了著名的黄金比例。您不仅将学习该算法如何工作，还将了解为什么它比那些朴素的方法有效得多。本文的结构旨在引导您从核心理论走向实际应用。“原理与机制”一章将剖析该算法，将其对数效率与线性方法进行对比，并探讨为处理现实世界中混乱数据而进行的稳健性改造。随后，“应用与跨学科联系”一章将揭示该方法在哪些领域大放异彩，从作为复杂优化程序的引擎，到成为工程、金融和机器学习领域的主力军。

原理与机制

想象一下，你正站在一个狭长山谷中，四周弥漫着浓雾。你的任务是找到绝对的最低点。你无法一次看到整个山谷，但你有一个非常精确的高度计。你可以走到任何一点并测量其海拔高度。用最少的耗时测量次数找到谷底的最智能方法是什么？这个听起来简单的谜题是科学和工程领域中一大类问题的核心，从寻找分子的最稳定形状到调整金融模型的参数，我们都在寻找最小值。

暴力推进及其谬误

最直接的想法是沿着山谷前进，以固定的间隔——比如每十米——进行一次海拔测量。你记下所有的海拔高度，然后简单地选择读数最低的位置。这被称为均匀采样。它感觉系统而安全，但效率却惊人地低下。

假设你的山谷长1公里，你需要以1米的精度定位谷底。要用均匀采样来保证这一点，你需要将山谷分成宽度不超过1米的路段。这将需要你停下来进行大约1001次测量！如果每次测量都是一个需要20分钟的复杂计算机模拟，你将需要等待近两周。正如问题所阐述的，这种暴力方法的成本与你要求的精度成线性关系。如果你想要十倍的精度，你就需要进行十倍的测量。一定有更好的方法。

包围的艺术

如果我们能对我们的山谷做一个简单的假设：它是单峰的，那么一个更聪明的策略就出现了。这是一个描述简单形状的专业词汇——它只有一个最低点，然后回升。沿途没有更小的山丘或洼地。现实世界中大多数表现良好的问题都具有这种特性，至少在我们关心的解附近是这样。

对于一个单峰的山谷，我们可以“包围”最小值。想象一下，你找到了三个点，我们按顺序称它们为 $x_1$ 、 $x_2$ 和 $x_3$ ，它们位于谷底，并且中间点是三者中最低的： $f(x_2) \lt f(x_1)$ 并且 $f(x_2) \lt f(x_3)$ ，其中 $f(x)$ 是点 $x$ 的海拔高度。这告诉我们什么呢？它保证了山谷的真正谷底 $x^{\star}$ 必定位于 $x_1$ 和 $x_3$ 之间。为什么？因为要从 $x_1$ 较高的海拔下降到 $x_2$ ，再回升到 $x_3$ 较高的海拔，山谷的坡度必须从负变到正。而在其间的某个地方，它必定是完全平坦的——那就是谷底，即 $f'(x^{\star})=0$ 的点。这个基本见解可以通过微积分中的中值定理进行严格证明，是所有包围方法的基础。现在我们已经将最低点困在一个更小的区间 $[x_1, x_3]$ 内。

我们现在的目标是尽可能高效地缩小这个包围区间，直到它变得微小。

可重用的发现： $\phi$ 的魔力

为了缩小包围区间 $[a, b]$ ，我们需要巧妙地选择两个新的内部点，我们称之为 $c$ 和 $d$ ，并测量它们的海拔高度。假设我们发现 $f(c) f(d)$ 。由于山谷是单峰的，谷底不可能在 $d$ 的右侧。所以，我们新的、更小的包围区间就变成了 $[a, d]$ 。如果我们发现 $f(c) f(d)$ ，我们新的包围区间就会是 $[c, b]$ 。无论哪种情况，我们都缩小了不确定性的区间。

但这里一个真正绝妙的想法发挥了作用。我们搜索中最昂贵的部分是测量海拔，即函数求值。在每一步，我们都必须执行两次新的求值，即 $f(c)$ 和 $f(d)$ 。但真的必须这样吗？

如果我们能以某种几何上的巧妙方式放置我们的点 $c$ 和 $d$ ，使得在区间缩小后，其中一个旧的内部点恰好能成为下一次迭代中新的内部点之一呢？如果我们能做到这一点，我们每一步就只需要进行一次新的函数求值，而不是两次。这将使我们的工作量减少近一半！

让我们追寻这个想法，正如问题中所探讨的。想象一下我们的区间 $[a,b]$ 长度为 $L$ 。让我们对称地放置点。我们将 $d$ 放置在距离 $a$ 为 $\tau L$ 的位置，将 $c$ 放置在距离 $b$ 为 $\tau L$ 的位置。新区间的长度将是 $\tau L$ 。现在，假设我们保留区间 $[a,d]$ 。它的新长度是 $L'=\tau L$ 。保留在内部的点是 $c$ 。为了让我们的技巧奏效，这个旧点 $c$ 必须位于新区间 $[a,d]$ 的某个神奇位置上。一个仔细的几何论证表明，只有当比率 $\tau$ 满足方程 $\tau^2 + \tau - 1 = 0$ 时，这种重用才可能实现。

解这个方程得到 $\tau = \frac{\sqrt{5}-1}{2} \approx 0.618...$ 。这个数字很著名！它是黄金比例 $\phi = \frac{1+\sqrt{5}}{2} \approx 1.618...$ 的倒数。这并非巧合；这是我们对最高效率要求的数学结果。这个策略，源于重用测量的简单想法，就是黄金分割搜索。在每一步，我们将不确定性区间缩小一个因子 $\tau \approx 0.618$ ，而我们只需要进行一次新的函数求值（在最初设置两个点之后）。

优秀算法的惊人力量

让我们回到我们1公里长的山谷和1米精度目标的问题上。暴力方法需要1001步。黄金分割搜索需要多少步呢？我们从一个1000米的区间开始，在每一步都将其缩小一个因子 $0.618$ 。我们需要找到步数 $n$ ，使得 $1000 \times (0.618)^n \le 1$ 。解法涉及对数：步数不是随长度比率增长，而是随该比率的对数增长。

结果是惊人的。正如在问题的背景下计算的那样，要达到 $10^{-3}$ 的精度（就像我们在1公里中寻找1米），黄金分割搜索只需要16次函数求值。十六次！与暴力推进的1001次求值相比。这不仅仅是好一点；这是一个效率上的不同世界。对于非常高精度的任务，其差异可能是几分钟与几千年的计算时间。这就是线性和对数成本扩展之间的区别，这是计算机科学中的一个基石概念。

应对混乱的世界

然而，世界并非总是一个完美的单峰山谷。一个真正有用的算法必须足够稳健，以处理现实的混乱。

首先，确定方位：包围阶段

如果我们的初始包围区间猜错了，真正的最小值甚至不在其中怎么办？包围方法需要……一个包围区间。寻找这个初始包围区间的过程被称为包围阶段。问题中讨论了一个非常优雅的策略，那就是再次使用黄金比例。你从一个小的猜测开始，检查斜率，然后沿着下坡方向“跳跃”出去，每次跳跃的距离都按一个因子 $\phi$ 增大。这种几何级的扩张会迅速放大搜索范围，直到你越过“谷底”，成功建立一个包围区间，而这个区间本身就是为开始黄金分割搜索而完美设置的。

抚平颠簸：处理粗糙的地形

如果潜在的山谷是平滑的，但地面上覆盖着小石块和坑洼怎么办？我们的函数可能看起来像 $f(x) = (\text{平滑的山谷}) + (\text{小的波动})$ 。如果我们落在了一块小石子的错误一侧，我们的比较 $f(c) f(d)$ 可能会产生误导，并使我们的搜索走向错误的方向。

正如问题中所探讨的，解决方案不是用放大镜看地面，而是要看更宏观的趋势。我们可以预平滑函数。一种强大的技术是移动平均：我们不使用点 $x$ 的海拔，而是使用 $x$ 周围一个小窗口内的平均海拔。如果我们巧妙地选择这个窗口的宽度，使其与波动的典型波长相匹配，我们就可以完全滤除它们，揭示出下面纯净的、单峰的山谷。然后搜索就可以在这个平滑、理想化的地形上进行。

不要相信单个小妖精：统计的智慧

另一个现实世界的问题是测量误差。如果我们的高度计有故障怎么办？想象一下，它有很小的概率会给出一个完全错误的读数——一个伪离群值。这样一个单一的错误就可能使我们丢弃山谷的正确部分，让我们的搜索陷入一场徒劳的追逐。

正如问题和所揭示的，解决方案是引入统计学的力量。不要相信单一的测量！

如果你怀疑是随机噪声（比如你读表盘时手在抖），就在同一点进行多次测量并取其平均值。平均值将是对真实海拔更可靠的估计，因为随机误差往往会相互抵消。
如果你怀疑是偶发的、大的离群值（机器里的“小妖精”），那么平均值不是一个好主意——一个巨大的值就能破坏它。相反，进行三次测量并使用中位数（中间值）。中位数非常稳健；它完全忽略了那个单一的异常离群值。

通过用稳健的统计比较代替简单的 $f(c)$ 与 $f(d)$ 的比较，我们可以使我们的算法对现实世界数据中固有的噪声具有弹性，代价是每步多几次求值。

知道何时停止

最后，我们的包围区间需要多小才能宣布胜利？

最常见的停止准则就是当包围区间的长度 $|b_n - a_n|$ 小于某个期望的容差 $\varepsilon$ 时。这个容差通常由问题的物理约束决定，或者有趣的是，由计算机本身的限制决定。计算机无法表示所有实数；它们之间存在有限的间距。一个明智的目标是继续搜索，直到我们的包围区间小于这个基本分辨率，从而保证它最多包含一个可表示的数字。对于标准的12位表示，这仅需18次迭代。

然而，有时我们更关心函数值 $f(x^{\star})$ ，而不是确切的位置 $x^{\star}$ 。如果我们有关于函数形状的额外信息——例如，如果我们知道“谷壁”有多陡峭——我们就可以创建一个更智能的停止规则。通过分析我们找到的海拔高度与陡峭程度之间的关系，我们可以为我们距离真正谷底有多远设定一个有保证的界限。这使我们能够在找到的值足够好时立即停止，这可能比仅仅将区间缩小到任意大小更有效。

从一个在雾中山谷里的简单探索，我们发现了一个具有深远力量和优雅的原理。黄金分割搜索向我们展示了对效率的简单要求，在逻辑上追求时，如何引出一个深刻的数学常数。它展示了对数算法相对于线性算法的巨大威力。并且，通过深思熟虑的修改，它提供了一个稳健而实用的工具，用于驾驭真实问题中混乱、嘈杂和有限的世界。

应用与跨学科联系

在我们走过黄金分割搜索的原理之旅后，你可能会留下一个印象，认为它是一个整洁、巧妙的数学技巧。或许是一个美丽的奇珍，但它在现实世界中究竟存在于何处？事实证明，答案是无处不在。寻找“恰到好处”不仅是数学中的基本追求，也贯穿于科学、工程甚至金融领域。如果你正在转动的那个“旋钮”控制的不是收音机的音量，而是行星探测器的轨迹、金融衍生品的价格，或者人工智能的智能水平，那会怎样？正是在这里，黄金分割搜索的简单优雅绽放成为一个强大、不可或缺的工具。让我们来一次巡礼，看看它出人意料的广阔领域。

现代算法的核心：线搜索

想象一个徒步旅行者在广阔、丘陵地带的浓雾中迷路，试图找到山谷中的最低点。这是许多优化算法面临的挑战。它们的世界是一个高维的数学“景观”，它们试图找到一个函数的最小值。一种常见的策略，称为梯度下降，很简单：从你当前的位置，确定最陡峭的下坡方向并迈出一步。

但这提出了一个关键问题：那一步应该迈多大？步子太小，你会以冰川般的速度向谷底爬行。步子太大，你可能会完全越过谷底，最终到达对面山坡上比你出发时更高的地方。这个子问题——沿着选定的方向找到最佳步长——被称为线搜索。它本质上是一个一维优化问题。而对于这个问题，黄金分割搜索是一个明星选手。

虽然简单的二分搜索可以找到一个能让情况变好的步长，但黄金分割搜索是一个远为复杂和高效的工具，用于精确锁定最佳步长——那个能带你到该方向上最低点的步长，从而最大限度地利用你选择的路径。这种效率在困难的地形中尤其关键，例如那些有狭长、蜿蜒山谷的地形。在这些场景中，一个朴素的方法可能会在山谷壁上低效地之字形下降，而一个配备了良好线搜索的算法则可以沿着谷底迈出长而自信的步伐，极大地加速到达最小值的旅程 [@problem-id:3161560]。当然，这种强大的技术依赖于一个简单而通常优美的假设：沿着所选线路的路径是单峰的，意味着它只下降到一个单一的最小值然后回升。

工程与设计：塑造我们的物理世界

从算法的抽象领域，我们现在转向工程的实体世界。在这里，参数不仅仅是计算机中的数字，而是对应于物理属性、尺寸和控制。

考虑一个机械臂的设计。工程师可能有一个单一的控制参数，用于调整臂的运动轨迹。目标是找到该参数的精确值，以最小化轨迹误差——臂的预定路径与其真实运动之间的差异。将该参数与误差联系起来的函数可能很复杂，源于电机、摩擦和惯性的相互作用，并且可能没有简单的解析导数。这是黄金分割搜索的完美应用场景。通过简单地编程让机械臂以不同的参数设置执行其任务，并测量由此产生的误差，该算法可以智能地、自动地微调系统以达到最高精度。

同样的原理也适用于计算机辅助设计（CAD）领域。想象一位汽车设计师正在勾勒汽车挡泥板流畅的曲线。出于美学和空气动力学的原因，设计师可能想知道最大“弯曲度”或曲率的确切点。这个点可能是高应力点或设计的关键特征。曲率可以表示为沿着曲线追踪的参数 $t$ 的函数 $\kappa(t)$ 。找到最大曲率点是一个优化问题。通过简单地搜索 $-\kappa(t)$ 的最小值，黄金分割搜索可以沿着曲线扫描并精确定位弯曲最剧烈的点，为设计师提供关键反馈。

金融与机器学习的引擎：参数校准

也许当今一维搜索最具影响力的应用是在数据驱动的金融和机器学习领域，它在其中充当模型校准和超参数调优的核心引擎。

在计算金融中，像著名的布莱克-斯科尔斯方程这样的模型被用来为金融期权定价。这些模型依赖于几个参数，其中之一是波动率（ $\sigma$ ），衡量股票价格预期波动的程度。这个参数无法直接观察到；它必须从市场数据中推断出来。这个过程，称为“校准”，变成了一个优化问题： $\sigma$ 的哪个值能使我们的模型预测的价格与市场上实际交易的期权价格最匹配？我们定义一个误差函数（如均方误差），介于模型的输出和市场的现实之间，然后我们搜索最小化这个误差的 $\sigma$ 。黄金分割搜索正是完成这项任务的稳健且广泛使用的主力工具。

一个几乎相同的故事在机器学习中展开。当我们训练像支持向量机（SVM）这样的模型时，我们必须事先设置某些“旋钮”。这些不是模型从数据中学到的参数，而是控制学习过程本身的高级设置。它们被称为超参数。对于一个带有径向基函数（RBF）核的SVM，一个关键的超参数是核宽度，它也恰好用 $\sigma$ 表示。对 $\sigma$ 的一个坏选择会导致一个差的模型，而一个好的选择可以产生出色的结果。我们如何找到最佳值？我们无法预先知道。所以，我们尝试一个值，训练模型，并在一个单独的验证数据集上测量其性能。这给了我们损失函数上的一个点。目标是找到导致最小损失的 $\sigma$ 。我们可以使用黄金分割搜索来智能地导航可能的 $\sigma$ 值空间，而不是在暴力网格搜索中盲目尝试数百个值，从而用少得多的昂贵训练周期找到一个近乎最优的设置。

高级策略：搜索的艺术

最后，黄金分割搜索不仅可以作为独立工具，还可以作为更复杂优化策略中的基本构建块，这证明了其力量和优雅。

考虑这样一种情况，你正在调整的参数可能合理地是 $0.001$ 、 $1.0$ 或 $1000$ 。该参数跨越了几个数量级。标准的线性搜索在这里效率极低；它会花费大部分时间在一个它应该飞跃的区域里迈着小步。一个绝妙的视角转变是，不是对参数 $x$ 本身进行搜索，而是对其对数 $y = \ln(x)$ 进行搜索。在 $y$ 空间中的均匀搜索对应于在原始 $x$ 空间中的乘法或对数搜索。这个优雅的数学技巧将寻找正确数量级的问题转化为一个简单的、行为良好的线性搜索，而黄金分割搜索再次在这里大放异彩。

对于那些不是单峰的函数，即有许多山谷的地形，该怎么办？单个黄金分割搜索会陷入它找到的第一个山谷。一个更全局的方法是使用“多起点”策略，就像派出多个独立的搜索队。但如果你的资源（你的函数求值预算）有限，你可以做得更好。你可以设计一个智能策略，将更多的精力分配给最“有希望”的山谷——那些已知很深的山谷，或者那些仍然宽阔且不确定，以至于可能隐藏着更深最小值的山谷。在这种高级策略中，黄金分割搜索充当每个搜索队的本地专家，探索其分配的山谷，而一个更高级别的策略则指导整体的努力。这说明了黄金分割搜索是如何成为现代全局优化机制中至关重要的组成部分。

从其源于古老几何比例的简单核心，黄金分割搜索浮现为一条统一的线索，将算法的抽象世界与工程的实体产品、金融的预测模型以及人工智能的智能系统联系起来。它深刻地展示了一个简单、美丽的想法如何能对我们的世界产生深远而强大的影响。

黄金分割搜索

引言

原理与机制

暴力推进及其谬误

包围的艺术

可重用的发现：ϕ\phiϕ 的魔力

优秀算法的惊人力量

应对混乱的世界

首先，确定方位：包围阶段

抚平颠簸：处理粗糙的地形

不要相信单个小妖精：统计的智慧

知道何时停止

应用与跨学科联系

现代算法的核心：线搜索

工程与设计：塑造我们的物理世界

金融与机器学习的引擎：参数校准

高级策略：搜索的艺术

黄金分割搜索

引言

原理与机制

暴力推进及其谬误

包围的艺术

可重用的发现：ϕ\phiϕ 的魔力

优秀算法的惊人力量

应对混乱的世界

首先，确定方位：包围阶段

抚平颠簸：处理粗糙的地形

不要相信单个小妖精：统计的智慧

知道何时停止

应用与跨学科联系

现代算法的核心：线搜索

工程与设计：塑造我们的物理世界

金融与机器学习的引擎：参数校准

高级策略：搜索的艺术

可重用的发现： $\phi$ 的魔力

可重用的发现： $\phi$ 的魔力