拥挤距离

玻尔百科

核心要点

拥挤距离是多目标优化中使用的一种度量，用于量化帕累托前沿上一个解周围的“活动空间”，从而促进多样性。
在 NSGA-II 算法中，拥挤距离作为一种打破平局的机制，从同一个非支配前沿中选择不那么拥挤的解，以保留广泛的权衡范围。
在高维多目标问题中，拥挤距离的有效性会降低，因为此时大多数解都成为非支配解，该度量失去了其区分能力。
在工程领域之外，拥挤距离被抽象地应用于材料科学等领域，通过衡量潜在解之间的差异性来促进创新。

引言

在从工程到经济学的无数设计和优化挑战中，我们面对的不是单一目标，而是多个相互冲突的目标。当“最佳”是成本、性能和安全性之间的权衡时，我们如何找到“最佳”解？答案不在于单个点，而在于一组被称为帕累托前沿的最优折衷方案。然而，优化算法面临的一个重大挑战不仅是找到这些优越的解，还要确保它们能代表所有可能的权衡，避免陷入解空间的某个单一区域。本文旨在解决多样性这个根本问题。接下来的章节将首先揭示拥挤距离这一优雅的概念，探讨其核心原理及其在著名的 NSGA-II 算法中的计算方法。随后，我们将遍览其多样化的应用，从实际的工程设计问题到其在计算科学中作为创新驱动力的抽象应用，揭示其作为智能搜索普适原则的力量。

原理与机制

想象一下，你正在一个工程博览会上担任评委。一名学生展示了一种非常便宜但寿命平平的电池。另一名学生展示了一种寿命极长但非常昂贵的电池。第三名学生提供了一种价格合理且寿命尚可（但并非最佳）的设计。哪一个是“最好的”？这个问题本身就有问题。不存在唯一的“最好”，而是一系列最优的权衡。廉价电池在其成本上是最好的，而长寿命电池在其寿命上是最好的。两者之间没有绝对的优劣之分。

这一系列最优权衡的集合，就是数学家和计算机科学家所称的帕累托前沿，或一组非支配解。在设计的复杂世界里，无论是电池、飞机还是药物，我们都不断面临多个相互冲突的目标。我们可能希望最小化成本（ $f_1$ ），同时也要最小化过热风险（ $f_2$ ）。如果一个解在不使其他目标变差的情况下无法改进任何一个目标，那么它就是非支配的。所有这些非支配解的集合构成了帕累-托前沿。

这给任何优化算法都带来了有趣的挑战。一旦算法找到了一个由这些非支配解组成的良好集合，它就基本上确定了工程权衡中的“杰作”。但是，如果我们需要从中选择一个较小的群体，以便在下一代搜索中继续优化，我们该选择哪些呢？如果我们随机选择，可能会偶然选到一堆非常相似的设计——比如，都是廉价但短命电池的变体——从而完全丢失了关于长寿命设计的信息。我们辛辛苦苦找到的丰富权衡就会丢失。因此，问题不仅在于找到好的解，还在于确保它们之间的多样性。

衡量稀疏性：拥挤度的概念

我们如何以一种有原则的方式鼓励多样性呢？目标是偏好那些位于目标空间中“不那么拥挤”区域的解。我们需要一种方法来量化这种拥挤程度。这就是拥挤距离背后优美而简单的思想。我们不是从绝对意义上衡量一个解的质量，而是衡量它的“活动空间”——即它与帕累托前沿上最近邻居之间的空间有多大。

要像物理学家那样从头创造这样一种度量，我们应该要求它具备某些性质。首先，该度量应该是局部的；一个解的拥挤程度只应取决于其直接邻居，而与前沿上远处的解无关。其次，它应该是可加的；总的活动空间应该是它在每个目标维度上所占空间的总和。但第三个性质最为关键：尺度不变性。

想象一下，我们的目标是电池成本（ $f_1$ ，以美元计，范围从 $100$ 到 $180$ ）和失效率（ $f_2$ ，一个无量纲值，范围从 $0.005$ 到 $0.08$ ）。如果我们简单地以原始单位测量邻居之间的差距并相加，那么数值范围较大的成本目标将完全主导计算。我们的多样性度量将几乎完全忽略失效率轴上的间距。这将是一场灾难，因为我们仅仅因为单位不同就忽略了设计权衡的一个关键方面。

解决方法既优雅又至关重要：归一化。我们可以通过缩放每个目标的贡献来使度量变得公平。对于任何给定的目标，我们将邻居之间的差距除以该目标在整个前沿上的总范围。这个简单的除法操作使每个贡献都变得无量纲，将所有目标置于平等的地位。这是实现平衡和无偏见的多样性评估的关键。

公平性的秘诀：拥挤距离的计算

非支配排序遗传算法 II (NSGA-II) 为计算拥挤距离提供了一个清晰的流程。一旦理解了这个过程，其内在逻辑便不言自明。让我们以一个前沿上的一组非支配解为例，逐步进行说明。

独立处理：对每个目标（比如“成本”），我们暂时忽略所有其他目标。我们取出所有的解，并按照成本从低到高进行排序。
保护极端解：这个排好序的列表中位于两端的两个解——即在此前沿上成本绝对最低和绝对最高的解——是特殊的。它们是界定我们已知权衡空间边界的哨兵。为确保它们被保留下来，我们赋予它们一个特殊地位：无限大的拥挤距离。这保证了它们在任何基于多样性的选择中都会被优先考虑。
测量局部间隙：对于任何“内部”解（即不位于两端的解），我们在排序列表中找到它的两个直接邻居。我们的解在这个维度上的局部“空间”是其右侧邻居的成本减去其左侧邻居的成本。这为我们提供了围绕该点的“长方体”在这个轴上的尺寸。
归一化：我们将这个间隙除以前沿上成本的总范围（最大成本减去最小成本）。这样就得到了一个无量纲的数，通常在 0 和 1 之间，代表这个单一目标对拥挤度的归一化贡献。
求和：我们对每一个目标（成本、寿命、温度等）重复步骤 1-4。然后，对于每个解，我们将其在所有目标上的归一化间隙贡献相加。这个最终的和就是它的拥挤距离。

让我们看一个简单的例子。假设我们有一个点 $C$ ，对于第一个目标成本（ $f_1$ ），它的邻居是 $B$ 和 $D$ 。前沿上成本的总范围是 $f_{1}^{\text{max}} - f_{1}^{\text{min}} = 40$ 。邻居的成本分别是 $f_1(B) = 190$ 和 $f_1(D) = 210$ 。成本对 $C$ 的拥挤距离的贡献是 $\frac{210 - 190}{40} = \frac{20}{40} = 0.5$ 。如果对于第二个目标寿命（ $f_2$ ），它的邻居同样是 $D$ 和 $B$ （在另一个排序顺序中），其值分别为 $f_2(D)=1500$ 和 $f_2(B)=1800$ ，并且总范围是 $f_{2}^{\text{max}} - f_{2}^{\text{min}} = 600$ ，那么寿命的贡献就是 $\frac{1800 - 1500}{600} = \frac{300}{600} = 0.5$ 。点 $C$ 的总拥挤距离就是 $d_C = 0.5 + 0.5 = 1$ 。

拥挤锦标赛：选择的交响曲

有了每个前沿上解的拥挤距离值，像 NSGA-II 这样的算法如何决定谁能存活到下一代呢？它使用一种称为拥挤比较算子的优雅机制，通常在锦标赛选择中实现。

想象一下，你需要为下一代填充位置。首先，你从最好的非支配前沿（ $F_1$ ）中选择所有个体。如果还有空间，你再从第二个前沿（ $F_2$ ）中选择所有个体，依此类推。这确保了算法总是偏好更好的解，这个过程促进了向真实帕累托前沿的收敛。

有趣的部分发生在当你到达一个前沿，其解的数量超过了你剩余的位置时。假设你还剩下 2 个位置，但下一个前沿，比如 $F_k$ ，有 3 个解： $P_5, P_6, P_7$ 。就支配等级而言，这三个解同样优秀。为了选出最好的两个，我们求助于我们的打破平局的机制：拥挤距离。我们计算这三个解各自的拥挤距离。也许我们发现 $P_5$ 和 $P_7$ 是边界点，拥挤距离为无限大，而 $P_6$ 是一个内部点，拥挤距离为有限值。那么，我们将选择 $P_5$ 和 $P_7$ ，即拥挤距离最大的两个解，以促进多样性。这个简单的规则——先按等级，再按拥挤度——创造了一种美妙的平衡，推动种群既优秀又广泛分布。

地图的边缘：拥挤距离失效之时

这个机制非常有效，但像任何物理模型一样，它有其适用范围。了解其局限性与了解其功能同样重要。

如果我们优化的不是两个目标，而是五个、十个甚至更多目标，会发生什么？这就是高维多目标优化的领域。在这里，一件奇怪的事情发生了。在高维空间中，任何一个解支配另一个解的几率变得非常小。结果，我们种群中几乎所有的解都变成了非支配解！第一个前沿 $F_1$ 膨胀到几乎包含了所有个体。来自非支配关系的主要选择压力消失了，只剩下拥挤距离来完成所有工作。但拥挤距离本身也开始失效。在高维空间中，几乎每个点对于至少一个目标来说都是“边界”点，从而获得无限大的距离分值。而对于少数内部点，空间是如此广阔，以至于几乎每个点都显得“孤单”，它们的拥挤距离变得几乎相同。该度量失去了其区分能力，为多样性而进行的选择也随之失效。

当我们的目标并非真正独立时，会发生另一个微妙的失效。考虑一种电池，其中比能量（ $f_1$ ）和比容量（ $f_2$ ）几乎完全相关，因为电池电压几乎是恒定的。算法以其优美的天真，并不知道这一点。它勤奋地计算来自 $f_1$ 的拥挤度贡献，然后计算一个来自 $f_2$ 的几乎相同的贡献，并将它们相加。它实际上重复计算了相同的底层信息，产生了一种偏见，有利于沿这个冗余维度扩展解，而可能忽略了沿其他更独特目标轴的分布。算法被问题的表示方式所欺骗。

超越拥挤：下一代探索者

这些局限性的发现并未标志着结束，而是一个开始。它激励了社区发明出更巧妙的方法。如果简单、局部的“活动空间”度量失败了，也许我们需要一种更全局、结构化的方法。

这催生了像 NSGA-III 这样的算法，它专为高维多目标问题设计。NSGA-III 不是让解自己定义邻域，而是首先定义一组分布良好的参考方向，这些方向跨越整个目标空间。算法的目标就变成了为每个预定义的参考方向找到一个与之接近的优良解。这就像是主动决定要找到一个在低成本方面是冠军的设计，另一个在长寿命方面是冠军的设计，再一个在两者之间取得特定平衡的冠军设计，等等。这种结构化的方法在高维空间中要稳健得多。此外，它甚至可以通过使用诸如主成分分析（Principal Component Analysis）之类的统计技术，使参考方向与数据中真实的变异轴对齐，从而适应处理相关目标的问题。

从对多样性的简单需求，到拥挤距离的优雅机制，再到其局限性以及超越这些局限的复杂方法，这段历程本身就是科学过程的一个缩影。我们建立一个模型，测试它的极限，在理解其失败的过程中，我们为更深刻、更强大的世界理解铺平了道路。

应用与跨学科联系

“拥挤”这个词描绘了一幅熟悉的画面：密集的人群、星系中的恒星或场景中的物体。在从神经生物学到计算机视觉的许多科学领域中，这个术语正是用来描述这种物理上的密集状态及其带来的挑战。例如，在天文学中，“光度拥挤”指的是当一颗恒星的邻居太近时，测量其光亮的困难，因为它们的光线会混合在一起，污染测量结果。

但是我们一直在探索的拥挤距离完全是另一回事。它不是对一个预先存在状态的被动测量。相反，它是一个主动的原则，是我们给计算机的一个巧妙指令，以帮助它在广阔、复杂的可能性景观中导航。它是一个促进多样性的工具，确保我们在寻找“最佳”答案时，不会忽视那些往往蕴含问题真正秘密的丰富的“良好”答案。让我们踏上一段旅程，看看这个优雅的思想如何在工程、计算机科学乃至抽象的材料发现世界中找到自己的位置。

工程师的困境：打造完美的折衷方案

想象一下，你正在为一款电动汽车设计下一代电池组。你的老板们提出了一系列相互竞争的要求。财务部门希望它尽可能便宜。性能团队希望它在单位重量下能储存尽可能多的能量（高比能量）。安全工程师则坚持要求它在快速充放电过程中不能过热。显而易见，你无法完美地满足所有人的要求。能量密度最高的电池可能需要奇特的材料，从而推高成本，或者它可能会产生更多的热量。非常便宜的电池可能体积庞大或寿命较短。

这是一个典型的多目标优化问题。不存在单一、完美的“最佳”电池。相反，存在着一整个最优解家族，这是一个设计集合，在其中你无法改善一个方面（如成本）而不恶化另一个方面（如性能）。这个无与伦比的权衡家族被称为帕累托前沿。绘制这个前沿是设计过程的真正目标，因为它为工程师提供了一份完整的最佳选择菜单。

但是你如何找到这整个前沿呢？如果你使用一个简单的优化算法，它可能会找到一个好的设计并停在那里，无休止地打磨它，却对其他同样有效的折衷方案视而不见。这时，像非支配排序遗传算法 II (NSGA-II) 这样的算法就派上用场了，它 вооружен拥挤距离的原则。

该算法的工作方式就像一队探索新大陆的探险家。它维持着一个由不同电池设计组成的“种群”。在每一代中，它做两件事。首先，它识别出最好的探险家——那些位于已知地图边缘（非支配前沿）的设计。这是为了收敛施加的压力。但接着是第二个关键步骤：确保多样性。算法会审视前沿上的探险家们，并问：“你们每个周围有多大空间？”一个在权衡图谱中独处一方的设计——比如一个非常便宜但能量低的设计——被认为是宝贵的。一个处于由非常相似的解决方案组成的密集集群中的设计则被认为是多余的。

拥挤距离正是衡量在目标空间（成本、能量、温度）中“孤单”程度的指标。通过给予拥挤距离较大的解更高的生存概率，算法积极地保护了处于极端和帕累托前沿稀疏区域的先驱者。这确保了最终的输出不是一个单点，而是一张分布良好、细节丰富的整个可能性边界的地图，为工程师提供了最终设计的全部选择范围。

同样的原则在无数的学科中回响。在设计能源系统时，我们必须在经济成本和二氧化碳排放之间取得平衡。在建造一个复杂的相控阵天线时，我们必须在信号增益、不必要的旁瓣和结构质量之间进行权衡。在解释地震数据时，地球物理学家寻求一个既能拟合观测数据又不过于复杂或“粗糙”的地球次表层模型。在所有这些情况中，寻找最优折衷方案集合的过程都受到收敛性和多样性双重压力的引导，而拥挤距离则充当了后者的优雅仲裁者。

超越蓝图：普适的搜索原则

你可能会认为这个巧妙的技巧是特定类型“遗传”算法所独有的，但一个基本原则的美妙之处在于其普适性。在其他类型的优化算法家族中，也可以找到使用拥挤来维持多样性的思想。

考虑一种源于自然的不同方法：粒子群优化。在多目标粒子群优化 (MOPSO) 中，搜索是由一群在设计空间中“飞行”的候选解“粒子群”来执行的。每个粒子根据自身的经验和来自粒子群中“领导者”的经验来调整其轨迹。但是谁应该是领导者呢？

我们再次面临同样的困境。如果我们只从帕累托前沿的一个高性能区域选择领导者，整个粒子群会迅速收敛到那里，而忽略了前沿的其余部分。解决方案是维护一个外部存档，记录迄今为止找到的最佳非支配解，并从这个存档中选择领导者。那么如何选择它们呢？通过使用拥挤距离！领导者优先从存档中人口较少的区域——那些拥挤距离高的区域——中选择，从而鼓励粒子群散开并探索整个前沿。即使比喻从进化变成了鸟群，其基本原理是相同的。这是一种智能、分布式搜索的基本策略。

差异性的艺术：抽象空间中的拥挤

到目前为止，我们的旅程一直在工程和科学建模的实践世界中，我们地图的坐标轴是成本、质量或能量等有形的东西。现在，让我们进行一次抽象的飞跃。如果我们不仅可以用拥挤的概念来绘制一个权衡空间，而且可以用它来驱动发现和创新本身的过程呢？

考虑一下计算材料科学的宏大挑战：预测具有理想性质的全新晶体结构。科学家们使用进化算法来探索原子可以排列的无数种方式。这种搜索中的一个主要陷阱是“模式崩溃”。算法可能会发现一个已知的、稳定的结构，如金刚石，然后花费所有的时间来创造它的成千上万个微不足道的变体，而永远不会跃迁到一个完全不同且可能更有趣的结构家族。

在这里，拥挤距离的概念被以惊人的创造力加以应用。我们不是基于性能（如稳定性或硬度）来定义目标，而是可以基于多样性本身来定义它们。利用一种复杂的数学工具——核函数（例如，Smooth Overlap of Atomic Positions，或 SOAP 核函数），我们可以计算任意两个晶体结构之间的“相似性得分”。由此，我们可以定义一个差异性度量 $d(x,y) = 1 - k(x,y)$ ，它衡量了结构 $x$ 与结构 $y$ 的不同程度。

现在是绝妙的转折点：我们将这些差异性视为目标！我们从种群中挑选几个“锚点”结构，然后对于其他每一个结构，我们计算它与每个锚点的差异性。这为每个结构在抽象的“差异性空间”中提供了一个坐标。然后可以指示一个算法找到一组在这个空间中“非支配”的解。并且为了确保良好的分布，它使用了拥挤距离。

在这里，高拥挤距离意味着什么？它意味着一个结构位于这个差异性空间的稀疏区域。换句话说，就相对于锚点而言，它在结构上与同类非常不同。通过偏爱拥挤距离高的个体，算法因其新颖性而受到明确的奖励。它被迫放弃拥挤的、外观相似的结构集群，并冒险进入未知的领域，从而有力地对抗模式崩溃，并增加真正发现的机会。

这就是一个深刻科学原理的真正力量和美妙之处。一个源于平衡相互冲突的工程目标的实际需求的想法，可以被提升到一个纯粹抽象的数学空间中，在那里它成为创造力和创新的直接引擎。这是一个美丽的例证，说明一个简单、直观的概念——给事物一点呼吸的空间——如何在不同的科学技术领域中回响，将它们统一在对知识和发现的共同追求中。