排序的稳定性

玻尔百科

定义

排序的稳定性是指排序算法在处理具有相同键值的记录时，能够保持它们原始相对顺序的特性。这一机制在计算机科学领域为多键值排序提供了简洁的解决方案，也是基数排序等高级算法的核心基石。诸如归并排序等算法天生具有稳定性，而快速排序等不稳定算法在数据库系统、生物信息学和计算几何等应用场景中则需通过辅助手段来实现该特性。

核心要点

稳定的排序算法会保持键值相等的记录的原始相对顺序。
通过先对次要键、再对主要键进行连续排序，稳定性为多键排序提供了一种简单而优雅的解决方案。
像 Merge Sort 这样的算法因其合并逻辑而天然稳定，而不稳定的算法（如 Quicksort）可以通过为其键值增加原始索引来使其变得稳定。
稳定排序是像 Radix Sort 这样的高级算法的关键构件，并且在计算几何、生物信息学和数据库系统中有重要应用。

引言

排序是计算机科学中最基本的操作之一，是一个我们常常认为理所当然的已解决问题。我们对姓名列表、数据表格和信息流进行排序，不假思索。但在这个看似简单的任务中，蕴含着一个微妙而强大的属性：稳定性。当一个排序算法遇到两个或多个它认为“相等”的项时，它会怎么做？是保留它们的原有顺序，还是任意打乱它们？这个问题触及了排序稳定性的核心，这个概念的重要性远远超出了学术好奇心，延伸到了实际的、真实世界的应用中。本文旨在揭开稳定性的神秘面纱，弥补常常导致工程师在数据处理中忽视其关键作用的知识鸿沟。

接下来的章节将引导你深入了解这个重要主题。首先，在“原理与机制”中，我们将通过清晰的例子剖析稳定性的定义，探讨为什么像 Merge Sort 这样的算法天然稳定，而像 Quicksort 这样的算法则不然，并揭示在需要时强制实现稳定性的技术。随后，在“应用与跨学科联系”中，我们将超越纯理论，看看稳定性如何在数据库管理中担当关键角色，成为像 Radix Sort 这样的高级算法的基础，并在计算几何和生物信息学等不同领域成为不可或缺的工具。读完本文，你将不仅理解什么是稳定性，还将明白为什么它是算法世界中最优雅和最具影响力的思想之一。

原理与机制

想象一下，你有一副扑克牌，已经按数字排好序：所有的 A 在一起，所有的 2 在一起，依此类推。现在，你决定再次对这副牌进行排序，这次是按花色：所有的梅花在一起，然后是方块、红心和黑桃。完成后，你看一下红心那一组。这些牌是否仍然保持其原始的数字顺序——A、2、3 等等？还是它们被打乱了，可能变成了 7、2、K、A……？

如果每个花色内部的原始数字顺序得以保留，那么你的排序方法就是稳定的。如果不是，它就是不稳定的。简而言之，这就是排序稳定性的核心思想。这是一个通常不被注意的属性，直到它变得至关重要。稳定性关乎的不是算法是否能正确排序，而是它如何处理平局。当根据排序标准两个项目“相等”时，稳定的算法承诺不会改变它们原始的相对顺序。

稳定性的微妙印记

让我们说得更精确一些。假设一所大学有一个学生记录列表，最初按姓氏的字母顺序排序。我们有成对的 (LastName, Major)：

(Adams, Physics) (Baker, Chemistry) (Chen, Physics) (Davis, Computer Science) (Evans, Chemistry) (Garcia, Physics)

现在，我们仅根据 Major 重新排序这个列表。会发生什么？稳定的排序保证，对于任何两个专业相同的学生，它们在输入列表中的相对顺序在输出列表中得以保留。在我们的例子中，对于“Physics”专业，学生的出现顺序是 Adams、Chen、Garcia。一个稳定的按专业排序必须维持这个序列。最终的列表会是这样：

(Baker, Chemistry) (Evans, Chemistry) (Davis, Computer Science) (Adams, Physics) (Chen, Physics) (Garcia, Physics)

请注意，在“Chemistry”专业内，Baker 仍然在 Evans 之前。在“Physics”专业内，Adams 仍然在 Chen 之前，而 Chen 在 Garcia 之前。原始的字母顺序被保留下来，作为次要排序标准，似乎是免费得来的！

缺乏稳定性会留下一个明显的迹象。想象一下来自一项巡天调查的数据流，其中包含天文观测记录：(ObjectID, ObservationTimestamp, DataCategory)。数据首先按观测发生的时间（ObservationTimestamp）排序。为了组织数据，再按 DataCategory（“GALAXY”、“STAR”等）进行第二次排序。

假设第一次排序（按时间）后，我们有两条“GALAXY”记录，A2 和 A3，其中 A2 的观测时间早于 A3。 ... (A2, 20230508, 'GALAXY'), ..., (A3, 20230512, 'GALAXY'), ...

如果第二次按 DataCategory 的排序是稳定的，那么最终列表中 A2 必须出现在“GALAXY”块中 A3 的前面。然而，如果我们发现输出列表中 A3 出现在 A2 之前，我们就找到了“确凿的证据”。用于第二步的排序算法必定是不稳定的。它颠倒了两条星系观测记录的原始时间顺序，这对于试图按序分析事件的科学家来说，可能是灾难性的后果。

为什么稳定性是一种超能力：多键排序的艺术

这就引出了稳定性最常见、最强大的应用：按多个标准对数据进行排序。假设一位课程管理员需要发布一份学生名册，主要按成绩（升序）排序，对于成绩相同的学生，再按姓名（字母顺序）进行次要排序。

你可能会认为需要一个复杂的、同时考虑两个键的排序函数。但使用稳定排序，有一个非常简单、两步走的解决方案：

首先，按次要键（姓名）对整个列表进行排序。
然后，使用稳定的排序算法，按主要键（成绩）对结果列表进行排序。

让我们见证奇迹。第一步之后，列表完全按字母顺序排列。例如，所有成绩为 88 分的学生可能按以下顺序排列：(Alex, 88)、(Beth, 88)、(Ivan, 88)、(Liam, 88)、(Zoe, 88)。当第二步的稳定排序开始按成绩排列学生时，它认为这五个学生是“相等”的，因为他们的成绩都是 88。由于该算法是稳定的，它承诺不会打乱他们的相对顺序。就这样，最终的列表按成绩排序，而平局则自动按姓名解决，正如我们所期望的那样。

但如果工程师在第二步使用了像 Selection Sort 这样的不稳定算法呢？选择排序的工作原理是反复在列表的未排序部分找到最小元素，并将其交换到正确的位置。这些长距离的交换是稳定性的天敌。在我们的例子中，按姓名排序后，列表可能以 (Alex, 88) 开头。但如果 (Maya, 72) 在列表的其他地方，成绩排序的第一步会找到 Maya 的记录（最低成绩）并与 Alex 的记录交换。Alex 的记录现在被换到了别处，之前在 88 分学生中精心建立的字母顺序被破坏了。最终列表将正确地按成绩排序，但每个成绩内部的姓名将处于看似随机的顺序——这是一个貌似合理但不正确的结果，未能满足规范要求。

机器内部：稳定性的机制

那么，为什么像 Merge Sort 这样的算法天然稳定，而像 Quicksort 和 Shell Sort 这样的算法却不是呢？答案在于它们的基本机制。

Merge Sort：温和的邻居

Merge Sort 是典型的稳定算法。它的工作原理是将列表分解成微小的部分，然后将它们按排序顺序合并回来。秘密在于 merge 步骤。想象一下，你有两个已排序的子列表 Left 和 Right 需要合并。Left 中的每个元素在原始数组中的位置都先于 Right 中的每个元素。当你为合并后的列表选择下一个元素时，如果 Left 中的下一个元素和 Right 中的下一个元素具有相同的键值，你该怎么办？为了保持稳定性，规则简单而绝对：始终先取 Left 列表中的元素。通过始终偏好来自原始数组较早部分的元素，Merge Sort 确保了原始的相对顺序永远不会被破坏。这个简单的局部决策导致了一个全局稳定的算法。这是一个简单规则如何产生强大涌现属性的优美范例。

Quicksort：混乱的交换者

Quicksort 的标准形式则恰恰相反。它的策略是选择一个“基准”元素，并将数组划分为三组：小于基准的元素、等于基准的元素和大于基准的元素。标准的分区方案（如 Lomuto 或 Hoare 的方案）通过一系列交换来实现这一点，这些交换可以将一个元素从子数组的一端送到另一端。如果两个具有相等键值的元素位于基准的两侧，其中一个可能会被交换到另一个的另一边，从而颠倒它们的原始顺序。该算法在追求排序效率的过程中，对它们的初始排列毫不在意。

这并不意味着 Quicksort 不能是稳定的。人们可以设计一个谨慎的、稳定的三路分区方案。但这增加了复杂性，并且通常需要额外的内存，背离了使 Quicksort 如此流行的简单、原地操作的优雅特性。

打造稳定性：当天然不具备时

如果你最喜欢的算法，比如快速的 Shell Sort，本质上是不稳定的怎么办？或者，如果你正在使用优先队列实现排序，而其稳定性取决于其底层结构（比如通常不稳定的二叉堆），该怎么办？你必须放弃它吗？完全不必。有一些巧妙的方法可以强制实现稳定性。

最强大和通用的技术是转换键值本身。我们不再按键 $k$ 排序，而是按一个复合键排序：即序对 (k, original_index)。例如，如果两条记录具有相同的键 $k=88$ ，但一条最初在索引 7，另一条在索引 15，那么它们的新键就变成了 (88, 7) 和 (88, 15)。当排序算法比较这两者时，它首先看到 $k$ 值相等。然后，它通过查看键的第二部分，即原始索引来打破平局。由于 $7 \lt 15$ ，它认为第一条记录“更小”。

通过这样做，我们实际上使数组中的每个键都变得独一无二！排序算法再也不用担心平局问题，稳定性的问题也变得无关紧要。算法对这些唯一的序对进行排序，结果就是原始数据的完美稳定排序。这个绝妙的技巧可以使任何基于比较的排序算法表现得如同稳定一般，代价通常是存储一个原始索引的辅助数组。

或者，我们可以设计本质上稳定的数据结构。优先队列可以不使用简单的堆来构建，而是使用一个两级结构：一个主结构用于跟踪最小键，对于每个键，都有一个简单的先进先出（FIFO）队列来存储具有该键的项。当你插入项时，它们被添加到其键对应的 FIFO 队列的末尾。当你提取最小值时，你从 FIFO 队列的前端取出。这种设计将处理相等项时的“先进先出”行为明确地融入到机器的架构中。

最终测试：侦探的工具箱

假设你得到了一个编译好的程序——一个声称是稳定排序器的黑盒。你如何确定？你看不到代码。这时，像侦探一样思考就派上用场了。

首先，你需要一个可能真正失败的测试用例。一个所有键都唯一的输入是无用的；稳定性在那里无关紧要。一个所有相等键都已经相邻的输入太容易了；它无法给算法带来压力。

完美的“对抗性”输入包含具有相等键且被故意交错的记录。例如：(key=5, tag=1)、(key=9, tag=2)、(key=5, tag=3)、(key=8, tag=4)。这里的 tag 只是原始位置，是我们追踪每条记录身份的方式。

在这里，两条 key=5 的记录是分开的。像 Merge Sort 这样的分治算法很可能会将它们分到不同的子数组中。真正的考验发生在它们被合并回来的时候。你在这个输入上运行你的黑盒程序。然后你检查输出。你查看所有 key=5 的记录。tag=1 的记录是否在 tag=3 的记录之前输出？如果是，算法通过了这次测试。如果顺序颠倒了，你就抓住了它：这个算法是不稳定的。通过设计一套这样巧妙的测试，你可以对你正在使用的工具是否真正遵守稳定性的微妙但关键的承诺获得高度的信心。

应用与跨学科联系

我们已经探讨了稳定性的原理，这个看似微小而挑剔的规则，即不打扰那些被我们的排序算法视为相等的元素之间的平静。你可能会忍不住问：“那又怎样？这只是一个理论上的细节，一个给算法设计师的冷知识吗？”答案是响亮的“不”。这个简单的想法 blossoming 成为一个出人意料的强大工具，其影响力从整理音乐库这样平凡的任务，延伸到计算生物学的深刻挑战和数值科学的微妙陷阱。让我们踏上一段旅程，看看这个原理将我们带向何方。

分层秩序的艺术：数据库与多键排序

也许稳定排序最直观、最广泛的应用是创建分层的、等级化的顺序——这可能是你每天在电子表格或数据库中做的事情。想象一下，你有一个来自世界各地的大型客户记录表。你想先按国家组织它们，然后在每个国家内按城市组织，最后在每个城市内按姓名首字母排序。

你会如何实现这个目标？你可以编写一个非常复杂的比较函数，一次性查看所有三个键。但有一个更优雅、更通用的解决方案，它完全依赖于稳定性。你执行一系列排序，从最不重要的键开始，到最重要的键结束。在我们的例子中：

首先，你使用稳定算法按姓名对整个表进行排序。
接下来，你取那个结果，再次使用稳定算法按城市排序。因为排序是稳定的，对于所有在巴黎的人来说，他们的相对顺序——现在是按姓名的字母顺序——被保留了下来。
最后，你按国家对新的结果进行排序。这最后一次排序的稳定性确保了在每个国家内部，现有的城市分组被保留下来，而在每个城市内部，姓名的字母顺序仍然被保留下来。

通过三次简单、连续的稳定排序，你就实现了一个复杂的三级字典序。这项强大的技术是无数软件应用程序中多列排序的幕后功臣，它之所以能精确工作，是因为稳定性将排序信息从一轮传递到下一轮，就像一个细心的图书管理员在移动整个书柜时，小心地保持一个架子上书籍的排列一样。

速度的基础：算法的构建块

除了面向用户的特性，稳定性也是其他更高级算法的关键内部组件。一个绝佳的例子是 Radix Sort，这种算法可以非常快速地对整数进行排序，通常性能优于像 Merge Sort 或 Quicksort 这样基于比较的排序。

Radix sort 的工作原理不是将数字作为一个整体来排序，而是一次处理一个数字位。例如，要对一个三位数列表进行排序，你首先会根据它们的个位数进行排序。然后，你对得到的结果列表根据它们的十位数进行排序。最后，你再对那个列表根据它们的百位数进行排序。

神奇之处在于：这只有在每一轮使用的排序都是稳定的情况下才有效。按个位数排序后，你可能会得到一个序列，其中 171 出现在 075 之前（因为 $1 5$ ）。当你接下来根据十位数对这个结果列表进行排序时，这两个数字有相同的键：7。一个稳定的排序会保证 171 仍然在 075 之前，保留了上一轮的顺序。一个不稳定的排序可能会交换它们，将 075 放在 171 之前。没有稳定性，前一轮的工作就被破坏了，最终的列表将是胡言乱语。稳定性是让 Radix Sort 能够一轮一轮地建立起正确顺序的棘轮。

从代码到宇宙：跨学科之旅

稳定性的影响远远超出了纯粹的计算机科学，为其他科学学科提供了必不可少的工具。

在计算几何中，稳定性帮助我们正确地描述事物的形状。考虑找到一组点的“凸包”问题——想象一下在一块板上围绕一堆钉子拉伸一根橡皮筋。橡皮筋的形状就是凸包。一个著名的方法，Graham scan，涉及到选择一个基准点，并根据所有其他点与该基准点形成的极角进行排序。但如果几个点位于从基准点出发的同一条线上，具有相同的角度怎么办？为了构造正确的凸包，我们必须按照它们与基准点的距离顺序来处理这些共线点，从近到远。一个使用角度作为主键、距离作为平局决胜标准的稳定排序优雅地解决了这个问题。一个不稳定的排序，或者一个错误地打破平局的排序，可能会导致点被无序处理，从而使算法描绘出一个错误的、向内凹陷的形状——未能看到点集的真实边界。

在生物信息学和文本处理中，稳定性是分析像人类基因组这样庞大字符串的基石。用于此目的的一个基本数据结构是后缀数组，它本质上是一个字符串所有后缀的排序列表。构建后缀数组最优雅的算法之一是“倍增”法。它的工作原理是反复地根据长度为 $1, 2, 4, 8, \dots$ 的前缀对后缀进行排序。在每个阶段，它巧妙地利用前一阶段的排序顺序来确定新的顺序。从排序长度为 $k$ 的前缀到长度为 $2k$ 的前缀的飞跃，依赖于对前一阶段的排名对进行排序。而且，你现在可能猜到了，这个排序必须是稳定的。不稳定的排序会丢失重复子串（如 ATATAT...）的宝贵排序信息，破坏整个过程，使得无法正确构建最终的数组。因此，一个简单的排序属性在创建驱动现代基因组学研究的工具中起着至关重要的作用。

计算的精微机制

最后，让我们看一些稳定性最微妙和最深刻的后果，它们揭示了关于计算本质的深刻真理。

稳定性的“成本”是什么？当对一个庞大到存放在磁盘上而不是内存中的数据集进行排序（外部排序）时，每一次读写操作都非常宝贵。你可能会猜测，增加像稳定性这样的约束会需要额外的 I/O 操作。但这里有一个美妙的惊喜。在合并过程中强制稳定性的逻辑——当键值相同时，优先选择来自较早数据“段”的元素——纯粹是在已加载到内存的数据上做出的计算决策。它不需要从磁盘读取任何额外的块。对于由 I/O 主导的问题，稳定性可以是一种“免费的午餐”，一个强大的特性，却不会给过程中最昂贵的部分增加显著的开销。

但故事还有最后一个引人入胜的转折。一个排序算法可以是完美稳定的，但看起来却是不稳定的。怎么会这样？想象一下，你正在根据一个使用浮点运算计算出的键来对对象进行排序。例如，真实的键可能是一个简单的整数函数，比如 $K(t) = t^2$ 。对于 $t=1$ 和 $t=-1$ ，键是完全相同的： $1$ 。一个稳定的排序应该保留它们的相对顺序。

现在，假设由于某种原因，一个程序员使用了更复杂但在代数上等价的公式来计算这个键，比如 $Q_S(t) = (t+S)^2 - 2St - S^2$ 。在纯数学的世界里， $K(t)$ 和 $Q_S(t)$ 是完全一样的。但在计算机的有限世界里，数字以有限的精度存储，这就不再是真的了。如果 $S$ 是一个非常大的数（比如 $10^{16}$ ），而 $t$ 很小（比如 $1$ ）， $Q_S(t)$ 的计算可能会遭受灾难性抵消的影响，这是一种舍入误差现象，即两个几乎相等的大数相减会摧毁结果的精度。计算机可能为 $t=1$ 计算出一个大约为 $-2 \times 10^{16}$ 的键，而为 $t=-1$ 计算出一个大约为 $+2 \times 10^{16}$ 的键。

稳定的排序算法，完美地完成了它的工作，看到了两个截然不同的键，并尽职地将 $t=1$ 的项放在 $t=-1$ 的项之前。对于一个知道真实数学键对两者来说都是 $t^2=1$ 的观察者来说，这个算法似乎不稳定地重新排列了它们！当然，错误不在于排序本身，而在于数值不稳定的比较函数。这揭示了一个优美的教训：一个系统的稳定性不仅取决于其逻辑部分，还取决于每一个组件，甚至包括用来表示其世界观的算术本身。

从在屏幕上组织数据到构建其他算法的基础，从辨别几何形状到分析生命密码，甚至到面对数值误差的幽灵，稳定性的原理是一条统一的线索。它是一个简单而优雅的思想，提醒我们，有时，一个算法能做的最强大的事情，就是小心翼翼地、刻意地，让事物保持原样。