自平衡二叉搜索树

玻尔百科

定义

自平衡二叉搜索树是计算机科学中的一种特殊数据结构，它通过被称为“旋转”的局部重构操作来维持树的高度，从而确保搜索、插入和删除操作具有对数时间复杂度。这种树通过严格的平衡规则来维持性能，例如 AVL 树的高度约束或红黑树的颜色属性。除了基本的二叉形式，相关的 B 树结构也常用于数据库和文件系统，通过减少内存访问延迟来优化硬件性能。

核心要点

自平衡二叉搜索树通过保证搜索、插入和删除操作的高效对数时间性能，解决了线性结构的关键权衡问题。
平衡是通过严格的“契约”来维持的——例如 AVL 树中的高度规则或红黑树中的颜色属性——这些契约通过称为旋转的简单、局部重构操作来强制执行。
这些树的真正威力通过增强得以实现，即在每个节点存储额外数据，从而能够对动态数据子集进行复杂的查询（如统计计算）。
硬件现实，如内存缓存，促使了“矮胖”B 树的发展，它们通过最小化慢速内存访问，在数据库和文件系统中胜过“高瘦”的二叉树。

引言

在数字世界中，高效地组织数据是一项基本挑战。我们需要不断地从庞大的收集中搜索、添加和删除信息，并且需要快速完成。像排序数组或链表这样的简单数据结构带来了一个令人沮丧的两难境地：一个提供快速搜索但更新缓慢，另一个则相反。这迫使高性能系统无法承受的妥协。自平衡二叉搜索树（BST）作为一种优雅而强大的解决方案应运而生，它摆脱了“直线的暴政”，为所有主要操作提供了有保证的快速性能。

本文深入探讨了这些卓越的数据结构如何实现其效率的核心。在第一部分 原理与机制 中，我们将探索“平衡”的不同理念，从 AVL 树严格的基于高度的规则到红黑树巧妙的记账方式。我们将揭示通过旋转进行再平衡的艺术，甚至考虑硬件架构如何以 B 树的形式影响树的设计。在第二部分 应用与跨学科联系 中，我们将看到这些理论概念变为现实，揭示自平衡 BST 如何构成从操作系统和金融市场到视频游戏物理和人工智能等一切事物的无形支柱。

原理与机制

直线的暴政：为什么我们需要树

想象一下你在管理一部词典。不是纸质的，而是一部动态的、不断用新词更新的数字词典。你需要能够查找一个词，添加一个新词，或删除一个旧词，而且你需要非常非常快地完成这一切。

存储有序项目列表最直接的方法就是，嗯，一个有序列表。就像电子表格中的一列或计算机程序中的一个简单数组。如果你想找到一个项目，你可以使用一种叫做二分搜索的巧妙技巧，这非常快。但是当你想要添加一个新词，比如说“aardvark”时会发生什么？你必须把其他每一个词都向下移动来腾出空间。如果你的词典有一百万个词，你可能需要移动一百万个词。这简直是慢得离谱。

那么链表呢？插入一个新词很容易；你只需找到正确的位置并将其拼接进去。但是你如何找到那个位置？你别无选择，只能从头（“A”）开始，逐个遍历列表，直到找到新词所属的位置。同样，对于一百万词的词典，这可能意味着一百万步。

这就是直线的暴政。线性结构迫使我们在快速搜索（排序数组）和快速更新（链表）之间做出选择，但我们无法两者兼得。这正是在我们将复杂数据结构与简单排序列表进行比较时所凸显的困境。要在包含 $n$ 个项目的排序链表中找到插入点，在最坏情况下，你必须遍历整个列表，这个操作的成本与 $n$ 成正比，记为 $\mathcal{O}(n)$ 。相比之下，一个平衡的树结构承诺了听起来近乎神奇的事情：成本与 $n$ 的对数成正比，即 $\mathcal{O}(\log n)$ 。对于一百万个项目， $\log_2(1,000,000)$ 大约是 20。我们谈论的是 20 步与一百万步的对比。这不仅仅是一种改进；这是一个不同维度的效率。

这怎么可能呢？二叉搜索树（BST）放弃了直线，采用了一种分支结构。在每个节点，它都做一个简单的决定：你正在寻找的键要么小于此节点的键（向左走），要么大于（向右走）。每向下一步都会排除掉剩下可能性的一半。树的结构本身就是一张为二分搜索预先编译好的路线图。

但这里有一个陷阱，一个可怕的弱点。如果你通过按字母顺序插入单词来构建你的词典会怎样？“Abacus”，然后是“abandon”，然后是“abbey”……你那美丽的分支树退化成了一条长长的、细瘦的链条。它变成了一个伪装的链表，其所有的对数魔力都消失了。你又回到了 $\mathcal{O}(n)$ 的性能。为了释放树的力量，我们必须防止它们变得过于不平衡。我们必须强迫它们是平衡的。

对抗混乱的契约：平衡的哲学

“平衡”是一个美丽的词，但在数据结构的世界里，它是一个具有精确含义的技术概念。一棵平衡树不一定完全对称。相反，它在一个“契约”下运作——一套它承诺无论你给它什么数据都会遵守的严格不变量。这个契约防止树变得过于不平衡，从而保证其高度相对于节点数 $n$ 保持对数级别。正是这种对数高度确保了 $\mathcal{O}(\log n)$ 的性能。

但这个契约应该是什么样的呢？定义平衡主要有两种哲学。

基于高度的平衡：局部立法者

第一种哲学是像一个局部立法者一样行事，对每个局部节点家族的高度施加规则。最著名的例子是 AVL 树，以其发明者 Adelson-Velsky 和 Landis 的名字命名。AVL 契约简单得惊人：对于树中的任何节点，其左子树和右子树的高度差不能超过一。

这个简单的局部规则具有深远的全局影响。它禁止了高而瘦的分支旁边出现短而茂密的分支。但这个保证有多好呢？为了找出答案，我们可以问一个有趣的问题：仍然满足 AVL 规则的最瘦、最不平衡的树是什么样的？如果我们能证明即使是这种最坏情况下的树也具有对数高度，那么我们就为所有 AVL 树证明了这一点。

为给定高度 $h$ 构建这个具有最少节点的树，揭示了与数学之间一个惊人且隐藏的联系。要使一个高度为 $h$ 的 AVL 树节点最少，你需要给它的根一个高度为 $h-1$ 的子树和另一个高度为 $h-2$ 的子树（规则允许的最大高度差）。如果你继续这个逻辑，你会发现高度为 $h$ 的树的最小节点数，我们称之为 $N(h)$ ，遵循一个与定义著名斐波那契数的递推关系几乎相同的关系。确切的关系是 $N(h) = F_{h+3} - 1$ ，其中 $F_k$ 是第 $k$ 个斐波那契数。由于斐波那契数呈指数级增长，这意味着高度 $h$ 必须随节点数 $n$ 对数级增长。契约成立！

基于大小的平衡：比例代表

第二种哲学不是关注高度，而是关注节点的数量——子树的“权重”或“大小”。这就像确保政府中的比例代表制。一个权重平衡树（也称为 BB[ $\alpha$ ] 树）在不同的契约下运作。它声明对于任何节点，其每个子节点的子树大小不能超过其自身子树大小的某个分数 $\alpha$ 。

例如，当 $\alpha = 2/3$ 时，规则是对于任何节点，其左子树或右子树都不能包含超过其下总节点数的三分之二。这直接防止了比如 99% 的节点都在一侧的情况。像 AVL 规则一样，这个基于大小的契约也足够强大，可以保证对数高度。在树中每向下一步，你都保证至少丢弃掉一个常数比例 $(1-\alpha)$ 的节点，这正是对数过程的定义。

这两种哲学向我们表明，没有一种唯一的“正确”平衡方式。你可以通过观察几何（高度）或观察质量（大小）来强制平衡。两者都通向同一个美妙的目的地：保证对数性能。

再平衡的艺术：旋转与颜色的舞蹈

没有执行机制的契约是无用的。如果你插入一个新节点并且它违反了平衡条件，你该怎么办？你不能就这么放弃。你必须修复它。修复不平衡的主要工具是一种优雅且出奇简单的操作，称为旋转。

旋转是对两三个节点的局部重构。想象一个节点和它的子节点失去了平衡。一次旋转使子节点成为新的父节点，而父节点成为其前子节点的子节点。这就像一次小型的、受控的家庭重组。旋转的神奇之处在于，它改变了树的结构和高度，但完美地保留了键的排序顺序。这是再平衡之舞中的基本动作。

对于像 AVL 树这样的某些树，一两次旋转的特定序列就足以恢复高度平衡契约。对于权重平衡树，旋转也用于将“质量”从重的子树转移到轻的子树。

但有时，仅仅旋转是不够的，或者需要一个更微妙的不变量。这就引出了最著名和最聪明的平衡方案之一：红黑树。

红黑树为每个节点增加了一个额外的信息位：一个“颜色”，红色或黑色。颜色不仅仅是为了装饰；它们是一种巧妙的记账设备，用于执行一种复杂的基于权重的平衡。红黑契约由几条规则组成：

根是黑色的。
从根到任一空叶子节点的每条路径都包含相同数量的黑色节点（这就是“黑高”）。
如果一个节点是红色的，那么它的子节点必须是黑色的。

第三条规则，“没有红色的父节点带有红色的子节点”，是一个简单的局部约束。但与全局的黑高规则结合起来，它创造了奇迹。它保证了树中最长的可能路径（交替的黑色和红色节点）不会超过最短可能路径（全是黑色节点）的两倍长。由于全是黑色节点的路径具有对数长度，因此整个树的高度也必须是对数的。对于任何红色节点，属性都是严格的：它的父节点和子节点必须是黑色的，并且它的子节点必须具有相同的黑高，以满足全局不变量。

如果我们进一步推广这个想法，我们可以看到“红色”和“黑色”只是整数权重的标签，比如 $w(\text{red})=0$ 和 $w(\text{black})=1$ 。红黑规则是一个更普遍原则的特例：维持从根到每个叶子的恒定“路径权重”。我们甚至可以发明一种“三色树”，其颜色对应于像 $0, 1, 2$ 这样的权重。只要我们有能够限制路径长度的规则（比如“连续没有两个权重为 0 的节点”）并且能够通过局部旋转和重新着色来恢复路径权重不变量，我们就可以构建一个有效的自平衡树。这揭示了这些看似不同的结构背后深层的统一性。

懒惰方法：摊销与替罪羊

到目前为止，我们看到的平衡方案都是警惕的。就像一个焦虑的父母，它们在每次更新后都会检查不平衡。但如果我们懒一点呢？如果我们只在事情变得非常糟糕时才修复它们呢？这就是替罪羊树的哲学。

替罪羊树不像 AVL 树或红黑树那样维持严格的局部不变量。相反，它监控一个全局属性：树的整体深度。在一次插入后，它会检查新节点的深度 $d$ 是否超过某个阈值，比如 $\lfloor \log_{1/\alpha} n \rfloor$ （其中 $n$ 是树的大小， $\alpha$ 是一个参数）。如果没有超过，它什么也不做！它让小的不平衡持续存在。

只有当深度阈值被跨越时，树才会采取行动。然后它从新节点向上回溯，找到造成过度深度的、权重严重不平衡的最高祖先——“替罪羊”。它不是进行精细的旋转，而是使用一把大锤：它将以替罪羊为根的整个子树完全重建为一个完美的平衡树。

这听起来可能效率极低。一次重建可能需要很多时间。然而，其巧妙之处在于摊销分析。一个大的子树只有在其中发生了许多许多次插入，使其失去平衡之后，才能成为替罪羊。重建的昂贵成本可以被分摊，或“摊销”到导致它的那大量廉价操作上。

这种方法给了我们一种新的性能保证：每次插入的摊销时间为 $\mathcal{O}(\log n)$ 。任何单次插入都可能很慢，但在一长串操作中的平均速度是快的。如果我们变得更懒，每 $k$ 次插入才执行一次这个检查会发生什么？你可能会猜到，性能保证会优雅地下降。一个对手可以以一种方式插入 $k-1$ 个键，从而创建一个长而瘦的分支，使树的高度增加 $k-1$ 。因此，在一次检查前的最坏情况高度可以增长到 $\mathcal{O}(\log n + k)$ ，并且每次插入的摊销时间也变成了 $\mathcal{O}(\log n + k)$ 。这完美地说明了我们执行平衡契约的频率与我们可以预期的最坏情况性能之间的直接权衡。

当现实世界反击：缓存与 B 树

到目前为止，我们一直生活在一个理论世界里，其中每个操作都花费一定的时间。但在真实的计算机中，并非所有的内存访问都是平等的。你的计算机处理器有一个小的、速度极快的内存，称为缓存。访问缓存中的数据就像拿起你桌上的一张纸。从主内存（RAM）访问它就像走到图书馆的书架上——慢得多，慢得多。当计算机从 RAM 获取数据时，它不只是抓取一个字节；它会抓取一整条“缓存行”（例如，64 字节），希望你接下来需要的数据就在附近。这个原则被称为内存局部性。

这对树数据结构有着深远的影响。一棵二叉搜索树，即使是平衡的，也是“高而瘦”的。一次搜索涉及到从一个节点跳到另一个节点，而每个节点可能位于内存的完全不同部分。每次跳跃都可能触发一次缓慢的“去图书馆之旅”——一次缓存未命中。对于一个拥有 $2^{20}$ （约一百万）个元素的树，在红黑树中的一次搜索可能涉及大约 20 次跳跃。如果树的上层在你的“桌上”（在缓存中），但下层不在，那么单次搜索你可能会遭受十几次或更多的缓存未命中。

如果我们能设计一棵“矮而胖”的树呢？这就是 B 树的天才之处，它几乎是所有数据库和文件系统背后的主力。B 树的节点不是只有一个键和两个子节点，而是可以容纳许多键（例如 3 个）和许多子指针（例如 4 个）。整个节点被设计成能完美地放入一个缓存行。

当你搜索一棵 B 树时，你获取一个节点（一个缓存行），并且可以做出一个多路决策。这极大地降低了树的高度。对于我们那个一百万项的例子，一个分支因子为 4 的 B 树的高度只有 10。一次搜索需要少得多的节点间跳跃。这意味着潜在的缓存未命中要少得多——也许只有 6 次，而红黑树是 12 次。这就是为什么当数据存放在像硬盘甚至只是主内存这样的慢速介质上时，B 树会优于二叉树。大 O 符号只讲述了故事的一部分；硬件现实决定了赢家。

这种为工作选择正确工具的想法是普遍的。考虑一个哈希表，它以其闪电般快速的平均情况 $\mathcal{O}(1)$ 查找而闻名。它通常比平衡 BST 更快。但当它变满时，冲突会增加，性能会急剧下降。一个负载因子为 98% 的哈希表可能会比平衡 BST 慢数百倍。在这种情况下，明智的工程选择可能是花费一次性成本将老化的哈希表转换为一个健壮且可预测的平衡 BST，其 $\mathcal{O}(\log n)$ 的保证突然看起来更具吸引力。

拥有超能力的树：增强的魔力

自平衡树的真正威力不仅仅在于它能高效地存储和检索键。它真正的魔力在于其平衡的结构提供了一个可靠的支架，我们可以在此基础上构建出令人难以置信的新功能。这是通过增强树来实现的。

这个想法是在每个节点存储额外的信息，这些信息告诉我们关于以该节点为根的整个子树的一些情况。最简单的增强是存储子树的大小，我们已经看到这对于权重平衡树很有用。但我们能做的远不止于此。

考虑一个看似不可能的挑战：你有一棵数字树，你希望能够在 $\mathcal{O}(\log n)$ 时间内找到任何给定子树中所有键的标准差。标准差是一个全局属性；它取决于集合中所有数字的平均值。它不是“可分解的”——你不能简单地将左右子树的标准差组合起来得到父节点的标准差。

这就是魔力所在。诀窍不是存储标准差本身，而是存储可以计算出它的、更简单的、可分布式维护的统计数据。要计算标准差，你需要三样东西：元素的数量 ( $N$ )、元素的总和 ( $\sum v_i$ ) 和元素的平方和 ( $\sum v_i^2$ )。这三个统计数据中的每一个都是可分解的！

父节点子树的大小就是 size(left) + size(right) + 1。
父节点子树中键的总和是 sum(left) + sum(right) + key(parent)。
父节点子树中键的平方和是 sum_sq(left) + sum_sq(right) + key(parent)^2。

我们可以增强每个节点来存储这三个值。每当树被修改（通过插入、删除或旋转）时，我们只需要更新通往根节点路径上节点的这些值——一个 $\mathcal{O}(\log n)$ 操作。在任何时候，如果我们想要某个节点子树的标准差，我们可以使用它存储的大小、总和和平方和，在常数时间内计算出来。

这个原则强大得令人惊叹。通过找到正确的底层简单统计数据，我们可以让自平衡树回答关于我们数据动态子集的复杂统计查询，同时保持使其成为计算机科学基石的对数性能。简单的分支结构，由一个聪明的契约加以约束，变成了一个以我们从未想象过的方式理解数据的工具。

应用与跨学科联系

我们花了一些时间来理解自平衡二叉搜索树的复杂机制——旋转、高度属性、对数承诺。它是一件精美的逻辑钟表。但钟表不仅仅是用来欣赏的，它是用来报时的。那么，这些卓越的数据结构所报的“时”是什么呢？它们解决了什么问题？

事实证明，维护一个不断被添加、删除或更改的有序事物集合这个简单而基本的任务，并非某个晦涩的学术难题。它无处不在。它是数字世界和自然世界的一个基本节奏。一旦你学会识别这种节奏，你就会开始在最令人惊讶和着迷的地方看到自平衡 BST，或它们解决的问题。让我们踏上一段旅程，穿越其中一些领域，看看这个优雅的想法能带我们走多远。

数字骨干：软件与系统

在现代计算的核心，速度和可靠性至关重要，自平衡 BST 构成了一个无形但必不可少的支架。

想想你电脑上的文件系统——一个文件夹套文件夹的迷宫，包含数千个文件。当你请求打开像 /home/alice/documents/report.txt 这样的文件时，系统是如何找到它的？它必须首先在根目录 / 中找到 home，然后在 home 中找到 alice，然后在 alice 中找到 documents，最后在 documents 中找到 report.txt。如果每个目录都将其子项列表存储为一个简单的、未排序的列表，那么寻找下一个组件可能需要扫描数百个条目。对于一个深度嵌套的文件，这个过程会非常缓慢。

一个更优雅的解决方案是将每个目录的内容表示为一个自平衡 BST，以文件名作为键。当你查找 alice 时，系统在 home 目录的 BST 中执行搜索，这花费的时间与用户数量的对数成正比，比如说 $\mathcal{O}(\log m_{users})$ 。然后它对 documents 文件夹重复此操作，花费 $\mathcal{O}(\log m_{docs})$ 时间。找到文件的总时间是这些对数成本的总和，这比线性扫描有了巨大的改进。文件系统感觉是瞬时的，因为在每一层，它都不会在人群中迷失。

这种管理动态资源集合的原则深入到操作系统中。考虑内存分配。当一个程序请求一个内存块时，操作系统的堆分配器必须找到一个大小合适的空闲块。一个常见的策略是“最佳适配”，它会找到足够大的最小空闲块。它如何高效地做到这一点？通过将所有空闲块维护在一个以大小为键的 BST 中。一个大小为 $s$ 的内存请求变成了搜索大于或等于 $s$ 的最小键。当一个块被分割时，一部分被分配，较小的剩余部分被重新插入到树中。当一个程序释放内存时，该块被插回，并且它可能会与相邻的空闲块合并——这个过程涉及将它们从树中移除并插入一个新的、更大的块。对于具有高时间局部性的工作负载（例如，分配和释放许多大小相似的对象的程序），伸展树（splay tree）尤其巧妙。通过将最近访问的大小移动到根部，它通常可以以近乎常数的时间找到下一个最佳适配块，利用了程序行为中的模式。

操作系统也扮演着最高指挥的角色，决定在任何特定时刻，众多可运行线程中哪一个可以使用 CPU。这个调度决策必须每秒做出数千次。CPU 调度器可以将所有可运行线程维护在一个以优先级为键的自平衡 BST 中。要选择下一个要运行的线程，它只需从树中提取最大元素。但公平性呢？为了防止低优先级线程饿死，许多系统实现了“老化”，定期增加所有等待线程的优先级。一个幼稚的实现需要更新树中的每一个节点——一个代价高昂的 $\mathcal{O}(n)$ 操作。这里，一个漂亮的技巧出现了。与其改变存储的优先级，我们可以维护一个单一的全局“偏移”变量， $g$ 。一个线程的真实优先级是其存储的优先级加上 $g$ 。AgingTick 操作变成仅仅是 $g$ 的增量，一个 $\mathcal{O}(1)$ 的奇迹。所有其他操作，如插入一个线程或更改特定优先级，都相对于此偏移进行调整，但仍然是高效的 $\mathcal{O}(\log n)$ 操作。

从一台计算机，让我们扩展到一个全球网络。想象一个分布式键值存储，数据分布在数千台服务器上。你如何将一个键的请求路由到正确的服务器？一种方法是将服务器本身组织成一个逻辑上的 BST 拓扑结构。整个键空间（例如，区间 $[0,1)$ ）被划分，每个服务器负责一个子区间。树按区间边界排序。一个从“根”服务器开始的请求，通过将其键与服务器的枢轴值进行比较，在树中向下路由——在每一步向左或向右。找到任何键的跳数仅仅是其对应叶子的深度，由于自平衡，这个深度是 $\mathcal{O}(\log n)$ 。BST 的逻辑优雅性被转化为一个全球系统的物理路由架构。

连接世界：模拟与建模

BST 的力量并不仅限于管理数字产物。它们也是科学家和工程师构建模型以理解和预测复杂系统行为的不可或缺的工具。

在用于视频游戏或科学模拟的物理引擎中，检测两个物体何时碰撞是一项基本且计算密集型的任务。考虑一个简化的 1D 世界，其中对象由线上的区间 $[ \ell_i, r_i ]$ 表示。要找到与给定查询区间 $[L, R]$ 碰撞的所有对象，我们需要找到所有满足 $\ell_i \le R$ 和 $r_i \ge L$ 的区间。标准的 BST 是不够的。但我们可以增强它。通过以左端点 $\ell_i$ 为键，并在每个节点存储其子树中任何区间的最大右端点 ( $r_{\max}$ )，我们创建了一个区间树。这种增强给了搜索算法“预见性”。当搜索与 $[L, R]$ 的重叠时，它可以立即剪掉整个子树，只要它知道该子树的最大右端点小于 $L$ 。这个对 BST 节点的简单添加将一个 $\mathcal{O}(n)$ 的问题转变为一个高效的 $\mathcal{O}(\log n + k)$ 查询，其中 $k$ 是报告的碰撞次数。

从模拟世界到非常真实的金融世界，同样的原则也适用。一个证券交易所的订单簿是某个股票在不同价格水平上的所有买卖订单的列表。这个订单簿是极其动态的，每秒都有成千上万的订单到达和被取消。为了处理这个问题，交易所可以使用两个自平衡 BST：一个用于买单（出价），按价格从高到低排序；另一个用于卖单（要价），从低到高排序。“最佳”买单和卖单分别是它们各自树中的最大和最小元素，定义了当前的市场价格。当一个新订单被下达时，它在 $\mathcal{O}(\log n)$ 时间内被插入到相应的树中。当交易发生时，订单被移除。这种结构使得交易所能够以惊人的速度匹配买家和卖家。它也优雅地说明了幼稚数据结构的危险：如果订单按排序顺序到达（例如在快速上涨的市场中），一个简单的 BST 会退化成一个缓慢的链表，而自平衡树则能从容应对。

调度的逻辑超越了 CPU，延伸到了运筹学领域。考虑一个工厂，它有一台机器必须处理一组作业，每个作业都有处理时间 $p_i$ 和截止日期 $d_i$ 。目标是找到一个能最小化最大延迟 $L_{\max} = \max_i (C_i - d_i)$ 的调度，其中 $C_i$ 是完成时间。最优策略是“最早截止日期”（EDD）规则：按截止日期递增的顺序处理作业。但如果截止日期可以动态改变呢？一个增强的自平衡 BST 提供了解决方案。通过将作业存储在一个以截止日期 $d_i$ 为键的 BST 中，并用其子树的总处理时间等信息来增强每个节点，我们可以在 $\mathcal{O}(\log n)$ 时间内更新一个作业的截止日期（一个移除并插入的操作），并重新计算整个调度的新最大延迟。

即使是进化过程也可以通过这个视角来看待。在群体遗传学中，我们可能通过适应度分数来跟踪突变。当新突变出现时，它们可以被插入到一个以适应度为键的自平衡 BST 中。这使得研究人员能够有效地查询基因库，例如，找到某个适应度范围内的所有突变，或跟踪最适应变体的频率。

前沿：智能与交互

最后，随着我们向更智能、更具交互性的系统迈进，BST 提供的动态排序变得更加关键。

考虑一个 AI 代理，它通过从一组可能的行动中选择来学习执行一项任务。代理既想利用观察到的成功率最高的行动，也想探索其他选项。为了管理其决策，代理可以将其行动维护在一个自平衡 BST 中，以其当前的经验成功率 $\hat{p}_i = s_i / t_i$ 为键。每次行动后，成功率被更新，行动的键也随之改变。为了反映这一点，该行动从树中被移除并以其新的排名重新插入。这使得代理总能以 $\mathcal{O}(\log n)$ 的时间知道其当前最佳选项（树的最大元素），同时在收集更多经验时高效地重新排列其信念。

同样的模式也出现在我们每天使用的在线服务中。在一个大型在线游戏中，一个匹配系统必须将技能水平相似的玩家配对。这意味着对于一个匹配等级（MMR）为 $q$ 的玩家，系统需要找到队列中另一个 MMR 最接近 $q$ 的玩家。随着玩家加入和离开，队列在不断变化。通过将排队的玩家存储在一个以 MMR 为键的自平衡 BST 中，寻找最接近的匹配变成了一个查询 $q$ 的前驱和后继的操作，这仅需 $\mathcal{O}(\log n)$ 时间。此外，通过用子树大小来增强节点，系统可以同样高效地回答诸如“1500-1600 MMR 区间有多少玩家？”这样的问题。

从我们磁盘上的文件到 AI 的神经元，从金钱的流动到基因的流动，世界充满了处于不断变化中的有序集合。自平衡二叉搜索树，以其简单的规则和对数的优雅，为给这种混乱带来秩序提供了一个通用且极其优美的解决方案。它证明了对一个简单原则的深刻理解可以产生几乎回响在科学技术每个领域的影响。