基于数组的队列

玻尔百科

定义

基于数组的队列是一种基本的数据结构，它通过使用循环数组和回绕逻辑来管理元素，遵循先进先出的原则。该实现利用头尾指针实现了常数阶 O(1) 时间复杂度的入队和出队操作，并因良好的空间局部性而具备比链表实现更优的缓存利用率。这种结构被广泛应用于操作系统的轮询调度、速率限制中的滑动窗口实现以及广度优先搜索算法。

核心要点

循环数组通过使用带有环绕逻辑的头尾指针，克服了朴素数组队列的低效问题，实现了 $\mathcal{O}(1)$ 的入队和出队操作。
基于数组的队列因其空间局部性而比基于链表的实现具有更优越的性能，这带来了更高的 CPU 缓存利用率和更少的缓存未命中。
动态循环数组可以通过分配一个更大的数组并复制元素来自动调整大小，以每个操作的摊还常数时间成本提供灵活的容量。
基于数组的队列是操作系统中轮询调度的基础结构，可用于实现速率限制的滑动窗口，并支持广度优先搜索算法。

引言

队列是计算机科学的基石，一种简单的先进先出（FIFO）结构，它模拟了无数现实世界中的场景，从排队等候到处理任务。然而，将这一简单概念转化为高效的数字形式并非易事。使用标准数组的朴素实现会受到性能问题的困扰，在队列的抽象概念其实际高速应用之间造成了知识鸿沟。本文通过深入探讨基于数组的队列来弥合这一鸿沟。在接下来的章节中，我们将首先在“原理与机制”下探索循环缓冲区的优雅解决方案，剖析它如何实现常数时间操作并与现代硬件协调工作。随后，“应用与跨学科联系”将揭示该结构惊人的通用性，展示其在操作系统、网络协议和搜索算法中的关键作用。

原理与机制

想象一下，你正在管理电影院的一条单列队伍。当前面的人拿到票后，他们身后的整条队伍都必须向前移动一步。如果队伍很长，那将是大量的移动！这个简单的日常队列，完美地物理类比了在计算机上实现队列最基本的方法之一：使用标准数组。

移动的长队：一种朴素方法

数组是一块连续的内存，就像一条狭窄的走廊。我们可以将队列元素存储在其中，从第一个位置开始。当我们 enqueue 一个新人时，他们会去到队尾第一个空位。这很简单。但是当我们 dequeue 时会发生什么？排在最前面的人（位于索引 0）离开。为了保持队伍紧凑地排在前面，其他所有元素都必须向左移动一个位置。

如果我们的队列中有 $N$ 个元素，一次 dequeue 操作会强制移动 $N-1$ 个元素。这是一个巨大的工作量，特别是对于长队列。用计算机科学的术语来说，这个 pop_front 操作的时间复杂度为 $\mathcal{O}(N)$ 。这就像为了向前迈出一步而跑了一场马拉松。一定有更好的方法。

旋转木马：天才之举

如果不是人们向前移动，而是售票亭移动到队伍中的下一个人呢？或者更好的是，如果队伍不是一条笔直的走廊，而是一个圆圈，就像儿童的旋转木马一样呢？当一个人下马后，他的位置就空了出来。一个新的人可以在后面上马。队伍的“前面”就变成了圆圈中的下一个人。没有人需要移动！

这就是循环缓冲区（circular buffer）背后优美而高效的思想，它也被称为环形缓冲区（ring buffer）。我们不再把数组看作一条有固定起点和终点的线，而是开始把它当作一个圆。我们重用队列前面空出的空间来存放队尾的新元素。移动操作完全消失了。

驯服圆环：指针与模运算的魔力

我们如何从一个扁平的线性数组中创造出这个神奇的“圆环”呢？我们使用两个简单的指针或索引，我们称之为head和tail。head 指向第一个元素——下一个要出队的元素。tail 指向下一个可以入队新元素的空位。

当我们出队时，我们不移动任何数据。我们只是将 head 指针向前推进。当我们入队时，我们将新元素放在 tail 位置，然后将 tail 指针向前推进。

但是当指针到达数组末尾时会发生什么？它会简单地“环绕”到开头。这正是数学优雅之处的体现。模运算符 (%) 完美地实现了这种环绕。要在容量为 $C$ 的数组中推进索引 i，我们将其下一个位置计算为 (i + 1) % C。当 $i$ 为 $C-1$ 时，(C-1 + 1) % C 变成 $C \% C$ ，结果是 $0$ 。指针神奇地从末尾跳回了开头。

当然，这只是一个方便的数学简写。其底层逻辑是一个简单的条件检查：if index == C-1, set index = 0, else increment index。理解了这一点，就揭开了这个运算符的神秘面纱，并揭示了其核心概念。

这里有一个微妙的陷阱。当 head 和 tail 指针在同一位置时会发生什么？这表示队列是满的还是空的？这种歧义是一个经典问题。一个稳健的解决方案是维护第三个信息：一个表示队列大小的整数。当且仅当 size == 0 时，队列为空；当且仅当 size == C 时，队列为满。歧义便消失了。

逻辑顺序与物理现实

这种循环设计一个有趣的后果是，数组中数据的物理布局不再与其逻辑顺序相匹配。例如，一个元素为 [A, B, C, D, E] 的队列可能存储在一个容量为 8 的数组中，像这样：[D, E, _, _, _, A, B, C]。head 将指向 A，而 tail 将指向 E 之后的空槽。

这种逻辑概念与物理实现的分离是计算机科学的基石。它使我们能够构建强大的抽象。要查看队列中的“下 $k$ 个元素”，我们不能只读取一个连续的内存块。我们必须从 head 开始，并遵循逻辑顺序，同时尊重环绕规则。这意味着我们查看数据的算法也必须理解数组的循环特性，使用相同的模运算来计算每个后续的索引。

一个惊人的超能力：即时反转

使用指针进行抽象的威力给了我们一些惊人的能力。如果我们想 reverse 整个队列怎么办？对于朴素数组，我们必须逐个交换元素，这是一个 $\mathcal{O}(N)$ 的操作。对于链表，我们必须费力地遍历整个列表并重新连接每一个指针，这也是 $\mathcal{O}(N)$ 的操作。

但对于我们的循环数组，我们可以施展一点魔法。队列的“头”和“尾”只是由我们的 head 和 tail 指针以及它们的移动方向所定义的感念。要反转队列，我们可以简单地交换 head 和 tail 的角色，并反转它们前进的方向（即用减法代替加法）。这纯粹是对元数据的改变——只更新了几个变量。数组中的任何一个元素都没有被触动。反转在常数时间 $\mathcal{O}(1)$ 内完成！这惊人地展示了巧妙的数据表示如何能将一个看似复杂的操作变成一个微不足道的操作。

速度的物理学：缓存与局部性

到目前为止，我们支持循环数组优越性的论据都是算法层面的。但有一个更深层次的物理原因，解释了为什么这种数据结构在现实世界中如此之快。这与现代计算机处理器访问内存的方式有关。

你计算机的主内存（RAM）相对较慢。为了弥补这一点，处理器旁边有一个小而极快的存储器，称为缓存（cache）。当处理器需要从内存中获取一块数据时，它首先检查缓存。如果数据在那里（缓存命中），访问几乎是瞬时的。如果不在（缓存未命中），处理器必须暂停，等待从慢速主内存中获取一块数据。这个等待的代价非常高昂。

缓存的工作原理是一种叫做局部性（locality）的原则。它们打赌，如果你访问了一块数据，你很可能很快就会访问它的邻居。所以，当发生缓存未命中时，系统不只是获取你请求的那一个字节；它会获取一整块连续的内存（一个缓存行）。

这正是基于数组的队列大放异彩的地方。它的元素存储在一个单一的、连续的内存块中。当 head 和 tail 指针在数组中流式移动时，它们表现出完美的空间局部性（spatial locality）。几乎每一次访问都是访问前一个元素的邻居，因此它很可能已经在缓存中了。结果就是一连串快速的缓存命中。

另一方面，像链表这样基于指针的结构，其空间局部性非常差。每个节点都可以被分配在内存中完全不同的区域。跟随 next 指针就像在内存中进行随机跳跃。每一次跳跃都有很高的概率导致缓存未命中，从而使处理器停顿。尽管循环数组和链表队列的 enqueue 和 dequeue 操作在算法复杂度上都是 $\mathcal{O}(1)$ ，但由于其缓存友好的特性，基于数组的版本在实践中可能快上几个数量级。

不断扩展的圆环：摊还成本

我们的循环缓冲区非常出色，但如果我们事先不知道队列的最大大小怎么办？我们需要一个可以增长的动态循环数组。

策略很简单：当数组变满时，我们分配一个更大的新数组（通常是大小的两倍），将旧数组中的所有元素复制到新数组中，然后继续操作。在复制时，我们“展开”队列，将元素从新数组的索引 0 开始连续放置。

但是等等！这个复制操作的成本是 $\mathcal{O}(N)$ 。这难道没有破坏我们好不容易赢得的 $\mathcal{O}(1)$ 性能吗？不完全是。这就是摊还分析（amortized analysis）概念的用武之地。是的，调整大小的操作非常昂贵。但它也非常罕见。在我们把容量从 $C$ 翻倍到 $2C$ 之后，我们保证可以再执行至少 $C$ 次廉价的、 $\mathcal{O}(1)$ 的 enqueue 操作，然后才需要再次调整大小。

把它想象成攒钱买一件大件商品。每一次廉价操作都向一个储蓄账户中存入一小笔固定的“成本信用”。大多数时候，操作成本很低，余下的部分就被存起来了。当昂贵的调整大小操作最终发生时，我们就用账户中累积的信用来“支付”线性时间的复制成本。当在很长一系列操作上平均下来时，每个操作的成本仍然是一个小的常数。我们称这些操作是摊还 $\mathcal{O}(1)$ 的。

类似的策略也适用于缩减。为了避免浪费内存，如果数组的使用率下降到某个阈值以下，例如 25%，我们可以将其容量减半。增长阈值（100% 满）和缩减阈值（25% 满）之间的差距对于防止队列“抖动”——即在大小恰好在边界徘徊时快速增长和收缩——至关重要。这个方案的美妙之处可以用一种称为势能法（potential method）的数学工具来严格证明，它严谨地追踪我们储蓄账户中的“信用”。

从一条简单的、低效的移动长队，我们得到了一个动态的、自调整大小的循环缓冲区——一个不仅在算法上优雅，而且与现代计算机硬件的物理现实完美协调的数据结构。

应用与跨学科联系

在物理学以及整个科学领域中，一个非凡的现象是，一个单一、简单的思想会出现在最意想不到的地方，将乍看起来毫无共同之处的现象联系在一起。能量守恒、最小作用量原理——这些都是宏大的例子。在计算世界里，我们也有自己的一系列这样优美而统一的概念。我们刚刚探讨过的循环队列就是其中之一。

你可能会认为这只是一个聪明的编程技巧：将一条简单的线（标准队列）弯成一个圆圈来节省空间。它确实很聪明！但它真正的重要性不在于技巧本身，而在于这种循环排列如何完美地模拟了计算及其他领域中一些最基本的过程。看来，自然偏爱循环。计算也是如此。让我们来一次旅程，看看这个简单的循环在一些应用中是多么的通用。

公平的节奏：调度与轮流

想象一群人需要共享一个单一资源——比如一个麦克风。你如何确保每个人都有发言的机会，而没有人被忽视或独占舞台？最自然的解决方案是让他们围成一个圈，轮流传递麦克风。每个人说一会儿，然后传给邻居。这就是轮询调度（round-robin scheduling）的精髓，它几乎是所有现代操作系统的心跳。

你的计算机在不断地同时运行几十个甚至几百个任务：你的网页浏览器、音乐播放器、电子邮件客户端、后台更新。然而你只有少数几个 CPU 核心来执行它们。它是如何创造出这种同时处理所有事情的错觉的呢？它使用了一个任务的循环队列。操作系统的调度器从队列前面取出一个任务，让它在 CPU 上运行一小段时间——几毫秒——然后，如果任务没有完成，就把它放到队列的末尾等待下一次轮到它。这个过程不断重复，如此迅速地在任务间循环，以至于它们看起来都在同时取得进展。循环队列是实现这一点的完美数据结构，因为其“从头出队，从尾入队”的动作正是管理这种公平、周期性时间分配所需要的机制。

同样的公平轮流原则也出现在计算机网络中。在令牌环网络（token ring network）中，节点被排列成一个逻辑环。一个特殊的消息，即“令牌”，在环中的节点之间传递。只有拥有令牌的节点才被允许传输数据。一旦它完成（或时间用尽），它就把令牌传给环中的下一个节点。模拟这个协议是循环队列的一个优美示范，其中队列本身就是节点的环，而传递令牌则通过将一个节点出队并立即重新入队来优雅地建模。无论是 CPU 中的任务还是网络上的节点，循环队列都为公平访问提供了基本的节奏。一个类似的模型甚至可以描述经济各部门之间资本的周期性流动，显示了这一思想在模拟和建模领域的延伸。

然而，这种在一个群体中循环的想法并不总是关于共享。有时，它是关于淘汰。思考著名的约瑟夫问题（Josephus problem），这是一个残酷的谜题，人们围成一个圈，每数到第 $k$ 个人就被淘汰，直到只剩下一个幸存者。循环队列是模拟这个过程的天然工具。为了“数” $k$ 个人，我们只需将队列旋转 $k-1$ 次（即出队再入队）。现在位于队首的人就是要被淘汰的人，所以我们永久地将他们出队。圆圈缩小了，但过程继续。这显示了该结构在保持核心循环逻辑的同时如何处理动态变化。一个不那么残酷但结构上类似的应用可以在许多角色扮演游戏的回合制战斗系统中找到，其中一个角色的循环队列决定了谁下一个行动，随着战斗人员被击败并从回合顺序中移除，队列会缩小。

滑动窗口：管理有限历史记录

循环队列的另一个深刻应用源于其固定大小。它不会记住所有曾经放入其中的东西；它只为最近的 $N$ 个项目留有空间。这种拥有“有限内存”的特性使其成为实现滑动窗口（sliding windows）的完美工具——一种用于跟踪最近事件或数据的机制。

想象你正在运营一个受欢迎的网络服务。为了防止单个用户用请求淹没你的服务器，你可能会实现一个速率限制器（rate limiter）：例如，每分钟不超过 100 个请求。你如何有效地跟踪这一点？你可以存储每个请求的时间戳，但这个列表会无限增长。一个更优雅的解决方案是使用一个容量为 100 的循环队列。每次新请求到达时，你检查队列中最旧请求的时间戳（队首的那个）。如果那个最旧的请求现在已经超过一分钟，它就已经“过期”，与当前的一分钟窗口无关。你可以丢弃它（出队）并添加新请求的时间戳（入队）。如果队列里装满了在一分钟内发出的请求，那么新请求就会被拒绝。循环队列就像一个时间上的滑动窗口，有效地只维护所需的数据——最近 100 个请求的时间戳——仅此而已。

你每天在电脑上都会遇到同样的原理。当一个应用程序向你显示一个“最近文件”列表时，它是如何工作的？通常，它就是一个循环队列！如果它被配置为显示你最近的 10 个文件，它就使用一个容量为 10 的队列。当你打开一个新文件时，它的名字被添加到队列的末尾。如果队列已经满了，队首最旧的文件名就会被挤出去，被遗忘。这是一种简单、高效的方式来保持你最近活动的滚动历史，无论这个活动是 API 请求还是你打开的文档。

发现的前沿：系统性探索

最后，队列简单的先进先出（FIFO）特性使其成为探索中不可或缺的工具，特别是对于一种称为广度优先搜索（BFS）的基本算法。想象你身处一个迷宫的中心，想要找到出口。一种策略是分波次探索：首先检查所有一步之遥的走廊，然后是所有两步之遥的走廊，依此类推。这确保你找到通往出口的最短路径。

BFS 正是实现了这种策略，而队列是它的引擎。算法开始时将源位置放入一个队列中。然后，它进入一个循环：从队列中取出一个位置，并将其所有未访问过的邻居入队。通过总是处理最早添加的位置，队列保证了对图或迷宫进行逐层探索。

这里引人入胜的是，问题的结构如何反映在队列的行为中。如果我们在一个长长的、单列路径的图上执行 BFS，队列中永远不会有两个以上的节点。这就像探索一条狭窄的走廊。但是，如果我们从一个星形图的中心开始——一个连接到许多其他节点的中心枢纽——队列会突然被所有这些邻居填满。BFS 遍历期间队列的峰值大小告诉我们一些关于图在其最宽点“宽度”的深刻信息。对于一个完美二叉树，峰值队列大小将是其最大一层的节点数。对于一个密集的、高度互联的网络，队列可能暂时容纳总节点数的很大一部分。在这种情况下，简单的循环队列变成了一个探针、一个测量设备，揭示了它正在探索的世界的底层结构。

从调度器的公平轮换到速率限制器的滑动窗口，再到搜索算法的扩展前沿，循环队列远不止是一个小小的优化。它是一种基本的模式，一种我们在计算的结构中发现的、关于循环和有限内存的优美表达。