动态存储分配

玻尔百科

核心要点

动态存储的基本权衡在于快速、临时的栈与灵活、持久的堆之间。
逃逸分析是编译器用来判断数据能否安全地分配在栈上，还是必须“逃逸”到堆上的关键策略。
在 Rust 等语言中，编译器强制实施的生命周期规则通过静态地证明引用不能比栈上分配的数据活得更久，从而防止了悬垂指针的产生。
动态内存分配的原理，如碎片化和适应策略，普遍适用于管理其他有限资源，例如物理空间或时间。

引言

每个运行中程序的核心都面临一个根本性挑战：如何动态地管理内存。程序在执行过程中会创建和销毁数据，而将这些信息存放在何处——是放在一个临时的、快速访问的位置，还是一个更持久、更灵活的存储区域——这个决定对速度、安全性和功能有着深远的影响。本文旨在探讨这个看似简单的选择背后的复杂性，超越对栈和堆的基本定义，揭示一套统一的原则。在接下来的章节中，我们将首先探讨动态存储的核心“原理与机制”，审视栈和堆的角色、编译器通过逃逸分析管理它们的关键作用，以及对闭包等经典问题的解决方案。随后，在“应用与跨学科联系”部分，我们将发现这些相同的原则如何远远超出了内存管理的范畴，影响着从实时系统、语言设计到非计算资源分配的方方面面，为理解贯穿整个技术领域的资源管理问题提供了一把万能钥匙。

原理与机制

想象你是一个正在运行的计算机程序。在执行过程中，你会创建各种信息——数字、文本、复杂的数据结构。你就如同一位在工坊里忙碌的工匠。你会把这些东西放在哪里？是放在触手可及的工作台上，明知完成当前任务后就会把它们丢到一边？还是把它们仔细打包，送到一个长期存储的仓库，在那里它们可以被无限期地安全保存？这个“把东西放在哪里”的简单问题，正是动态存储分配的核心，其答案揭示了秩序与自由、速度与安全之间的一场优美的舞蹈。

内存的两个世界：栈与堆

在这场数据的大戏中，有两个主要角色，两个信息可以栖居的截然不同的世界：栈 (Stack) 与 堆 (Heap)。

栈就是你的工作台。它是纪律与效率的典范。当一个函数被调用时，一个新的、干净的空间会在栈顶展开——一个活动记录 (activation record) 或 栈帧 (stack frame)。这个帧存放着函数的局部变量、参数以及返回其调用者所需的信息。当函数结束时，它的整个帧会被瞬间清除。这是一种后进先出（LIFO）的规则，就像一叠盘子。最后放上去的帧最先被移走。这个过程快得令人难以置信；分配和回收整个帧通常只需移动一个指针，是一个单次、常数时间（ $O(1)$ ）的操作。但这种速度伴随着一条严格的规则：栈上任何东西的生命周期都严格地与其函数调用的生命周期绑定。当函数返回时，它的工作台就会被清空，不留任何余地。

另一方面，堆则是一个巨大、广阔的仓库。它是一个自由的王国。你可以在任何时候请求任意大小的内存块，它会一直属于你，直到你显式地归还它（在像 C++ 这样的语言中），或者直到一个系统级的清洁工——垃圾回收器 (Garbage Collector, GC)——判定它不再被需要。这种灵活性非常强大。它允许你创建生命周期与创建它的函数毫无关联的数据。但这种自由是有代价的。在堆上分配内存是一个更复杂的操作；系统必须找到一个大小合适的空闲块，这个过程比简单地调整栈指针要慢。而管理这些内存——避免“泄漏”（即内存被分配但从未释放）——是一个巨大的挑战。

因此，我们面临一个根本性的权衡：快如闪电、有序但临时的栈，对比灵活、持久但成本更高的堆。对于大多数局部变量，选择是显而易见的：栈。但一旦我们想要创建某个生命周期超越当前任务的东西，我们就进入了一个充满迷人复杂性的世界。

Funarg 上移问题：当世界碰撞时

最初，简单、纯净的栈世界被编程语言中一个强大的思想搅得一片欢腾的混乱：将函数视作与其他任何数据一样。你可以将它们传递给其他函数，将它们存储在变量中，甚至可以拥有创建并返回新函数的函数。

一个在另一个函数内部创建，并记住了其诞生环境的函数，被称为闭包 (closure)。让我们来看一个经典场景。想象一个函数 MakeAccum，它接受一个基数，并返回一个新函数 Step。这个 Step 函数在被调用时，会将一个数加到原始基数上并返回结果。要做到这一点，Step 必须记住来自 MakeAccum 的 base。

危机就在这里：MakeAccum 创建了 Step，然后 MakeAccum 返回，其栈帧被清除。变量 base 消失了！但稍后，我们调用了返回的 Step 函数。它怎么可能工作呢？它试图访问一个位于已被拆除的“家”中的变量。指向其旧环境的指针现在成了一个“悬垂指针”，指向垃圾数据。这就是著名的 funarg 上移问题 (upward funarg problem)：一个函数参数（“funarg”）被向上传递，超出了其创建作用域，而它的环境必须以某种方式存活下来。

大逃逸：一个统一的原则

解决这个危机的方案既优雅又强大。它是一条决定栈与堆之间选择的单一规则：如果一个数据片段的生命周期需要比其诞生的栈帧更长，它就必须逃逸 (escape) 到堆上。

编译器就像一个聪明的侦探，执行所谓的逃逸分析 (Escape Analysis)。它一丝不苟地追踪程序中每个指针和引用的流向，以确定一个对象在其创建函数返回后是否还能被访问。如果编译器能够证明一个对象在其函数返回后绝不会被使用，那么将它分配在栈上就是安全的。如果无法证明这一点，它就必须保守地假设该对象会逃逸，并将其放置在堆上。

什么会导致对象逃逸？其模式简单而直观：

将其返回： 函数返回一个指向其创建的对象的指针或引用。调用者现在持有一个指向某个东西的引用，而这个东西所在的栈帧即将消失。这是一种明确的逃逸。
全局存储： 函数将其局部对象的指针存储在一个全局变量或另一个已存在于堆上的对象中。该对象现在可以从外部访问，因此它已经逃逸了。
传递给另一个线程： 当一个对象被传递给一个并发线程时，它的生命周期现在就与那个线程绑定在一起了，而那个线程很可能比原始函数活得更久。这是进入另一个时间线的一种逃逸形式。
传递给未知函数： 如果你将一个指针传递给一个你看不到其代码的函数（例如，一个单独编译的库），你必须做出最坏的假设：该函数可能会将指针存储在某个地方，导致其逃逸。

相反，如果一个对象只在局部使用，或被传递给一个已知不会将其存储起来的可信辅助函数，那么它就不会逃逸。例如，将一个对象传递给一个 sumPair 函数，该函数只读取其字段并返回一个数字，这是安全的；对象本身并未通过这次调用而逃逸。

编译器的艺术：复杂的策略

有了逃逸原则这件武器，现代编译器可以采用非常复杂的策略来高效、安全地管理内存。

一个有趣的案例出现在生成器 (generators) 或 协程 (coroutines) 中——这些函数可以 yield 来暂停其执行，并在稍后恢复。当生成器暂停时，它的局部变量和当前位置必须被保留。它们不能留在主调用栈上，因为其他函数会被调用并覆盖该空间。解决方案是什么？生成器的整个活动记录被实体化 (reified)——即转化为一个数据对象——并移动到堆上。当生成器恢复时，它的状态会从这个堆对象中加载回来。这是整个栈帧逃逸的一个绝佳例子。

编译器也可以做到极其精确。它们并不总是需要将整个数据结构移动到堆上。假设一个闭包发生了逃逸，但它只需要其父环境中的一个变量，并且该变量是可变的（可以被更改）。编译器可以执行一种外科手术式的打击：它仅为这一个变量在堆上分配一个小盒子，并让闭包指向这个盒子。父环境中的所有其他不逃逸的局部变量，则可以安然地留在快速的栈上。这种选择性提升，通常被称为装箱 (boxing) 或闭包转换 (closure conversion)，证明了编译器在最小化堆开销方面的艺术。编译器甚至可以区分可变和不可变的捕获变量。一个不可变变量的值可以直接复制到逃逸闭包的环境中，而一个必须共享的可变变量则需要一个堆分配的单元，以便所有闭包都能引用它。

自由的代价：成本与后果

将数据放在哪里的决定不仅关乎正确性，也关乎性能和安全，而做错决定的后果可能非常严重。

在像 C++ 这样没有自动内存管理的语言中，程序员就是侦探。他们必须手动确保堆分配的内存被释放。在面对异常时，这变得非常危险。如果你用 new 分配了内存，然后调用一个抛出异常的函数，那么本应用于清理内存的 delete 语句可能被永远跳过，导致内存泄漏 (memory leak)。这种危险催生了一种严谨的设计哲学，称为资源获取即初始化 (Resource Acquisition Is Initialization, RAII)。其思想是将堆分配资源的生命周期与一个栈分配的“所有者”对象绑定。这个所有者对象的析构函数保证在函数退出时（无论是正常退出还是因异常退出）都会运行，其任务就是释放资源。这就是像 std::unique_ptr 这样的智能指针背后的原理，它将一个手动的、易错的过程转变为一个自动的、安全的过程。

即使由编译器做出决定，权衡也可能非常微妙。让我们考虑一个大数组。将它放在栈上似乎很快。然而，为了防止程序的栈不受控制地增长并侵入内存的其他部分，操作系统使用一种称为保护页 (guard pages) 的机制。为了在栈上安全地分配一个大块内存，编译器可能需要生成代码来“探测”每个新的内存页，这会触发一连串的页错误。堆分配虽然初始成本较高，但可能避免这种特定的惩罚。一个真正先进的编译器可以分析这些成本——堆分配的固定成本与栈探测的每页成本——并得出一个阈值。对于小于此阈值的数组，使用栈；对于更大的数组，使用堆。这表明，动态存储分配不是一个只有一个答案的已解决问题，而是一个丰富的优化领域，编译器在语言特性、操作系统和底层硬件之间进行着精妙的平衡。这个“把东西放在哪里”的简单问题，最终触及了计算系统的每一层，展现了各种原则协同工作的美妙统一。

应用与跨学科联系

当我们初次学习动态存储时，通常会被介绍给栈和堆这对伟大的组合。我们学习规则：栈用于有序的、后进先出的分配，与函数调用绑定，快速而严格。堆则是一个更狂野的地方，一个我们可以随意取用和归还的内存水库，功能强大但充满危险。我们可能会认为，管理这种二元性只是一个狭隘的关注点，是系统程序员使用 malloc 或 new 时的一项技术性杂务。但事实远非如此。动态分配的原则不仅仅关乎内存；它们关乎任何有限、可分割资源的管理。秩序与混乱、速度与灵活性、可预测性与强大功能之间的权衡，在科学和工程的广阔而迥异的领域中回响。理解动态存储，就如同掌握了一把钥匙，可以解锁整个计算世界中令人惊奇的联系。

作为通用资源管理器的分配器

让我们暂时抛开比特和字节，考虑一个更熟悉的问题：为学生小组分配宿舍房间。想象一所大学有一栋长长的建筑，里面有各种大小、全部连续的房间。这栋建筑就是我们的“堆”。现在来了一个请求，需要一个能容纳 $5$ 名学生的房间。我们查看空房间列表，找到一个合适的。我们是使用找到的第一个足够大的房间（“首次适应”策略）？还是搜索那个能留下最少浪费空间的空房间（“最佳适应”策略）？如果一个 $3$ 人的小组被分配到一个 $4$ 人间会怎样？我们造成了空间浪费，这是一种“内碎片”。如果我们有三个独立的单人空房，但来了一个两人小组呢？我们总空间足够，但没有一个单独的房间足够大。这就是“外碎片”。你看，适用于内存分配的挑战和策略，完全同样地适用于物理空间的分配。为你的程序分配内存的算法，稍加修改，就可以管理一支送货卡车车队、分配医院的手术室，甚至调度工厂车间的时间。

当被管理的资源不是物理空间，而是时间本身时，这个类比变得更加有力。在高频交易的世界里，每一微秒都至关重要。一个自动化交易系统必须调度计算任务，每个任务都有一定的持续时间、一个最早开始时间以及一个必须完成的截止期限。一个交易日内的总可用时间可以被看作一个“时间堆”。调度一个任务的请求，就是请求分配一个连续的时间块。分配器必须找到一个满足任务约束的“空闲”时间槽。如果一个交易在执行前被取消，它的时间槽就被“释放”，并可以与相邻的空闲槽合并，形成一个更大的机会窗口。用于内存的完全相同的“最佳适应”算法可以被调整来寻找最优的时间槽，或许可以最小化任务开始前的延迟。这揭示了一种美妙的统一性：无论我们是在分配内存的字节，还是在分配机会的微秒，问题的抽象结构都是相同的。

看不见的手：作为分配大师的编译器

虽然我们有时会显式地管理资源，但大量的动态分配是在幕后进行的，由一只看不见的手——编译器——精心策划。当你用高级语言编写代码时，你表达的是你的意图，而编译器则将其转化为栈和堆操作的具体现实。这个翻译过程并非单调的机械过程；它是一种艺术形式，充满了智慧和深刻的权衡。

考虑一个简单的函数调用 x = f()，其中函数 f 返回一个大的数据结构。一个天真的编译器可能会让函数 f 在其自己的栈上创建该结构，然后在返回时将其复制到调用者的栈上——这是一个昂贵且浪费的操作。然而，一个聪明的编译器知道更好的做法。它会安排调用者在其栈上为返回值预先分配空间，然后将一个隐藏的指针传递给被调用者。函数 f 接着直接在调用者预分配的槽中构造结果。当 f 返回时，不需要任何复制；值已经到家了。这种优雅的舞蹈，被称为返回值优化 (Return Value Optimization, RVO)，是编译器如何操作栈帧——一种动态存储形式——以使我们的高级代码以惊人效率运行的完美例子。

当面临限制时，编译器的巧思最为闪耀。想象一下，为卫星或医疗植入物上的微型微控制器构建软件，这是一个没有堆也没有垃圾回收器的世界。我们如何支持像闭包（从其环境中“捕获”变量的函数）这样的现代编程特性？通常，如果闭包的生命周期超过其创建函数，其环境就必须在堆上分配。没有堆，这似乎是不可能的。然而，编译器理论家们已经设计出了非凡的解决方案。一种技术是去函数化 (defunctionalization)，它转换程序，使所有闭包都被简单的数据标签取代，它们的环境则存储在一个预分配的静态池中。另一种技术是流融合 (stream fusion)，它可以分析像 map 和 fold 这样的操作流水线，并将整个链条转换为一个单一、高效的状态机，从而完全消除对中间闭包的需求。这表明，即使像堆这样的核心工具被拿走，管理状态和生命周期的基本原则也可以用创造性的新方式重新应用。

也许编译器技能库中最复杂的技巧是*逃逸分析*。想象一个函数创建了一个数据传输对象 (Data Transfer Object, DTO)。如果这个 DTO 用于某些局部日志记录然后被丢弃，它的生命周期就不需要超过函数调用；它可以安全地分配在快速、简单的栈上。但如果同一个 DTO 被通过网络发送到另一个服务，它的生命周期就变得未知；它“逃逸”了当前函数，必须在堆上分配。一个现代编译器可以分析这些不同的路径。对于同一段源代码，它可以生成两种不同的结果：为局部的、不逃逸的路径进行栈分配，为逃逸的路径进行堆分配。这种路径敏感的优化让我们两全其美：我们编写简洁、高级的代码，而编译器自动执行复杂的内存管理，使其尽可能快地运行。

动态世界中的保证：安全性与可预测性

在许多系统中，性能不仅关乎平均速度快，更关乎始终可预测地快。在一个控制汽车刹车或工厂机器人的实时操作系统 (Real-Time Operating System, RTOS) 中，一次耗时过长的内存分配可能是灾难性的。一个标准的 malloc 实现，可能需要搜索一个长长的空闲块列表，对其最坏情况下的执行时间没有任何保证。它的延迟是无界的。这是不可接受的。对于这些关键系统，需要专门的分配器。像两级隔离适应 (Two-Level Segregated Fit, TLSF) 分配器这样的设计，使用位图等巧妙的数据结构，可以在常数时间内找到一个合适的空闲块，无论堆有多么碎片化。这为分配延迟提供了一个硬性的、可预测的上限，使得在享受动态内存灵活性的同时，构建可靠的实时系统成为可能。

除了可预测性之外，还有一个至关重要的目标：安全。几十年来，编程中最隐蔽的错误之一就是“悬垂指针”——一个指向栈上内存位置的引用，而该位置在其函数返回时已经被释放。使用这样的指针会导致崩溃、安全漏洞和极其困难的调试过程。多年来，普遍的看法是，你必须做出选择：要么选择 C/C++ 的原始性能，但承担悬垂指针的风险；要么选择像 Java 或 Python 这样带有性能开销的垃圾回收语言的安全性。

Rust 语言提出了一种革命性的第三条道路，它建立在对存储分配深刻、形式化的理解之上。Rust 编译器在编译时强制执行一套规则，其中最重要的一条是：任何引用都不能比它所指向的数据活得更久。对于栈分配的变量，这是通过将编译时“生命周期”的概念与函数活动记录的动态生命周期直接绑定来实现的。如果你试图返回一个对局部变量的引用，编译器知道该变量的栈帧即将被销毁，它会拒绝你的程序。它静态地证明了，指向栈的悬垂指针永远不可能存在。这提供了垃圾回收语言的内存安全性，同时具备底层系统代码的性能——这是语言设计上的一个里程碑式成就，其根源完全在于对栈分配原则的严格应用。在此基础上，人们甚至可以设计出像 $no_heap$ 属性这样的语言特性，允许程序员声明一个函数永远不应该在堆上分配内存，或允许其栈指针逃逸，这是一个可以由编译器静态验证的保证。

日常选择

最终，这些宏大的思想渗透到每个软件开发人员的日常工作中。你面临一个选择：你是将整个目录的内容读入一个大的、堆分配的数组中进行处理，还是以流的方式逐个条目读取，使用恒定的内存？第一种方法，就像 Linux 上的 scandir，很方便，但可能消耗大量内存。第二种方法，像 readdir，更节俭，但可能需要更复杂的逻辑。同样，在实现像回溯这样的递归算法时，你是依赖递归的简洁性，冒着搜索树太深时栈溢出的风险？还是你愿意付出手动在堆上实现自己的栈的努力，以复杂性为代价换取无限的深度？

这些并非晦涩的学术问题。它们是实际的、日常的工程决策。答案取决于具体问题、预期输入和硬件限制。但是，对动态存储分配基本原则的理解——栈与堆的相互作用、碎片化的幽灵、延迟与吞吐量之间的权衡，以及程序员意图与编译器优化之间的舞蹈——正是赋予我们做出正确选择的力量。它使我们从一个语言的普通使用者，转变为可靠、高效、优美软件的自觉构建者。