传需调用求值策略

玻尔百科

定义

传需调用求值策略是一种延迟计算的求值方法，它通过将表达式封装为“thunk”并在结果被实际需要时才进行求值。该策略利用记忆化机制保存首次求值的结果供后续使用，从而避免重复计算并优化系统性能。它支持定义和操作无限数据结构，被广泛应用于用户界面设计和操作系统请求分页等领域，但也可能带来内存泄漏等挑战。

核心要点

惰性原则： 传需调用是一种求值策略，它通过将表达式打包成“thunk”来延迟计算，只有当表达式的结果被需要时，它才会被求值。
高效复用： 它通过记忆化来优化性能。thunk 首次求值的结果会被保存，并在后续所有请求中复用，从而避免了重复工作。
实现无限： 该策略使得定义和操作概念上的无限数据结构成为可能，因为只有被实际访问的部分才会被计算。
实际应用与风险： 它被应用于从用户界面设计到操作系统（请求分页）等多个领域，但也带来了性能推理和潜在内存“空间泄漏”等挑战。

引言

在编程世界里，计算机如何以及何时决定执行其工作，是一项具有深远影响的基础性选择。大多数主流语言遵循一个简单的原则：立即执行工作。当一个函数被调用时，它的所有输入在函数开始执行前都已被完全计算。这种“及早”（eager）的方法简单直接，但可能极其低效，迫使机器执行可能永远不会被用到的昂贵计算。是否存在一种更智能、更具策略性的方式来管理计算量呢？

本文深入探讨的就是这样一种策略：传需调用 (pass-by-need)，这通常被称为惰性求值 (lazy evaluation) 背后的复杂引擎。它是一种“智能拖延”的哲学：非到万不得已，不执行任何工作；并且，永远不要重复计算同一件事。这个简单的理念开启了更高层次的表达能力，为那些用及早求值难以解决甚至无法解决的复杂问题，提供了优雅的解决方案。

在接下来的两节中，我们将深入探讨这个迷人的概念。首先，在“原理与机制”一节中，我们将剖析传需调用在底层是如何工作的，探索 thunk、记忆化和图归约等概念，并了解它如何使得创建无限数据结构成为可能。然后，在“应用与跨学科联系”一节中，我们将发现这个看似抽象的理论如何在从编译器设计、用户界面到操作系统和区块链技术等各个领域中产生具体而强大的应用。

原理与机制

想象一下，你是一家盛大宴会的总厨，菜单上列满了复杂的菜肴。你会不会在一开始就把菜单上的每一道菜都做好，堆在厨房里，以防有客人点餐？这种我们可称之为及早求值 (eager evaluation) 的方法看似勤勉，实则极其浪费。万一没人点舒芙蕾呢？所有的努力都白费了。如果某道菜需要数小时准备，并因此耽误了其他所有事情呢？

有一种更聪明的方法。你可以把每道菜的食谱写下来，甚至做一些准备工作。然后，你等待。只有当客人点了某道特定的菜时，你才拿出食谱来烹饪。这就是惰性求值 (lazy evaluation)，或者更正式地称为传需调用 (pass-by-need) 的精髓。它是一种“非到万不得已，不执行工作”的哲学。在编程世界里，这个简单的理念带来了深刻而优美的结果。

拖延的艺术：Thunk

让我们把总厨的比喻转换成计算语言。那种“及早”的策略被称为传值调用 (call-by-value)。当你调用一个函数时，计算机做的第一件事就是完全求值你传递给它的所有参数，甚至在查看函数本身之前。这是最常见的策略，用于 C++、Java 和 Python 等语言。它简单且可预测。

而惰性求值则不同。当你调用一个函数时，参数不会被求值。取而代de，计算机会将每个参数的表达式打包成一个“承诺”或“食谱”，用于以后计算其值。这个承诺是一个特殊的对象，我们称之为 thunk。thunk 是一个被暂停的计算，静静地等待着它大放异彩的时刻。

这揭示了策略上的深刻差异，这种差异通过一个计算领域的经典思想实验而变得尤为明显。想象我们有一个函数，无论给定什么输入，它总是返回数字 42。我们将其写作 $(\lambda x. 42)$ 。现在，我们用一个表示不可能、永不终止的计算的参数来调用这个函数——一个我们称之为 $\Omega$ 的计算黑洞。完整的表达式是 $(\lambda x. 42)\,\Omega$ 。

在传值调用下，计算机首先尝试求值参数 $\Omega$ 。它一头扎进黑洞，再也没有回来。程序陷入了无限循环。

在传需调用下，计算机不会求值 $\Omega$ 。它创建一个 thunk——一个承诺在需要时计算 $\Omega$ 的对象——并将这个 thunk 传递给函数。函数 $(\lambda x. 42)$ 接着执行。它查看自己的函数体，发现只需要返回 42，并意识到它根本不需要知道参数 $x$ 的值。因此，它从未“兑现”那个承诺。 $\Omega$ 的 thunk 从未被强制求值，危险的计算从未开始，程序愉快地返回 42。

这就是惰性的第一个超能力：避免不必要的工作。如果一个结果从未使用过，计算它的工作就永远不会执行。在一个像 let x = expensive_computation in 1 这样的简单例子中，会为 expensive_computation 创建一个 thunk，但因为最终结果只是 1，x 的 thunk 从未被强制求值。最终，程序的垃圾回收器注意到这个未兑现、不需要的承诺，并简单地将其丢弃，从而在未做任何工作的情况下回收内存。

共享即关怀：记忆化的力量

避免工作固然很好，但如果我们需要多次使用同一个值会发生什么？最早的惰性求值形式，称为传名调用 (call-by-name)，就像一位厨师，每次接到订单时都从头重新阅读食谱并烹饪整道菜，即使这已经是第五次点同一道菜了。这可能非常低效。

传需调用 (Call-by-need) 引入了一个至关重要的优化：记忆化 (memoization)。当一个 thunk 第一次被强制求值时，它的结果会被计算出来然后保存下来。该 thunk 会被原地更新为最终值。之后任何时候需要这个值，计算机只需检索已保存的结果，而无需重新计算。

让我们通过一个简单的函数 f(y) = y + (y * y) 来看看它的实际作用。假设我们给它传递一个有副作用的参数，比如“增加一个计数器并返回新值”。假设计数器从 0 开始。

在传名调用（无共享）下，表达式 y + (y * y) 会三次请求 y 的值。每次，参数都会被重新求值。
1. 第一个 y被求值：计数器变为 1，值为 1。表达式现在是 $1 + (y * y)$ 。
2. 第二个 y被求值：计数器变为 2，值为 2。表达式现在是 $1 + (2 * y)$ 。
3. 第三个 y被求值：计数器变为 3，值为 3。表达式现在是 $1 + (2 * 3)$ 。最终结果是 $1 + 6 = 7$ ，计数器增加了三次。
在传需调用（有共享）下，情况则大不相同。
1. 第一个 y被求值：计数器变为 1，值为 1。这个结果 1，现在被存储在 y 的 thunk 中。表达式现在是 $1 + (y * y)$ 。
2. 需要第二个 y。计算机检查 thunk，找到了存储的值 1，并使用它。没有重新求值，没有副作用。表达式现在是 $1 + (1 * y)$ 。
3. 需要第三个 y。同样，使用存储的值 1。表达式现在是 $1 + (1 * 1)$ 。最终结果是 $1 + 1 = 2$ ，计数器只增加了一次。

这种共享机制，通常通过一种称为图归约 (graph reduction) 的技术实现，不仅仅是为了处理副作用的正确性；它具有巨大的性能影响。想象一个将其参数加倍的函数 G(x) = x + x。现在考虑重复应用这个函数，比如 G(G(G(...G(1)...)))。如果没有共享，工作量会呈指数级增长，就像一个家族树，每个祖先的工作都必须为每个孩子重做一遍。有了共享，每一步完成的工作都被复用，总工作量仅线性增长。这将一个棘手的指数级计算爆炸转变为一个可管理的线性过程。

无限的魔力

所以，惰性求值避免了不必要的工作，并使重复的工作变得高效。我们可以用这些能力构建什么呢？答案是计算机科学中最优雅的思想之一：无限数据结构 (infinite data structures)。

你怎么可能在一台有限的计算机里存储一个无限的数字列表呢？你不需要。你只需存储一个如何生成它的“食谱”。惰性求值允许我们定义概念上无限的数据结构，因为我们只计算我们实际需要查看的有限部分。

经典的例子是斐波那契数的无限流。斐波那契数列是 $0, 1, 1, 2, 3, \dots$ ，其中每个数是前两个数之和。我们可以用一个优美的自指方程来定义它：

fibStream = [0, 1] ++ zipWith(+) fibStream (tail fibStream)

起初这看起来毫无道理。它用 fibStream 自己来定义 fibStream！但让我们看看惰性求值是如何解开它的。这个定义创建了一个 thunk。fibStream 是一个承诺，它以 0 开始，接着是 1，而流的其余部分 (...) 是另一个承诺：zipWith(+) fibStream (tail fibStream)。

如果你请求第一个元素，你会得到 0。很简单。
如果你请求第二个元素，你会得到 1。仍然很简单。
如果你请求第三个元素，你强制求值 zipWith thunk。它需要将 fibStream 的第一个元素（即 0）与 tail fibStream 的第一个元素（即 1）相加。结果是 1。
如果你请求第四个元素，zipWith thunk 继续执行。它将 fibStream 的第二个元素（1）与 tail fibStream 的第二个元素（即 fibStream 的第三个元素，我们刚刚计算出是 1）相加。结果是 2。

计算是按需展开的。这个流是一个知道如何生成自身的“对象”，并且只有当我们“拉动”它时它才会这样做。我们可以请求前 10 个或前 1000 个元素，程序将会终止，只计算了被请求的部分。一个及早的、传值调用的语言会试图先构建整个无限列表，陷入无限循环，然后崩溃。

警示之言：惰性的代价

这种能力并非没有代价。惰性求值引入了它自己的一系列挑战，需要一种不同的思维方式。

首先，对性能进行推理变得棘手。在及早求值的语言中，你知道代码何时运行：就在你写它的地方。在惰性语言中，thunk 的执行被推迟到程序中某个未知的、稍后的时间点。这可能使调试和性能分析更加困难。

其次，像打印到屏幕或写入文件这样的副作用成了一个雷区。想象一个表达式 print("A") + print("B")。由于加法是可交换的，一个惰性编译器可能会认为它可以自由地以任一顺序求值这两个 print 语句，导致一次运行输出 "AB"，另一次输出 "BA"。这种不确定性是不可接受的。为了解决这个问题，像 Haskell 这样的惰性函数式语言付出了巨大的努力，将纯粹的数学计算与有副作用的动作分离开来，通常使用一种称为 monad 的数学结构来为所有副作用强制执行一个严格的、可预测的序列。

最后，也是最臭名昭著的，惰性求值可能导致空间泄漏 (space leaks)。一个 thunk，我们未求值的承诺，会占用内存。它必须存储要计算的表达式以及它所需要的上下文。如果你的程序构建了大量这样的 thunk 并持有它们，却从不强制求值它们，你可能会耗尽内存。一个经典的例子是从列表的左侧反复追加。在惰性语言中，像 ((list1 ++ list2) ++ list3) 这样的表达式实际上并不执行追加操作。它创建了一个 thunk，表示“当你需要我时，我会是 list2 追加到 list1 的结果，然后再将 list3 追加到那个结果上”。如果你构建了一个非常长的这样的链，你就会创建一长串未求值的 thunk，为一个甚至尚未计算的结果消耗大量内存。

计算与内存之间、能力与风险之间的这种微妙平衡，正是惰性求值成为一个如此迷人话题的原因。它不仅仅是一个技术实现细节；它是一种从根本上不同的计算结构哲学，只要我们小心行事，它就能开辟表达能力的新世界。

应用与跨学科联系

在经历了“传需调用”的原理与机制之旅后，你可能会觉得这只是编程语言设计师的一个巧妙但或许小众的技巧。事实远非如此。这个简单的想法——非到必须，不计算任何东西；并且，永不重复计算同一件事——不仅仅是一个技术细节。它是一种管理复杂性和资源的深刻而通用的策略，其回响可以在计算机科学与工程中一些最意想不到的角落里找到。这是一门智能拖延的艺术，也是你日常使用的许多系统背后的秘密武器。

将无限，变为有限

让我们从听起来像魔法的事情开始。你如何在一台内存有限的计算机中表示一个无限列表，比如说，所有自然数的列表？一个严格的、及早求值的方法会开始生成数字永不停止，很快就会耗尽内存。这正是惰性求值施展其第一个伟大魔法的地方。

考虑一个简单的流项目递归配方：要构建一个流，你生成一个项目，然后给出构建流其余部分的配方。在惰性语言中，这看起来像是 build(state) = cons(item, build(next_state))。将一个项目连接到列表其余部分的 cons 构造函数，起到了“暂停”按钮的作用。计算机不会立即冲去求值 build(next_state)。相反，它创建了一张“期票”——我们的朋友，thunk——它只记住稍后如何去做。

当你请求第一个元素时，机器只做足够的工作来产生它。无限列表的其余部分仍然是一个单一的、未求值的承诺。当你请求第二个元素时，机器“兑现”承诺，产生第二个元素和一个用于其余部分的新承诺。从操作上看，看似深度的递归被转换成了一个简单的迭代过程：产生一个值，更新你的状态，然后等待。调用栈不会增长；相反，工作被转换成堆分配的 thunk。这种需求驱动的展开与迭代式状态机是无法区分的。

这不仅仅适用于简单的序列。想想斐波那契数列，其中每个数都是前两个数之和。一个朴素的递归定义效率极低，因为它会一遍又一遍地重新计算相同的值。然而，一个惰性的、“传需调用”的定义却大放异彩。通过用自身来定义斐波那契流（例如，作为自身与其自身尾部的和），传需调用的记忆化特性确保了每个斐波那契数只被精确计算一次。当第一次需要 $F_n$ 时，它被计算并存储其值。之后每次其他计算需要它时，存储的值会被立即返回。其结果是，计算效率与精心手写的迭代循环一样高，但表达方式却如一个简单的递归数学定义般优雅。

管道中的幽灵

这种逐块计算事物的能力在编译器设计中还有另一个显著的后果。想象你有一个庞大的数据集，你想对它执行一系列转换——比如，首先对每个元素 map 一个函数，然后 filter 结果。

在传统的严格语言中，计算机首先会费力地完成整个 map 操作，在内存中创建一个巨大的中间列表。只有在这完成之后，它才会开始 filter 操作，创建另一个列表。对于大型数据集来说，这极其浪费。

惰性求值实现了一种称为融合 (fusion) 或去森林化 (deforestation) 的优美优化。当你将惰性操作链接在一起时，不会创建任何中间列表。相反，当你请求最终结果的第一个元素时，这个需求信号会向后传播通过管道。filter向map请求一个项目。map从原始源中取出一个项目，进行转换，然后交给filter。filter检查它是否通过测试。如果通过，那一个元素就作为最终结果产生，整个管道暂停，等待下一个需求。如果不通过，filter就向map请求下一个项目。

数据按需逐个元素地流过。中间列表是一个“幽灵”——它在程序结构中概念性地存在，但从未需要在内存中完全分配。这使得程序员可以编写干净、模块化、可组合的代码，而无需为抽象付出性能代价。

从抽象到具体

这些思想并不僅限于编译器的学术世界。它们是许多大规模、真实世界系统背后的引擎。

用户界面： 想想一个带有看似无尽滚动信息流的现代应用程序，比如社交媒体时间线或电子商务网站。一次性渲染所有数千个项目是不可能的。相反，框架可以将每个UI组件视为一个thunk。系统只“强制”那些当前在视口中可见的thunk——也就是说，渲染这些组件。当你滚动时，新的thunk会在它们进入视野之前被强制求值。这就是需求驱动的渲染，是惰性求值的直接应用。

地理信息系统 (GIS)： 当你使用在线地图服务时，你看到的是一个庞大数据集的微小窗口。整个世界并不会被下载到你的设备上。地图被分成瓦片，每个瓦片可以被看作一个thunk，其“计算”是从服务器获取瓦片图像的I/O操作。当你平移和缩放时，你的视口需要新的瓦片，这会强制它们的thunk被求值，并触发必要的网络请求。得益于记忆化，如果你滚动离开然后又回来，已经加载的瓦片会立即从本地缓存中显示，无需再次进行I/O操作。

网络服务： 在一个复杂的应用程序中，不同的组件可能独立地需要来自远程服务器的同一份数据。一个朴素的实现会发出多个相同的网络请求，浪费带宽和服务器资源。一个受传需调用启发的更智能的方法是使用请求合并 (request coalescing)。第一个请求某个资源URL的组件会为其创建一个thunk并开始网络获取。如果在第一个请求进行中时另一个组件请求相同的URL，它只是“订阅”正在进行的请求的结果。在数据到达并被记忆化之后发出的任何请求都会被立即服务。

一个惊人的类比：操作系统

科学中最美妙的事情之一，就是在两个看似无关的领域中发现同一个深层原理在起作用。惰性求值与操作系统概念请求分页 (demand paging) 之间的关系就是一个惊人的例子。

你的计算机拥有有限的快速物理RAM，但一个程序可以在一个大得多的虚拟地址空间中运行。操作系统通过只将程序最近使用的部分保留在RAM中来管理这种错觉。当程序试图访问一块当前不在RAM中的内存时，硬件会触发一个页错误 (page fault)。

让我们建立这个类比：

一个虚拟内存页就像一个 thunk。
访问一个非驻留页就像请求 thunk 的值。
页错误是强制 thunk 求值的 EVAL 操作。
操作系统将页面从慢速磁盘加载到RAM中是昂贵的计算。
之后当页面在RAM中时对其的访问是快速的内存命中，类似于使用记忆化的结果。

这就是惰性求值的精髓，在硬件和系统软件中实现！这个类比甚至帮助我们推理性能。操作系统应该及早地预取它预测程序很快会需要的页面，还是应该纯粹惰性地等待错误发生？答案取决于预测正确的概率。如果操作系统预取了一个从未使用过的页面，它就浪费了昂贵的磁盘I/O。这种浪费工作的预期成本恰好是页错误的成本乘以该页面本不会被需要的概率。

当然，没有哪个类比是完美的。纯函数式thunk的值是不可变的，而内存页则一直被写入。但在资源管理策略上的相似之处——将昂贵的工作推迟到证明其必要性时——是精确而深刻的。

黑暗面：空间泄漏的危险

尽管这种策略功能强大，但它也有一个“黑暗面”。通过承诺记住计算结果，传需调用有时会记住太多东西。这导致一个被称为空间泄漏 (space leak) 的微妙问题。

想象一下我们使用惰性斐波那契方法计算 $F_{30}$ 。 $F_{30}$ 的 thunk 持有对 $F_{29}$ 和 $F_{28}$ 的 thunk 的引用。反过来， $F_{29}$ 的 thunk 持有对 $F_{28}$ 和 $F_{27}$ 的引用，以此类推，一直到开头。在我们得到最终答案后，我们可能只关心数字本身。但是如果 thunk 们保留着它们的依赖指针，那么整个由30个计算值组成的链条可能会在内存中保持活动状态，阻止垃圾回收器回收它们,。你只请求了一个数字，却无意中保留了其计算的整个历史。

解决方案需要更精心的工程设计。一旦一个 thunk 被强制求值并存储了它的值，它应该释放它用于计算的依赖项的引用。这打破了链条，并允许垃圾回收器完成其工作，只保留那些真正仍然需要的值。惰性不是魔法；它自动化了时间（计算）的管理，但可能将管理空间（内存）的负担转移给了程序员。

惰性的前沿

按需计算的原则继续在前沿领域找到应用。

证明助手： 形式化的数学证明可以是巨大的结构，其中一个定理依赖于数百个引理。验证这样的证明在计算上可能非常密集。通过将每个引理的证明视为一个 thunk，证明助手可以采用惰性策略：只有当某个引理在验证更高级别定理时被实际调用时，它才会检查该引理的证明。这不仅节省了工作，还提供了一种检测循环推理的自然机制——如果你在检查一个引理的证明过程中试图强制求值它自己，你就发现了一个循环。

区块链： 在分布式账本上验证交易需要访问庞大的、经过加密保护的全局状态的一部分。一个不存储整个区块链的“轻客户端”无法承受下载和处理所有东西。惰性方法至关重要。一个交易验证可以被建模为一个只在需要时才被强制求值的 thunk。当被强制时，它只获取它需要的特定状态片段（通过像默克尔证明这样的加密证明）来执行其验证。通过记忆化这些证明，系统确保如果另一个交易需要相同的状态片段，它可以被重用而无需再次获取。

传需调用，诞生于 lambda 演算的抽象世界，已被证明是一个具有深远实际重要性的统一原则。它教导我们，通过智能地“偷懒”，我们的系统可以变得更高效、更具可扩展性、更优雅，从而驯服无限，并一次一张期票地管理着大得不可思议的事物。