惰性求值与副作用

玻尔百科

定义

惰性求值与副作用是计算机科学中的一个概念，指将计算推迟到结果被实际需要时才执行，并将任务封装为称为 thunk 的单元。这种机制通常采用按需调用评估和记忆化技术，以确保副作用最多仅执行一次，从而在函数式编程中提供可预测性。通过这种方式，程序员可以实现无限数据结构的操作以及高效的需求驱动型资源管理。

核心要点

惰性求值是一种将计算推迟到结果被需要时才执行的策略，它将待完成的工作打包成一个称为“thunk”的单元。
传需调用（Call-by-need）是惰性求值的一种常见形式，它利用记忆化（memoization）来确保一个值只被计算一次，并缓存结果以供后续使用。
惰性求值与副作用的交互至关重要；传名调用（call-by-name）可能会多次重复执行副作用，而传需调用通过确保副作用最多执行一次来提供可预测性。
纯函数式语言通过明确分离“动作”与纯计算来管理副作用的非确定性，通常使用单子（monadic）结构来实现。
惰性求值促成了强大的编程技术，包括高效的资源管理、需求驱动的模块加载以及对无限数据结构的操作。

引言

如果能让计算机只在绝对必要时才执行工作，会怎么样？这种“按需计算”的策略，即所谓的惰性求值（lazy evaluation），是许多函数式编程语言的基石，它通过避免不必要的计算来承诺极高的效率。然而，这个简单的承诺背后隐藏着一个复杂且影响深远的世界，尤其是当纯函数这个纯净的世界与改变状态的程序这一混乱现实——即所谓的副作用（side effects）——发生碰撞时。正是在这个交汇点，惰性求值的真正力量和潜在风险才得以显现。

本文将揭开这个关键主题的神秘面纱。首先，在“原理与机制”部分，我们将剖析其核心概念，对比“健忘的”传名调用（call-by-name）策略与“高效的”传需调用（call-by-need）方法。我们将探讨 thunk 和记忆化（memoization）等概念的工作原理，并见证当副作用介入时所引发的混乱。然后，在“应用与跨学科联系”部分，我们将看到这些思想如何转化为强大的工具，从高性能日志记录和无限数据结构，到与机器学习、金融建模等领域的惊人相似之处，无所不包。让我们从探索这个将工作推迟到绝对必要时才执行的简单思想开始吧。

原理与机制

想象一下，你请一位才华横溢但古怪的数学家为你计算一个值，比如说，第 10000 个素数。你写下请求，递给她，并说：“我正在研究一个公式，之后会需要这个答案。”你不是现在就需要，只是最终会用到。你刚刚完成了一次惰性求值。你没有强迫工作立即完成，而是为这个值创建了一张“承诺票据”。在计算机科学中，这张承诺票据被称为 thunk——一个被打包好的计算，静静地等待着被告知：“轮到你了。求值！”这种将工作推迟到绝对必要时才执行的简单思想，正是惰性求值的核心。它承诺了极高的效率：为什么要计算一些你可能永远不会用到的东西呢？但正如我们将看到的，这个承诺伴随着一些有趣而深远的后果，特别是当我们的纯净数学世界与一个变化万千的混乱现实发生碰撞时。

健忘的学生 vs. 高效的学生

让我们进一步完善这个类比。假设要计算的不是素数，而是一个你命名为 $x$ 的更简单的表达式。而你的公式需要多次使用这个值，比如在表达式 $x + x$ 中。我们的数学家有两种方式来处理这个问题。

第一种方式是传名调用（call-by-name）。可以把它想象成一种“健忘学生”的方法。为了计算加法的第一部分，你请求 $x$ 的值。学生勤奋地执行计算并把答案给你。片刻之后，为了计算加法的第二部分，你再次请求 $x$ 。由于完全忘记了之前的结果，学生把完全相同的计算又做了一遍。如果你的公式是 $x + x \times x$ ，这个可怜的学生将需要重新计算 $x$ 三次。

第二种更聪明的方式是传需调用（call-by-need），这也是大多数人所说的“惰性求值”。这是一种“高效学生”的方法。第一次你请求 $x$ 时，学生执行计算，把答案给你，但同时也在笔记本上记下了这个结果。之后每一次你请求 $x$ 时，学生只需瞥一眼笔记本，然后把答案读给你。昂贵的计算工作只做一次。这种缓存结果的技巧被称为记忆化（memoization）。

对于纯粹的数学计算，这两种方法之间唯一的区别在于性能。如果一个值被使用超过一次，传需调用显然更快。但当计算本身会产生后果时，会发生什么呢？

当惰性遇见现实：副作用的混乱

让我们想象一下，计算 $x$ 不仅仅是得到一个数字，而是一个动作：“去黑板前，把你在那里看到的数字加一，然后告诉我新的数字。”这种改变黑板的行为就是一个副作用（side effect）——计算不再是私事；它影响了一个共享的、公共的状态。

现在，让我们来求表达式 $y + (y \times y)$ 的值，其中 $y$ 就是我们那个会修改黑板的计算。我们从黑板上的数字 $0$ 开始。

在我们健忘的学生（传名调用）那里，故事的展开出人意料。

为了计算这个和，我们首先需要最左边 $y$ 的值。学生走到黑板前，看到 $0$ ，擦掉它，写下 $1$ ，然后报告：“值是 $1$ 。”
表达式现在是 $1 + (y \times y)$ 。为了计算乘积，我们需要下一个 $y$ 。学生已经忘了一切，又回到黑板前。黑板上现在是 $1$ 。学生擦掉它，写下 $2$ ，然后报告：“值是 $2$ 。”
表达式现在是 $1 + (2 \times y)$ 。我们需要最后一个 $y$ 。学生走到黑板前，看到 $2$ ，擦掉它，写下 $3$ ，然后报告：“值是 $3$ 。”
最终的计算是 $1 + (2 \times 3)$ ，等于 $7$ 。黑板上最终显示的是 $3$ 。

结果很奇怪。每次我们请求 $y$ 的“值”，它都在变！这就是将重复求值与副作用结合起来的危险之处。

现在，让我们看看我们高效的学生（传需调用）是如何驯服这种混乱的。

对于第一个 $y$ ，学生走到黑板前，把 $0$ 改成 $1$ ，然后报告：“值是 $1$ 。”关键是，学生还在自己的私人笔记本上记下了“结果：1”。
对于第二个 $y$ ，你再次请求。学生只是看了看笔记本，然后说：“值是 $1$ 。”黑板没有被触碰。
对于第三个 $y$ ，同样如此。笔记本上写着 $1$ 。黑板没有被触碰。
最终的计算是 $1 + (1 \times 1)$ ，等于 $2$ 。黑板上最终显示的是 $1$ 。

通过记忆化结果，传需调用确保了计算——及其副作用——最多只发生一次。它提供了一个稳定、可预测的世界，在这个世界里，一个表达式只有一个值和一个效果，无论你请求它多少次。

看不见的顺序：日常代码中的惰性

这种“只求值必要部分”的原则并不仅仅适用于深奥的编程语言。它通过短路求值（short-circuit evaluation）被内建于你日常使用的大多数语言的逻辑之中。

考虑表达式 $a \land b \lor c$ （或 a b || c）。当程序求值这个表达式时，它首先检查 $a$ 。如果 $a$ 是假，那么子表达式 a b 就是假，因此对 $b$ 的求值会被跳过，程序会转而去求值 $c$ 。类似地，如果先对 $a$ 再对 $b$ 求值后发现它们都为真，那么子表达式 a b 为真。接着，因为 true || anything 总是为真，对 $c$ 的求值就会被跳过。

这就是惰性求值的实际应用！ $b$ 和 $c$ 的求值被暂停，取决于 $a$ 的结果。如果这些检查涉及到副作用，比如发出网络请求或记录一条消息，这种惰性将决定这些副作用是否会发生。这揭示了一种美妙的统一性：惰性求值并非怪癖；它是一种融入计算结构的基本优化策略。

不可预测性的危险

我们已经看到，传需调用通过确保副作用最多运行一次来驯服它们。但它们何时运行呢？对于像 print("A") + print("B") 这样的表达式，严格的 + 运算符在相加之前需要两个值。它必须强制两个 thunk 求值。但它先强制哪一个呢？

如果语言没有指定顺序，运行时系统就可以自由选择。它可能先求值左边，产生输出 AB。也可能先求值右边，产生 BA。这就是非确定性（non-determinism）——同一个程序运行两次可能会产生不同的结果。对于构建可靠的软件来说，这是一个可怕的前景。

为了恢复理智，语言设计者有两条主要路径。第一条很简单：强制规定求值顺序。例如，总是从左到右求值 + 的参数。这使得副作用变得可预测。

第二条路径更为深刻，也是像 Haskell 这样的纯函数式语言所选择的路径。它认为副作用与纯计算是如此不同，以至于它们应该被完全分开。像 print("A") 这样的表达式不仅仅产生一个值；它产生一个动作。然后，你可以使用特殊的组合子（通常在一个称为单子 (monad) 的结构内）将这些动作显式地排序成一个单一的、确定性的与世界交互的“配方”。这种设计优雅地分离了“是什么”（纯计算，可以按任何顺序惰性求值）和“怎么做”（动作的序列，是固定的和可预测的）。

机器中的幽灵：它究竟是如何工作的

惰性求值的优雅背后，隐藏着一台在幕后工作的复杂机器。理解其机制能揭示更多关于所涉及的权衡。

用 `let` 控制工作

在一种传需调用的语言中，你如何告诉编译器你想要共享一个计算？你可以使用 let 绑定。考虑以下两个程序之间的区别：

expensive() + expensive()
let x = expensive() in x + x

在第一个程序中，编译器看到了 expensive() 的两次不同出现。它创建了两个独立的 thunk，昂贵的计算被执行了两次。在第二个程序中，let 绑定告诉编译器：“有一个东西，名为 $x$ ，由 expensive() 定义。请共享它。”编译器为 $x$ 创建一个单一的 thunk。当和式中的第一个 $x$ 被求值时，thunk 被强制执行，结果被记忆化。当需要第二个 $x$ 时，会立即使用记忆化的值。let 关键字成为了一个控制性能的强大工具，它明确地区分了重新计算表达式和重用其结果。

囤积的 Thunk 与内存泄漏

一个 thunk 必须记住两件事：要计算的表达式和它完成计算所需的环境。这个环境包含了表达式可能需要的所有变量的值（或位置）。一种天真的实现，即环境只是一个指向 thunk 创建时整个上下文的指针，可能会导致一个灾难性的副作用，称为空间泄漏（space leak）。

想象一个函数为表达式 $x + 1$ 创建了一个微小的 thunk。这个 thunk 只需要知道 $x$ 。但环境中还有两个巨大的、数兆字节的数组， $y$ 和 $z$ 。如果这个 thunk 被保存以供日后使用，在该函数结束后，垃圾回收器会看到这个 thunk 仍然存活。通过跟踪 thunk 的环境指针，它会断定整个原始上下文，包括那些巨大的数组，仍然是需要的。这个 thunk，就像一只囤积癖的老鼠，持有了它永远不会使用的数GB内存。

解决方案是一项精妙的编译器优化技术：环境裁剪（environment trimming）。编译器分析 thunk 的表达式（ $x+1$ ），看到唯一的自由变量是 $x$ ，于是构建一个量身定制的、最小化的环境，只包含访问 $x$ 所需的信息。这使得巨大的数组可以被垃圾回收，解决了空间泄漏问题。这通常还涉及到将变量 $x$ 从其在程序栈上的临时住所提升（lifting）到堆上一个更永久的居所，以确保它的生命周期和需要它的 thunk 一样长。像未使用的 thunk 这样的死代码可以被完全消除，进一步改善空间行为。

规则的例外

传需调用中的记忆化原则非常一致，即使在出错时也是如此。如果强制一个 thunk 求值没有产生一个值，而是抛出了一个异常呢？thunk 会记忆化异常本身。任何后续尝试强制同一个 thunk 求值的操作都不会重新运行失败的计算；它会立即重新抛出缓存的异常。这确保了求值一个表达式的结果，无论是一个值还是一个错误，都是稳定的，并且只被决定一次。这与传名调用形成鲜明对比，在传名调用中，如果全局状态发生了变化，第二次重新求值表达式可能会成功。

纯粹的代价

这整个惰性求值系统在纯函数式编程中找到了它最自然的家园，而纯函数式编程建立在引用透明性（referential transparency）的基石之上。这个原则指出，你可以用任何表达式的值来替换该表达式，而不会改变程序的含义。就像在数学证明中你可以用 $4$ 替换 $2+2$ 一样，你也应该能够在你的代码中做同样的事情。

然而，一个真正的指针恒等运算符 idEq，它检查两个参数是否是内存中完全相同的对象，可能会打破这种幻象。在一个惰性世界里，表达式 let x = expensive() in idEq(x,x) 的求值结果会是 true，因为两个参数都指向为 $x$ 创建的那个单一 thunk。但语义上等价的表达式 idEq(expensive(), expensive()) 的求值结果会是 false，因为编译器为每个参数创建了两个不同的 thunk。突然之间，我们能够区分两个本应意义相同的表达式。引用透明性被打破了。

这种冲突揭示了关于语言设计的深刻真理。为了保持数学上的纯粹性，你必须遵守纪律。你要么禁止这样的运算符，要么将其重新定义为关于值相等（从而保持纯粹性），或者——在最复杂的解决方案中——将其隔离起来。你承认观察内存是一种“不纯”的动作，并使用类型系统（也许就是我们之前看到的同样的单子机制）在纯粹的、永恒的值世界和不纯的、有状态的内存地址世界之间建立一堵墙。

从一个简单的承诺——“非到必需，不动算盘”——展开了一幅由权衡与技术构成的丰富画卷，触及性能、程序正确性、内存管理，以及程序“纯粹”意味着什么的哲学本身。它向我们展示，计算机科学中最简单的思想往往引出最深刻和最美丽的复杂性。

应用与跨学科联系

现在我们已经掌握了惰性求值的机制——这个关于计算可以是一个承诺而非即时行动的奇特想法——我们可以提出一个物理学家或工程师能问的最重要的问题：它究竟有何用处？事实证明，答案惊人地广泛且出奇地深刻。惰性求值不仅仅是程序员的 parlor trick（小把戏）；它是一个基本原则，在软件设计、数学乃至其他科学学科中都能找到回响。这是将计算上的拖延提升为一门科学的艺术。

让我们踏上一段旅程，看看这门艺术将我们带向何方。我们将从实际编程的细枝末节开始，逐步上升到更抽象但极其强大的思想。

务实程序员的工具箱

从本质上讲，惰性关乎效率。如果可能不必做某项工作，为什么要做呢？这个简单的问题为日常工程问题带来了优雅的解决方案。

想象一下，你正在构建一个高性能系统，并且需要一个健壮的日志记录工具。当错误发生时，你希望记录丰富的诊断信息——也许是一个由各种程序状态构成的复杂字符串。但错误，我们希望，是罕见的。一种天真的方法是，每次调用日志函数时都构建这个详细的日志消息，然后在没有错误的情况下简单地丢弃它。这太浪费了！你花费了宝贵的 CPU 周期来格式化那些 99.9% 的时间都会被扔掉的字符串。

惰性求值提供了一个完美的解决方案。你不是传递完全成形的日志消息，而是传递一个创建它的承诺——一个 thunk。日志函数只有在确实发生错误时，才会“强制”这个 thunk 求值，要求创建消息。如果没有错误，这个承诺就永远不会兑现，昂贵的字符串构建过程也永远不会运行。但如果你需要将同一条错误消息写入两个地方，比如控制台和一个文件，会发生什么呢？如果你的承诺是一个简单的“传名调用” thunk，你可能会执行两次工作。真正的优雅来自于“传需调用”，其中 thunk 会聪明地记忆化其结果。第一次请求消息时，它被计算出来；第二次，你会立即得到缓存的结果。这保证了日志表达式内部的副作用，比如增加一个计数器，最多只发生一次，从而在提供效率的同时保持了理智和可预测的行为。

这种避免不必要工作的原则可以漂亮地扩展。考虑一个由许多模块或库构建的现代软件系统。当你导入一个模块时，系统是否应该立即运行其中每个函数和值的所有初始化代码？这似乎效率极低，特别是如果你的程序最终只使用了那个大型库中的一两个小函数。惰性模块系统应用了同样的逻辑：模块中的顶层定义不是值，而是 thunk。它们只有在主程序需要时才被求值。这种需求驱动的方法意味着导入一个巨大的库几乎可以是瞬时的，初始化的成本会随着你使用其部分功能而分期支付。它能保持启动时间快，内存使用率低，只为你实际需要的东西付费。

这个思想甚至延伸到我们如何与外部世界互动。想一想一个需要从文件中读取数据的表达式。在纯粹的传名调用模型下，两次使用这个读取操作的结果可能意味着打开并读取文件两次！。或者，在一个更面向用户的场景中，想象一个函数 prompt()，它会向用户请求输入。如果你将 prompt() 传递给一个会两次使用其参数的函数，比如 f(x) = x + x，用户会被烦人地提示输入同一个数字两次。在这两种情况下，符合常识的解决方案是记住第一次交互的结果。这正是传需调用所做的：它将一个可重复的动作转变为一个其结果被共享的一次性事件，将一个潜在令人沮丧或低效的交互转变为一个合理的交互。

数学家的无限游乐场

除了这些实际的效率提升，惰性还为一种思考数据本身的新颖而强大的方式打开了大门——它让我们能够推理无穷。

在传统的严格求值语言中，如果你试图创建一个包含所有素数的列表，你的程序将永远运行下去，在做任何其他事情之前试图在内存中构建一个无限大的对象。但如果一个列表不是一个静态对象，而是一个承诺呢？一个惰性列表，或称“流”（stream），正是如此：它是一个包含列表头部（第一个元素）和列表其余部分的 thunk 的配对。

要获取第一个元素，你只需查看头部。要获取第二个元素，你强制尾部的 thunk 求值，这会揭示第二个元素和另一个用于列表其余部分的 thunk。这种结构允许你定义和传递概念上无限的数据结构。你可以拥有一个代表所有自然数、所有素数或整个斐波那契数列的变量。生成这些数字的计算被暂停，只有在你遍历列表时按需唤醒。 благодаря волшебству мемоизации по требованию, каждый элемент вычисляется не более одного раза, а затем его результат используется совместно. 这需要精心的运行时设计，确保请求流的头部不会意外地计算尾部，并且整个系统能免受奇怪的递归循环影响，通常使用一种称为“黑洞”（black-holing）的巧妙技术来检测循环依赖。

这种优雅不仅仅适用于奇特的数据结构。它可以改进像数值运算这样基础的东西。想象一种能够自动将整数转换为浮点数的语言。严格的方法可能在整数被用于浮点数上下文时立即执行转换。但惰性的方法更为微妙：它可以创建一个“强制转换 thunk”（coercion thunk），一个承诺，当且仅当浮点运算真正需要其值时才转换该整数。原始的整数绑定保持不变，可供程序中任何其他需要它作为整数的部分使用。转换被推迟，最多执行一次，并存储在一个单独的记忆化缓存中。这是一个系统既灵活又效率最大化的绝佳例子，总在恰当的时间做恰到好处的工作。

跨学科的统一线索

一旦你掌握了像惰性求值这样强大的思想，你就会开始到处看到它的身影。它的原则是如此基本，以至于它们会出现在乍看起来与编程语言理论关系不大的领域中。

考虑算法分析。在严格求值的世界里，一个算法的时间复杂度通常是其整个输入大小的函数。但有了惰性，情况就变了。如果一个算法产生一个长列表，但程序的其余部分只查看前 $m$ 个元素，那么所做的工作量与 $m$ 成正比，而不是总的潜在长度 $n$ 。复杂度分析必须根据需求和输入大小进行参数化。这可以带来惊人的性能提升，如果只需要前几个结果，可以将一个看起来是线性时间复杂度的算法变成常数时间复杂度的。然而，这种能力也伴随着一个著名的警告。一个天真编写的惰性程序，比如用非严格的折叠操作对列表求和，可能会构建起一长串未求值的 thunk，在最终进行计算之前消耗大量内存。这种“空间泄漏”表明惰性并非免费的午餐；它在时间和空间两个维度上都改变了算法的性能剖面。

让我们跳到一个完全不同的领域：机器学习。当神经网络在“前向传播”（forward pass）中处理输入时，它会计算一个由称为“激活值”（activations）的中间值构成的图。现在，如果一个更大模型的不同部分需要使用来自特定层的激活值怎么办？一个天真的实现可能会每次都为该层重新运行前向传播，这在计算上非常昂贵。显而易见的优化是计算一次激活值并为任何下游消费者缓存它们。这与传需调用的记忆化原理完全相同！一个 thunk 就像一个为一组激活值准备的悬挂计算，而强制其求值就像运行前向传播。惰性求值为推理这种依赖图和共享计算提供了一种形式化语言。

在金融建模等领域，捕捉特定时刻的值的相同思想也至关重要。想象一个函数多次使用某只股票的价格来进行计算。如果该价格是从实时市场数据源获取的，纯粹的传名调用方法会多次查询市场。在快速变化的市场中，价格可能在两次查询之间发生变化，导致不一致和错误的计算。传需调用策略提供了一个自然的解决方案：第一次请求价格时，从市场获取并记忆化。在同一计算中的后续使用会收到这个“快照”值，确保了一致性。

机器中的幽灵：语义与编译器

最后，我们到达了最深的层面：这个由承诺和需求构成的优雅舞蹈究竟是如何实现的？答案在于编译器的复杂世界，在这里，抽象的语义必须被翻译成具体的机器指令。核心的张力在于惰性求值与副作用——那些改变世界的行为，比如打印到屏幕——之间。

一个纯粹的、没有记忆化的传名调用实现很容易定义：每次使用一个变量，你就重新运行其定义表达式。如果那个表达式打印“Hello!”，那么使用该变量两次就会打印两次“Hello!”。传需调用通过记忆化改变了这种行为：副作用只在第一次使用时发生。这是一个根本性的语义转变，也是关键的权衡：我们以偏离纯粹传名调用的简单重求值语义为代价，换取了有状态表达式的效率和一致性。

这种区别给编译器编写者带来了深远的挑战。编译器的优化器是一个强大但天真的野兽。它喜欢为了提高速度而重新排序、复制或消除代码。如果我们告诉它构造一个惰性乘积，比如 a * b，是一个“纯”操作（因为它只是构建一个 thunk），优化器可能会随意地将 (a * b) * c 重新组合成 a * (b * c)。对于纯数学来说，这没问题。但对于携带副作用的 force 操作呢？必须教会优化器，force 是一个神圣的、有副作用的操作，其顺序至关重要。

实现这一点的最原则性的方法是，将世界这个隐藏的状态作为编译器中间语言的一个显式部分。可能产生副作用的操作被建模为函数，它们不仅接受输入并产生输出，还消耗世界的状态并产生一个新的世界状态。通过将这个“效应标记”（effect token）贯穿程序图，我们创建了一个明确的依赖链，即使是一个简单的优化器也能理解并且被禁止重排。这使得编译器可以自由地优化我们表达式的纯粹、惰性构造，同时严格保留有副作用的 force 操作的顺序。这是一个美妙的综合，其中我们语言的高级语义被投射到一个指导机器进行正确和高效执行的依赖图上。

从一个简单的日志工具到编译器的形式语义，惰性求值展现了其作为一个具有非凡力量和统一性的概念。它提醒我们，在计算中，就像在生活中一样，有时最明智的做法是等待，看看真正需要的是什么。

惰性求值与副作用

引言

原理与机制

健忘的学生 vs. 高效的学生

当惰性遇见现实：副作用的混乱

看不见的顺序：日常代码中的惰性

不可预测性的危险

机器中的幽灵：它究竟是如何工作的

用 let 控制工作

囤积的 Thunk 与内存泄漏

规则的例外

纯粹的代价

应用与跨学科联系

务实程序员的工具箱

数学家的无限游乐场

跨学科的统一线索

机器中的幽灵：语义与编译器

惰性求值与副作用

引言

原理与机制

健忘的学生 vs. 高效的学生

当惰性遇见现实：副作用的混乱

看不见的顺序：日常代码中的惰性

不可预测性的危险

机器中的幽灵：它究竟是如何工作的

用 let 控制工作

囤积的 Thunk 与内存泄漏

规则的例外

纯粹的代价

应用与跨学科联系

务实程序员的工具箱

数学家的无限游乐场

跨学科的统一线索

机器中的幽灵：语义与编译器

用 `let` 控制工作

用 `let` 控制工作