传名调用

玻尔百科

定义

传名调用是计算机科学中的一种参数传递求值策略，它通过传递包含表达式及其环境的“thunk”来延迟参数的求值。在该机制下，参数在函数体内每次被调用时都会重新进行求值，从而支持短路逻辑运算和无限数据结构的构建。虽然传名调用能够很好地保持词法作用域，但由于重复求值可能导致效率低下，因此通常会通过传需调用（惰性求值）这种缓存首次求值结果的方式来进行优化。

核心要点

传名调用通过传递一个“thunk”——一个包含表达式及其环境的包——来延迟参数求值，该thunk在每次使用时都会被重新求值。
虽然传名调用在保留词法作用域方面语义上很优雅，但由于参数的重复求值，它可能变得非常低效，尤其是在涉及昂贵的计算或副作用时。
传需求调用（惰性求值）通过在首次求值后记忆化（缓存）结果来优化传名调用，从而在保留延迟计算优势的同时提供效率。
延迟求值的原则使得强大的结构成为可能，例如短路逻辑运算符以及创建惰性列表或流等无限数据结构。

引言

在编程语言的领域中，函数接收其参数的方式——即其求值策略——是一个基础性决策，对性能、表达能力和正确性有着深远的影响。尽管大多数程序员都熟悉传值调用（即在函数调用前计算参数），但还存在一种不同的范式：传名调用。这种方法采用了一种计算上的“拖延症”，将参数的求值推迟到真正需要它的那一刻。本文深入探讨了这个强大但又充满风险的概念，旨在弥合日常编码实践与更深层次的计算理论之间的知识鸿沟。

在第一部分“原理与机制”中，我们将剖析传名调用的核心机制，介绍“thunk”的概念，并探讨它如何在保护词法作用域的同时，也带来了性能挑战以及副作用引发的意外行为。我们还将审视其精炼的后继者——传需求调用，它在功能和效率之间提供了更实用的平衡。随后，在“应用与跨学科联系”部分，我们将超越理论，观察这些原则在实践中的应用，从日常代码中熟悉的短路逻辑，到无限数据结构的优雅构建，再到现代系统中管理并发的挑战。

原理与机制

在我们探索计算机如何执行指令的旅程中，很少有哪个想法像决定何时执行我们请求的工作这样，看似简单却又如此深刻。大多数时候，当我们调用一个函数，比如 f(x)，我们遵循一个直观的规则：首先，计算出 x 的值，然后将该值传递给 f。这被称为传值调用，是大多数编程语言的主力。它简单、可预测，并且感觉就像世界本应如此运作。

但如果我们稍微“拖延”一下呢？如果我们不给 f x 的值，而是给它一个承诺——一个关于如何在以后（仅在真正需要时）计算 x 的配方呢？这就是传名调用背后的核心思想。它不仅仅是一个编程技巧，而是一种从根本上不同的计算思维方式，伴随着惊人的成本、隐藏的优雅以及对我们如何编写和推理代码的深刻影响。

包裹中的承诺：Thunk

让我们将“承诺”这个想法具体化。计算机是如何将一个待执行的计算打包起来的呢？它使用一种巧妙的装置，称为thunk。你可以把 thunk 想象成一个密封的信封。信封里有两样关键物品：

表达式： 代表我们想要传递的参数的一段代码。
环境： 函数被调用那一刻的上下文快照——即所有相关变量的值。

这个包，即代码与其环境的配对，是闭包的一种形式。当一个函数需要一个以传名方式传递的参数的值时，它找不到一个现成的值，而是找到了这个 thunk。为了得到这个值，它必须“强制”（force）执行这个 thunk，这意味着打开信封并在其捕获的环境中执行代码。

现在，传名调用的关键规则来了，正是这条规则让它如此有趣，有时又充满危险：每当参数被使用时，thunk 都会被再次强制执行。表达式会从头开始重新求值。它不记得上一次的结果，只是重新执行一遍指令。

拖延的代价：重复求值的双刃剑

你可能会想，“为什么要重新求值？那不是很浪费吗？”通常，答案是响亮的“是！”想象我们有一个计算成本高昂的函数，比如一个计算斐波那契数的函数 fib(k)。现在，考虑一个做着简单事情的程序，比如将这个数字自身相加三次：let x = fib(k) in x + x + x。

在传名调用下，变量 x 绑定到 fib(k) 的一个 thunk。当表达式 x + x + x (求值方式为 (x+x)+x) 被计算时，会发生以下情况：

为了得到第一个 x，计算机会强制执行 thunk，忠实地计算 fib(k)。
为了得到第二个 x，它会再次强制执行 thunk，从头重新计算 fib(k)。
为了得到第三个 x，它会第三次强制执行 thunk，再次计算 fib(k)。

如果 fib(k) 是一个昂贵的操作，我们刚刚支付了三次代价，而常识告诉我们本应只支付一次。这种重复求值是传名调用的决定性性能特征。

这种代价不仅关乎性能，当涉及副作用时，它还可能导致令人费解的行为。副作用是任何修改其局部作用域之外状态的行为，比如写入文件、更改全局变量或在屏幕上打印。想象一个日志函数 log("x")，它向日志文件写入一行并返回值 1。

现在，考虑一个多次使用其参数的函数 f(a,b)，我们这样调用它：f(log("x"), log("x"))。在传值调用下，参数在调用点被求值一次。log("x") 运行，我们得到一条日志条目，a 变成 1。第二个 log("x") 运行，我们得到第二条日志条目，b 变成 1。总日志条目：2 条。这是可预测的。

在传名调用下，a 和 b 是 log("x") 的 thunk。如果 f 的函数体使用了 a 三次，b 两次，那么 log("x") 函数总共将被调用五次！。对 f 的一次看似无害的调用导致了五条独立的日志条目。这种行为可能是灾难性的。如果参数表达式不是记录一条消息，而是，比如说，发射导弹或转账，其重复、非预期的执行可能是灾难性的。这也揭示了幼稚的编译器优化，比如试图对一个有副作用的参数求值一次并重用其值，会如何从根本上破坏传名调用的语义并产生错误的结果。传名调用的契约保证了重新求值，无论好坏。

意义的守护者：词法作用域

到目前为止，传名调用看起来像是慢速和充满错误的程序的配方。那么这个想法当初为何会产生呢？它的真正目的不仅仅是延迟计算，而是为了保留意义。它是正确实现现代编程语言最基本原则之一——词法作用域——的强大机制。

词法作用域规定，变量的含义由其在源代码中书写的位置决定，而不是由程序的执行方式决定。变量绑定到定义它的最近的封闭函数或块。

让我们看看一个幼稚的延迟求值方法是如何破坏这个规则的。你可能会想，“何必用 thunk 呢？在用传名方式传递参数时，为什么不像宏一样只做一个简单的查找和替换？”让我们看看会发生什么。

考虑这个程序片段：

在这里，我们定义了一个变量 y 为 1。然后，我们用这个 y 作为参数调用一个匿名函数（lambda）。在函数内部，有另一个同名的局部变量 y，其值被设为 2。函数体将其参数 x 与这个局部的 y 相加。

如果我们使用幼稚的文本替换，我们会将函数体 x + y 中的 x 替换为参数文本 y。这会得到新的函数体 y + y。当它在函数内部求值时，两个 y 都会引用局部定义，即 y=2。结果将是 $2 + 2 = 4$ 。

这是错误的！我们传入的参数 y 来自外部作用域，其值为 1。它应该保留那个含义。幼稚的替换使得参数的自由变量 y 被内部的 let y = 2 绑定符“捕获”，从而破坏了它的含义。

这就是 thunk 成为英雄的地方。当我们传递参数 y 时，我们创建了一个 thunk： $\langle \text{expression: } y, \text{environment: caller's scope where } y \mapsto 1 \rangle$ 。在函数内部，当 x 被求值时，这个 thunk 被强制执行。它在其保存的环境中对表达式 y 求值，正确地检索到值 1。x + y 中的另一个 y 在函数的局部作用域中查找，正确地找到 2。最终结果是 $1 + 2 = 3$ 。

thunk 充当了一个盾牌。它封装了参数及其原始上下文，保护它不受其最终求值环境的影响。这确保了词法作用域得到尊重，这是可预测、可维护代码的基石。

驯服野兽：从传名调用到传需求调用

我们已经看到，传名调用在语义上是优雅的，但在计算上可能是残酷的。有没有一种方法可以在不付出代价的情况下获得其好处？这就是传需求调用（也因惰性求值而闻名）登场的地方。

传需求调用是对传名调用的一个简单而绝妙的改进。它遵循使用 thunk 延迟求值的相同原则。然而，它增加了一条关键规则：记忆化（memoization）。

当参数第一次被需要时，它的 thunk被强制执行，并计算出结果。
这个结果随后被存储，或称“记忆化”，在 thunk 内部，取代了原始表达式。
在之后所有对该参数的使用中，计算机只需返回存储的结果，而无需任何重新求值。

回到我们的 x + x + x 例子，其中 x 是 fib(k)，传需求调用将只求值 fib(k) 一次——在第一次使用 x 时。结果被保存下来，接下来的两次 x 的使用会立即得到这个缓存的值。同样，在我们有副作用的 log("x") 例子中，传需求调用将只在参数第一次使用时调用 log，从而防止了副作用的倍增。它让我们两全其美：既有传名调用的语义安全和延迟求值，又有传值调用的性能和可预测性。

实现的更深层次问题

thunk 的概念，这个简单的代码和环境的包，其影响会波及整个编译器和运行时系统的架构。一个特别棘手的问题是“向上 funarg 问题”（upward funarg problem）。如果一个 thunk（它包含一个指向程序执行栈上其环境的指针）被存储在一个全局变量中会发生什么？创建该 thunk 的函数可能已经结束，其栈帧也可能被擦除。稍后，如果程序的另一部分试图强制执行这个“逃逸”的 thunk，它将跟随一个指向现已是垃圾数据的地址的指针——这是一个经典的悬空指针错误。

解决这个问题需要复杂的工程技术。编译器必须执行逃逸分析，以检测 thunk 是否可能比其环境活得更久。如果是这样，它必须安排将环境（或至少是 thunk 需要的部分）分配在堆上——一个在函数调用之间持久存在的内存区域——而不是短暂的栈上。这确保了 thunk 的环境始终有效，无论 thunk 存活多久或被传递到何处。

从一个简单的“稍后执行”的想法出发，传名调用带我们领略了计算成本、副作用、词法作用域的神圣性以及内存管理的深层挑战。它是一个绝佳的例子，说明了语言设计中的一个单一决策如何在系统的每一层中回响，提醒我们在计算的世界里，表面之下总隐藏着引人入胜的故事。

应用与跨学科联系：拖延的力量

我们已经花了一些时间来研究传名调用的机制，这个奇特的想法，即给一个过程一份配方而不是一个做好的蛋糕。乍一看，这似乎只是一种理论上的小聪明，是编程语言设计师的客厅戏法。但无论是自然界还是优秀的工程实践，都充满了这种聪明的拖延。事实证明，决定何时做工作通常与知道如何做同样重要。

现在让我们踏上一段旅程，看看延迟求值——即“惰性”——这一原则在现实世界中出现在何处。你可能会惊讶地发现，它就隐藏在你每天编写的代码中，并且也为计算最前沿的问题提供了解决方案。这是一个具有优美且出人意料的统一性的概念。

你早已熟知的逻辑

你是否曾对 C++、Java或Python等语言中的逻辑 AND (``) 和 OR (||) 运算符感到好奇？我们可能倾向于将它们视为接受两个布尔值并返回一个的简单函数。但试着在一个在函数调用前就对其参数求值的语言，即“传值调用”语言中编写这样一个函数。如果你编写 my_and(A, B)，语言会坚持在你的函数开始运行之前就计算出 A 和 B 的值。

但 `` 的行为并非如此！在表达式 A B 中，如果 A 的结果为假，整个表达式必定为假，程序会很聪明地根本不去理会 B。B 所代表的任何计算——可能是一个耗时的数据库查询或一个复杂的计算——都会被直接跳过。A || B 也是如此；如果 A 为真，结果就为真，而 B 则不会被触及。

这被称为“短路求值”，它无异于伪装的传名调用。右侧的操作数不是一个值，而是一个仅在必要时才执行的计算。语言将这些运算符不视为简单的函数，而是特殊的控制流结构。编译器会煞费苦心地将 if (A B) 翻译成更接近 if (A) { if (B) { ... } } 的形式。这种有条件的、延迟的求值原则是如此基础和有用，以至于它被直接内置到我们最常用语言的语法中。这是我们一直在依赖却甚至没有注意到的拖延行为。

编织无限的织锦

现在来看一些更令人费解的东西。如果我们想表示一个包含所有自然数的列表呢？或者所有质数？在典型的编程语言中，这似乎是不可能的；它需要无限的内存。但通过延迟求值，我们可以完美地描述这类事物。

想象一个“生成器”，一台小机器，当你拉动它的杠杆时，它会给你一个数字，以及一个用于生成序列其余部分的新生成器。我们可以为自然数定义一个生成器，当它被调用时，会产生数字 $0$ 和一个新的生成器，后者将产生 $1$ ，依此类推。在我们要它们之前，这些数字都不存在。我们用有限的描述定义了一个无限的对象。这就是惰性列表或“流”（stream）的魔力。

当我们在流的定义中引用其自身时，这个想法的真正优雅之处便显现出来。考虑著名的斐波那契数列： $0, 1, 1, 2, 3, 5, \dots$ ，其中每个数都是前两个数的和。我们可以用一个惊人简单、自引用的语句来定义无限的斐波那契流，我们称之为 $F$ ： $F = \text{cons}(0, \text{cons}(1, \text{zipWith}(+, F, \text{tail}(F))))$ 这句话可以解读为：“ $F$ 是一个以 $0$ 开头，后跟 $1$ ，再后跟将 $F$ 与其自身（但向后错一位，即 tail(F)）相加得到的流。”

在正常的、严格求值的语言中，这个定义是一场灾难。要计算 $F$ ，你需要 $F$ 。程序会永远追逐自己的尾巴，陷入无限循环。但通过传名调用，这能完美工作。表达式 zipWith(+, F, tail(F)) 是一个 thunk——一个未来计算的承诺。直到有人真正请求 $F$ 的第三个元素时，它才会被求值。当请求发生时，thunk 只计算那一个元素（ $0+1=1$ ），并为流的其余部分生成另一个 thunk。我们可以随心所欲地剥离出任意数量的斐波那契数，计算过程只展开到必需的程度，仅此而已。我们驯服了无穷。

拖延的代价与共享的智慧

到目前为止，我们的旅程都是关于表达能力，但性能又如何呢？纯粹的传名调用，即每次使用 thunk 时都重新求值，有其阴暗面：它可能造成灾难性的浪费。

让我们回到惰性斐波那契流。为了计算 $F_5$ ，zipWith thunk 需要 $F_4$ 和 $F_3$ 。一个幼稚的传名调用系统会从头计算 $F_4$ ，然后，再独立地从头计算 $F_3$ 。但计算 $F_4$ 的过程已经包含了计算 $F_3$ ！这种冗余的工作创建了一个呈指数增长的重复计算分支树。寻找第 $n$ 个斐波那契数的成本变得巨大。

这时，一个简单而绝妙的优化登场了：记忆化。如果我们第一次求值一个 thunk 后，记住答案会怎样？我们可以将结果存储在 thunk 自身内部。下次任何人请求它的值时，我们只需返回存储的结果，而不是重新运行整个计算。这种策略被称为传需求调用，它是大多数现代“惰性”编程语言的基础。它将延迟求值的表达能力与不做重复工作的效率结合了起来。

这种“计算一次，永远记住”的思想是一个通用的优化原则，出现在许多学科中：

高性能计算（HPC）： 想象一个复杂的模拟，其中需要对某些数据进行昂贵的快速傅里叶变换（FFT）。如果后续计算的几个不同部分都需要这个结果，每次都重新计算这个 $\Theta(n \log n)$ 的操作是对超级计算机周期的极大浪费。将结果缓存在一个记忆化的 thunk 中，可以将 $k$ 次使用的总时间从 $\Theta(k \cdot n \log n)$ 减少到 $\Theta(n \log n)$ 。
游戏开发： 在游戏引擎中，一帧的物理模拟可能需要用于确定碰撞、动画和音效。如果这些系统中的每一个都独立触发同一步物理计算，帧率将会暴跌。传名调用方法将是一场性能灾难，会把每秒60帧变成幻灯片。在第一次计算后缓存物理世界的状态至关重要。
人工智能： 在许多搜索算法中，可能需要多次评估特定状态或游戏局面的“成本”。幼稚的递归搜索会一遍又一遍地探索相同的子问题。通过记忆化这些子问题的结果，我们将这个指数级的噩梦转变为一个可处理的问题。这正是动态规划的精髓，而动态规划只是传需求调用的一个领域特定名称。
符号数学： 当使用计算机代数系统时，我们通常希望将一个复杂的表达式简化为“规范形式”。这可能是一个成本高昂的操作。如果同一个表达式多次出现，将其简化一次并缓存其规范形式以供将来所有使用，会高效得多。

在所有这些领域，传需求调用——传名调用的聪明表亲——都让我们两全其美：我们不在必要之前计算任何东西，也绝不重复计算同样的东西。

当遗忘成为一种特性

那么，记忆化总是正确的答案吗？它是否总是一种我们可以不假思索地应用的“纯粹优化”？计算的世界很少如此简单。

考虑一个密码学系统中的函数。假设我们有一个表达式 e，它计算一个消息的加盐哈希值：Hash(m, Salt())。Salt() 原语很特殊：每次调用它，它都会生成一个全新的、随机的数字。这对安全至关重要，可以防止基于预计算哈希表的攻击。

现在，想象一下我们将这个表达式 e 传递给一个使用其参数三次的函数。 $F(x) = (x, x, x)$ $F(e)$ 的结果应该是什么？

如果我们使用纯粹的传名调用，e 的 thunk 会被重新求值三次。每次 Salt() 都会被重新调用，产生一个新的随机盐值。结果是一个包含三个不同的、独立计算的哈希值的三元组：(h_1, h_2, h_3)。这正是许多安全协议所期望的行为。

但如果我们使用传需求调用呢？x 第一次被使用时，表达式 Hash(m, Salt()) 被计算，得到一个哈希值 h_1。然后这个值被存储起来。在接下来的两次使用中，返回的是这个缓存的值。结果是 (h_1, h_1, h_1)。所有三个分量都完全相同！

这是一个深刻而关键的教训。“优化”改变了程序的可观察行为。它不再是优化，而是一个错误。记忆化只对纯粹的、确定性的表达式才是保留语义的转换。当涉及非确定性（如随机数）或副作用（如打印到屏幕）时，改变表达式求值的次数会改变程序本身的含义。理解这种区别是成熟程序员的标志。

现代 Thunk：并发与云

让我们在现代多核处理器和分布式系统的世界中结束我们的旅程。不起眼的 thunk 在这里也扮演着一个引人入胜的角色。

想象一个程序中的多个线程想同时求值一个昂贵的 thunk。这类似于一个热门的微服务被来自许多客户端的请求轰炸。如果我们不小心，所有线程可能会同时开始计算同一个昂贵的结果，这是一个浪费资源并造成巨大争用的“惊群”问题。

解决方案是设计一个线程安全的 thunk，它在并发环境中体现了传需求调用的原则。第一个到达未求值 thunk 的线程充当领导者。它原子性地将 thunk 的状态更改为“求值中”并开始工作。在状态为“求值中”时到达的任何其他线程都不会开始自己的计算，而是耐心地等待。当领导者完成时，它将结果放入 thunk，将状态更改为“已求值”，并通知所有等待的线程。每个人——无论是最初的工作者还是所有等待者——都会收到同一个共享的结果。

这种由原子操作、状态变更和条件变量组成的复杂协作，正是现代编程结构（如“Future”或“Promise”）所封装的逻辑。延迟计算这个简单的想法已经演变成一个强大的模式，用于在我们复杂的并行世界中管理并发、协调工作以及高效、安全地共享结果。

从一个简单的 `` 运算符到驯服无穷，从算法优化到密码安全和并发系统设计的基础，惰性求值的原则在计算机科学的织锦中展现为一条深刻而统一的线索。它教导我们，真正的效率不仅仅在于努力工作，更在于拥有在恰当的时间做正确工作的智慧。