函数调用约定

玻尔百科

定义

函数调用约定是应用二进制接口（ABI）中的一种底层协议，用于规定函数如何传递参数、返回数值以及管理寄存器和调用栈等共享资源。该机制通过标准化栈帧管理以及调用者与被调用者保存寄存器的分工，实现了不同编程语言之间的互操作性。作为函数类型的组成部分，调用约定对于维护类型安全、防止栈破坏以及增强现代系统安全性至关重要。

核心要点

函数调用约定是一种底层协议，是应用程序二进制接口（ABI）的一部分，它定义了函数如何传递参数、返回值以及管理寄存器等共享资源。
其机制围绕调用栈展开，调用栈为每个活动函数持有一个“栈帧”，并将处理器寄存器严格划分为调用者保存和被调用者保存，以平衡性能。
标准化的约定，特别是 C ABI，充当了一种通用语言，使得用不同编程语言（如 Rust、C++ 和 Fortran）编写的代码能够实现互操作。
函数的调用约定是其类型的一个组成部分；不匹配可能导致栈损坏和严重的程序故障，这突显了其对类型安全的重要性。
现代安全特性，如影子栈和基于能力的系统，利用并增强了调用约定的原理，以防御控制流劫持攻击。

引言

对程序员而言，函数调用是最基本的操作之一，是执行一个代码块然后返回的指令。我们通常将其视为一次“神奇的跳转”，但在这个简单的抽象之下，隐藏着一个高度结构化且被精确定义的协议。这套规则被称为函数调用约定或应用程序二进制接口（ABI），是管理不同已编译代码片段如何协作的无形契约。正是这个无声的握手，使得程序能够与其操作系统通信，或者一个用某种语言编写的库能被另一种语言使用。理解这个契约不仅仅是学术操练；它对任何从事系统编程、性能调优和安全工作的人都至关重要。

本文揭示了这一基本概念的幕后细节。它旨在填补将函数调用视为简单命令与将其理解为复杂、精心编排的交互之间的知识鸿沟。通过探索这个主题，你将更深刻地理解软件在底层如何运作，某些错误为何会发生，以及现代系统如何被构建得既高效又安全。

首先，在原理与机制部分，我们将剖析函数调用的解剖结构。我们将探讨调用栈、栈帧的结构、调用者保存寄存器和被调用者保存寄存器的关键作用，以及传递参数和返回值的精确协议。然后，在应用与跨学科联系部分，我们将拓宽视野，看看这些底层规则如何产生深远的、系统性的影响，它们如何实现语言间的互操作性，影响编程特性的设计，并为硬件强制安全构建新的基础。

原理与机制

想象一下，你是一个巨大作坊里的工匠大师，需要将一项子任务委托给另一个房间的专家。你会怎么做？你不能只是对着虚空大喊指令。你需要一个协议。你们必须商定好如何提供原材料（输入），他们可以使用哪些共享工具，哪些是你的私人工具他们决不能碰，以及他们应该把完成的部件（输出）放在哪里以便你取回。这个商定的协议，这种对合作的共同理解，正是在软件世界中函数调用约定的本质。

它是我们称之为应用程序二进制接口（ABI）的关键部分，这是一套管理不同已编译代码片段如何交互的底层规则。正是这个无形的握手，使得一个用 C 语言编写的程序能够使用一个用 Fortran 编写的库，或者你的应用程序能向操作系统请求服务。这关乎的不是代码的逻辑，而是对话的机制。让我们揭开层层面纱，看看这场优雅的舞蹈是如何编排的。

工作空间：栈及其解剖结构

当你的程序运行时，它使用一块称为调用栈的内存区域。可以把它想象成自助餐厅里的一叠托盘。当一个函数（调用者）调用另一个函数（被调用者）时，一个新的托盘被放在栈顶。这个托盘，被称为栈帧或活动记录，是被调用者的整个临时工作空间。当被调用者完成工作后，它的托盘被移除，调用者的托盘再次位于栈顶，准备继续工作。这种后进先出（LIFO）的规则是过程式编程的基本组织原则。

但这个托盘上到底有什么？一个函数需要什么信息来完成它的工作，以及同样重要的，让程序能返回到它原来的地方？一个单独的栈帧包含了单次函数调用的全部上下文。要从一个保存的状态恢复程序，你必须完美地保留这个上下文。一个栈帧所需的最少信息揭示了其真正的解剖结构：

参数：从调用者传递给被调用者的数据，即工作的原材料。
返回地址：这可能是最重要的信息。这是调用者代码中的“书签”，表示“当你完成后，回到这个确切的位置”。没有它，被调用者将在内存的荒野中迷失，无家可归。
动态链接（保存的帧指针）：一个指向调用者栈帧的指针。这个链接形成一条链，让程序（或调试器）能够“回溯”栈，追踪导致当前位置的函数调用路径。
局部变量：被调用者的私有临时空间。在函数内部声明的任何变量都存放在这里。
已保存的寄存器：被调用者需要借用并承诺在完成前恢复的任何“私人工具”（被调用者保存寄存器，我们稍后讨论）的值。

栈帧的大小可能带来巨大的影响。考虑一个简单的递归函数——一个调用自身的函数。每次调用都会在栈上增加一个新的帧。如果一个函数 f(n) 调用 f(n-1) 直到达到 f(0)，它将创建 $n+1$ 个嵌套的栈帧。如果每个帧，比如说，是 $3136$ 字节，而操作系统分配的总栈空间大约是 $8$ 兆字节（ $S_{\max} = 8 \times 1024 \times 1024$ 字节），一个简单的计算表明，你只能进行大约 $d^* = \lfloor (S_{\max} - R) / 3136 \rfloor = 2674$ 次递归调用，然后就会耗尽空间，导致臭名昭著的栈溢出错误。这不是一个理论上的问题；这是每个程序员都必须尊重的硬性物理限制。

管理工具：调用者保存 vs. 被调用者保存寄存器

计算机的处理器有少量极快的存储位置，称为寄存器。它们是机器中最宝贵的资源。调用约定必须严格定义这些寄存器的使用规则。它们被分为两类，这个决策优雅地平衡了性能上的权衡。

调用者保存寄存器（也称为“易失性”或“临时”寄存器）：可以把它们想象成作坊里的公用工具。被调用者可以自由地将它们用于任何目的而无需征求同意。如果调用者正在用其中一个寄存器做重要的事情，那么调用者有责任在进行调用前保存它的值（通常保存在自己的栈帧上），并在调用后恢复它。这对于叶函数——那些完成工作而不调用任何其他函数的简单函数——来说是高效的。它们可以零开销地使用这些寄存器。
被调用者保存寄存器（也称为“非易失性”或“保留”寄存器）：这些就像工匠大师的个人专用、经过精细校准的工具。被调用者可以使用它们，但如果使用了，被调用者有责任在进入时小心地保存原始值，并在返回前将其恢复到确切的原始状态。这有利于调用者，尤其是在复杂的非叶函数中。调用者可以将一个长期存在的值（如循环计数器）保存在一个被调用者保存的寄存器中，在循环内部调用其他函数，并相信该值在返回时将保持不变。这避免了在每次调用前后保存和恢复值的开销。

一个设计良好的调用约定，比如现代系统中使用的那些，会提供这两种寄存器的良好组合。对于一个拥有 8 个通用寄存器的架构，5 个调用者保存寄存器和 3 个被调用者保存寄存器的划分是一种常见且有效的折衷方案，它既为简单的叶函数优化，也为组织这些函数的更复杂的中心函数优化。

协议的实际运作：传递参数和返回值

那么，原材料——也就是参数——实际上是如何交接的呢？最快的方式是使用寄存器本身。大多数调用约定都规定，前几个参数通过指定的寄存器传递。

一个极佳的具体例子是在 x86-64 Linux 系统上进行系统调用的约定。系统调用是用户程序请求操作系统内核执行特权操作（如向屏幕写入数据）的方式。为了使调用在逻辑上等同于 write(1, p, 12)（将内存位置 p 处的 12 字节写入标准输出 1），程序不仅仅是调用一个名为 write 的函数。相反，它会根据系统调用约定加载寄存器：

write 的系统调用号 $1$ 被放入 rax 寄存器。
第一个参数，文件描述符 $1$ ，被放入 rdi。
第二个参数，内存地址 $p$ ，被放入 rsi。
第三个参数，计数值 $12$ ，被放入 rdx。

完成这些设置后，执行一个特殊的 syscall 指令，这将触发向操作系统内核的交接。内核随后会查看这些寄存器以了解请求的内容。正是这种严格的协议，使得系统上的每一个程序，无论用何种语言编写，都能与内核通信。

如果一个函数的参数比可用的参数传递寄存器还多怎么办？剩余的参数就在调用前被简单地压入栈帧。返回值通常也通过一个指定的寄存器（通常是 rax）传回。

隐藏的成本与编译器的魔力

这种设置参数、进行调用和清理的复杂舞蹈并非没有代价。每次函数调用都有性能成本。一个简单的模型可以量化这个成本。如果 $a$ 个参数中的每一个都需要 $c_a$ 个周期来设置，而保存和恢复 $r$ 个被调用者保存寄存器中的每一个都需要 $c_s$ 个周期的操作（一次保存，一次恢复），那么每次调用的总开销就是 $S = a c_a + 2 r c_s$ 。

正是由于这种开销，编译器会执行一种名为内联的惊人优化。如果一个函数很小，编译器可能会决定完全避免调用。它会直接将该被调用者的代码复制并粘贴到调用者的代码体中。调用约定的开销完全消失了。对话协议不再需要，因为已经没有对话——它变成了一场独白。

当规则即法律：调用约定与类型安全

这里我们触及了一个深刻的观点：调用约定不仅仅是一种性能优化；它是一个函数身份的组成部分，与它的参数类型同等重要。忽视这一点可能导致灾难性的失败。

考虑两种常见的栈清理约定：

cdecl：调用者负责在调用返回后从栈中清理参数。
stdcall：被调用者负责在返回前清理栈。

假设你有一个函数指针，它指向一个用 stdcall 约定编译的函数，但你错误地告诉编译器把它当作 cdecl 来调用。会发生什么？

调用者压入参数并发起调用。
stdcall 约定的被调用者执行，完成工作，从栈中清理参数，然后返回。
调用者以为它进行了一次 cdecl 调用，现在也试图从栈中清理相同的参数。

此时栈指针已经不正确，指向了错误的位置。调用者的整个工作空间都错位了。下一个使用栈的操作——访问局部变量，甚至只是从调用者自身返回——都会失败，很可能以一种微妙且令人困惑的方式使程序崩溃。

这表明，函数的调用约定是其类型的一部分。一个类型为 fn(Int -> Float) @ stdcall 的函数指针与期望 fn(Int -> Float) @ cdecl 的调用点是根本不兼容的。一个现代、安全的类型检查器必须强制执行此规则以防止内存损坏。

破坏规则：非局部跳转与安全

约定的美妙之处在于，只要每个人都遵守规则，它就能正常工作。但当规则被故意破坏时会发生什么呢？

C 语言提供了一种非局部控制转移的机制：setjmp 和 longjmp。调用 setjmp 会保存当前的执行环境（栈指针、程序计数器等）。之后在调用栈更深处的任何地方调用 longjmp，将立即将执行“传送”回 setjmp 的位置，实际上是中止了所有中间的函数调用。关键在于，它这样做时并不会执行这些函数的清理代码（它们的收尾部分）。

这意味着合作协议被打破了。所有那些被中间函数借用并承诺恢复的被调用者保存寄存器，都将处于被修改的状态。longjmp 绕过了维护这一保证的机制本身！为了解决这个问题，setjmp 自身必须足够智能，能够保存所有被调用者保存寄存器的状态，因为它不能依赖正常的返回协议来完成这项工作。

这引出了我们的最后一点：安全。栈帧中最神圣的部分是返回地址。如果攻击者能找到一个漏洞（如缓冲区溢出），允许他们覆盖栈上的返回地址，他们就能劫持程序的控制流。当函数试图返回时，它将“返回”到攻击者选择的恶意代码，而不是其合法的调用者。

为了对抗这种情况，现代系统正在引入硬件强制的保护措施，如影子栈。这个想法简单但强大：CPU 在用户代码不易修改的内存区域中维护第二个受保护的栈。当函数被调用时，编译器生成代码将返回地址同时压入常规栈和影子栈。当函数返回时，CPU 从两个栈中弹出地址并进行比较。如果它们不一致，就表明存在篡改。程序会立即被终止，从而挫败攻击。这是一个绝佳的例子，说明了调用约定的最深层原理如今已处于计算机安全之战的最前沿。

从简单的握手协议到网络安全的前沿阵地，函数调用约定证明了使现代计算成为可能的优雅、分层的复杂性。它是一个无声的契约，一场合作之舞，也是纷繁复杂的软件世界中秩序的基石。

应用与跨学科联系

当我们初学编程时，我们认为函数调用是一种神奇的跳转。我们调用 print("Hello, World!")，然后计算机的机制不知何故地合力让这些词出现在我们的屏幕上。我们被鼓励（有充分的理由）不必担心细节。但随着我们深入挖掘，我们发现这种“神奇的跳转”根本不是魔法。它是一场精心编排的舞蹈，由一套严格的规则所支配——一个被称为调用约定或应用程序二进制接口（ABI）的默契契约。

有人可能会认为这个契约是一个枯燥、技术性的事务，只有编写编译器的人才会感兴趣。事实远非如此。调用约定是一条贯穿现代计算几乎每一层的线索。正是这一原则，使得我们的数字世界——尽管充斥着各种不同的编程语言、操作系统和硬件——能够作为一个连贯的整体运作。它是一个美丽的例子，展示了一套简单、优雅的规则如何能从惊人的复杂性中创造出秩序。让我们追溯这条线索，看看它将我们引向何方。

编程界的巴别鱼：实现互操作

ABI 最直接、最实际的作用是解决一个与巴别塔一样古老的问题：如何让说不同语言的实体进行交流？在软件领域，这已是日常所需。一个用 Rust 编写高性能分析程序的数据科学家，可能需要使用一个用 C 语言编写的、久经考验的线性代数库。没有一个共同的契约，这是不可能的。

C ABI 充当了编程世界的通用语。当一个 Rust 程序员用 extern "C" 注解一个函数时，他们是在做出一个承诺：“在这一次对话中，我不会说 Rust 的方言；我将遵循 C 的通用约定。”这包括使用相同的寄存器传递参数，以相同的方式处理栈，以及以 C 兼容的格式布局数据结构。有了这个协议，Rust 代码就可以无缝地调用 C 库，反之亦然，就好像它们是用同一种语言编写的一样。

然而，这个契约不仅关乎源语言，它关乎整个平台。想象一下你有两个 C++ 库。它们的源代码完全相同，但一个是在 Linux 上编译的，另一个是在 Windows 上编译的。它们能相互通信吗？令人惊讶的答案是不能。这是因为这些平台上的 C++ ABI 是不同的——Linux 上的 Itanium ABI 和 Windows 上的 Microsoft ABI 对于一些微妙但关键的事情有不同的规则，比如如何处理函数名（name mangling）或内存中对象的布局 ([@problem_synthesis:3678605])。它们说的是同一种 C++“语言”的不同方言。

对于像 Java 或 C# 这样的语言，这个问题变得更加突出，因为它们运行在像 Java 虚拟机（JVM）或公共语言运行时（CLR）这样的“托管运行时”中。这些运行时就像自成一体的宇宙，有自己内部的内存布局和函数调用规则。当一个 Java 程序需要调用一个本地 C 函数时，它不能直接这样做。它必须使用一个特殊的桥梁，称为外部函数接口（FFI），如 Java 本地接口（JNI）或平台调用服务（P/Invoke）。这个桥梁充当翻译器，一小段称为“垫片（shim）”的代码会煞费苦心地重新排列数据（一个称为封送的过程），并将调用从运行时的内部约定适配到平台的本地 C ABI。这个适配器的存在，以及它有时带来的计算成本，是两个世界遵循不同契约的直接后果。

游戏规则：约定如何塑造语言本身

ABI 不仅仅是语言必须遵守的外部约束；它还主动地塑造了语言特性的设计和实现方式。一种语言的能力往往反映了在底层调用约定的框架内可以被优雅而高效地表达的内容。

考虑在多重继承场景中 C++ 虚函数调用的复杂性。当你通过一个指向次要基类的指针调用一个方法时，this 指针（指向对象的数据）可能需要被调整以指向完整对象的真正起始位置。ABI 精确地指定了哪个寄存器持有这个关键的 this 指针（例如，Windows x64 上的 rcx，Linux x64 上的 rdi）。编译器知道这个规则，会生成一些微小的、不可见的辅助函数，称为“thunk”，其唯一的工作就是在跳转到实际的方法实现之前，对寄存器执行这个算术调整。调用约定提供了编排这场复杂舞蹈的固定点。

或者想一想函数式编程中的一个强大特性：闭包。闭包是一个“捕获”其环境的函数，它携带了从其创建作用域中所需的变量。为了实现这一点，编译器不仅必须传递函数的显式参数，还必须传递一个指向这个被捕获环境的隐藏指针。它应该如何传递这个额外的信息呢？可以把它放在栈上传递，但这可能很慢。也可以修改每个函数签名以接受一个额外的指针，但这会破坏与 C 的兼容性。一些编译器采用了一种特别优雅的解决方案，即保留一个特定的寄存器，专门用于传递这个环境指针。这既保持了调用的速度，又不会干扰可见参数的标准 ABI，从而保留了互操作性并启用了尾调用等关键优化。

ABI 契约的严格性也是安全性的一个来源。它定义了什么是合法的，什么是不合法的。假设一个基类定义了一个接受两个参数的虚方法。然后一个程序员在派生类中重写了它，但将签名更改为可变参数（接受可变数量的参数）。在一个调用点，编译器看到一个指向基类的指针，并生成一个标准双参数调用的代码。但在运行时，动态派发可能会选择重写的可变参数函数。此时，被调用者期望一个带有为其命名参数准备的特殊“home slots”的调用约定，而调用者从未准备过这些。这种不匹配——这种对契约的违反——可能导致被调用者从栈中读取垃圾数据，从而导致可怕的“未定义行为”。

系统范围的契约：与内核和硬件的协定

调用约定的影响远远超出了单个应用程序的边界。它是一个系统范围的契约，即使是操作系统内核也必须遵守。当你的程序需要打开一个文件或通过网络发送数据时，它会执行一个特殊的 trap 指令来进行“系统调用”，将控制权交给内核。从用户程序的角度来看，这必须表现为一个无缝的函数调用。

这意味着内核，尽管运行在更高的特权级别，也必须像一个行为良好的“被调用者”一样行事。ABI 将处理器的寄存器划分为两组：caller-saved（调用者保存）和 callee-saved（被调用者保存）。被调用者可以随意涂写调用者保存的寄存器，但有义务保留被调用者保存寄存器中的值。如果操作系统内核在其复杂的内部操作中，修改了一个被调用者保存的寄存器而没有先保存和恢复它，那么它在返回时就会破坏用户程序的状态。这个契约是如此基础，以至于程序员会设计特殊的测试工具，使用底层汇编指令在寄存器中放置哨兵值，进行系统调用，然后验证被调用者保存的寄存器是否保持不变，以确保内核履行了它的协定,,。

这个与硬件的协定也在塑造移动和高性能计算的未来。许多现代处理器是异构的，混合了强大的“big”核和节能的“LITTLE”核。这些核心可能实现相同的指令集，但拥有不同数量的可用寄存器。为了让一个运行中的任务能够从大核无缝迁移到小核，它们都必须同意一个统一的 ABI，该 ABI 只使用最受限核心上可用的寄存器——即它们能力的交集。在这个统一 ABI 中指定多少寄存器为 callee-saved 对性能有直接影响。每次任务迁移时，这些被调用者保存寄存器的状态都必须保存到内存并在新核心上恢复，而迁移的成本与 ABI 契约要求保留的寄存器数量成正比。

未来：作为安全基础的 ABI

也许调用约定最令人兴奋的前沿在于它们有潜力构建从根本上更安全的计算机系统。几十年来，软件一直受到像缓冲区溢出这样的内存安全漏洞的困扰。我们一直试图在软件中修补这些问题，但如果硬件和 ABI 能够协同工作，从设计上消除它们呢？

这就是像 CHERI 这样的基于能力（capability）的体系结构所承诺的。在这样的系统中，原始的内存指针被“能力（capability）”所取代——这是一种不可伪造的令牌，它将内存地址与边界和权限捆绑在一起，全部由硬件强制执行。在这种世界里，调用约定成为一个强大的安全工具。当调用一个只需要从一个 100 字节缓冲区读取的函数时，调用者传递的不是一个简单的指针；它派生出一个新的能力，精确地限制在那 100 字节，并且 write 权限位被关闭。如果被调用者有 bug 并试图读取第 101 字节或写入第 50 字节，硬件本身会立即捕获这个违规行为。

此外，ABI 可以保护程序的控制流。返回地址，在传统系统中只是栈上一个易受攻击的数字，可以被一个密封的、不透明的能力所取代。被调用者被给予这个密封的令牌，但它不能检查或修改它。只有特殊的 return 指令才能使用它来安全地将控制权交还给调用者。调用约定中的这一单一改变，在硬件的支持下，击败了整类常见的网络攻击。

从允许不同语言合作，到促成优雅语言特性的设计，再到强制用户程序与操作系统内核之间的协定，最后到为硬件强制安全打造新的基础——函数调用约定远不止是一个单纯的技术细节。它是计算机科学中伟大的统一概念之一，是一个美丽的例证，说明一个简单的局部契约，在被普遍遵守时，如何产生一个健壮、强大且可互操作的全球系统。它是我们整个数字世界随之起舞的无声而稳定的节奏。