立即数

玻尔百科

定义

立即数是直接编码在机器指令中的常数操作数，使 CPU 无需访问内存即可获取并处理数据。在计算机体系结构中，处理器通过符号扩展或零扩展将指令中的立即数字段填充至寄存器宽度。这种机制对于实现位置无关代码以及防御计时侧信道攻击的等时算法具有重要意义。

核心要点

立即数是直接编码在 CPU 指令中的一个常量，它向处理器提供数据而没有内存访问延迟。
CPU 对算术指令使用符号扩展，对逻辑指令使用零扩展，以便将较小的立即数正确地扩展到较大的寄存器中。
CPU 架构师必须通过仔细选择立即数字段的大小来平衡代码密度、性能和指令复杂性。
立即数对于创建可增强软件可移植性的位置无关代码，以及编写可防御时序侧信道攻击的常数时间算法至关重要。

引言

在计算世界中，数据可以通过两种基本方式提供：可以从某个位置获取，就像在书中查找事实一样；也可以作为指令本身的一部分，就像命令“走 5 步”一样。这第二种自包含的数据被称为立即数 (immediate value)。这个概念看似简单，却是处理器设计的基石，影响着从性能、效率到安全的方方面面。本文探讨了这种基本选择——嵌入数据与获取数据——如何在整个计算机科学领域产生连锁反应。

本文将分为两个主要部分。首先，在“原理与机制”部分，我们将深入探讨硬件本身，探索立即数如何被编码到指令位中，处理不同大小数字的巧妙硬件技巧（如符号扩展和零扩展），以及架构师在性能、指令大小和代码密度之间面临的关键权衡。随后，“应用与跨学科联系”部分将拓宽我们的视野，揭示这个底层概念如何成为创建可重定位软件、优化程序、保护密码系统甚至在经济学和生物学等不同领域中呼应基本原则的关键。

原理与机制

想象一下，你正在厨房里按照食谱做饭。一条指令可能会说：“加入 2 茶匙糖”。数量“2”就在命令中，是自包含的。另一条指令可能会说：“加入冰箱上便签所写的糖量”。现在你必须多走一步：走到冰箱前，读便签，然后使用那个数量。在计算机中央处理器（CPU）的世界里，这就是立即数操作数与必须从内存中获取的操作数之间的本质区别。立即数就是“2 茶匙糖”——一个直接嵌入在指令本身中的数字。

这个简单的概念是计算最基本的构建模块之一，但随着我们层层深入，会发现它引出了一系列优雅的解决方案、巧妙的妥协以及对计算机设计艺术的深刻见解。

命令中的数字

计算机指令的核心不是文本词语，而是一种位模式——一长串的 1 和 0。例如，一条现代的 $32$ 位指令就是一串 $32$ 个二进制数字。CPU 的解码器是一个经过精确调校的硬件，它读取这个模式并将其分解为不同的字段：模式的一部分说明做什么（操作码 opcode），其他部分说明在哪里找到数据（操作数），还有一部分说明将结果放在哪里。

当一条指令使用立即数时，这 $32$ 位中的一部分就是数据。该值可立即用于操作，无需耗时地访问主内存。这就是它被称为“立即”的原因。

让我们看一个来自 ARM 架构的真实例子，这是一种在数十亿智能手机中使用的处理器。一位工程师在查看程序的机器代码时，可能会看到十六进制数 $0xE3A01001$ 。这看起来很晦涩，但对 CPU 来说，这是一条清晰无比的命令。根据 ARM 指令手册，通过将其分解为二进制字段，我们可以看到它在说什么。

[24:21] 这些位恰好是 1101，硬件知道这是 MOV（移动）操作的操作码。
[15:12] 这些位指定了目标寄存器 r1。
而且，对我们来说最重要的是，末尾的 [7:0] 这些位是 00000001，这是数字 $1$ 的二进制表示。

硬件将这些字段组合起来，理解完整的命令：“将立即数 #1 移动到寄存器 r1 中。”常量 $1$ 并非从别处获取；它被直接编织在指令字 $0xE3A01001$ 的结构中。这种直接嵌入是立即寻址的精髓。

大小问题：两种扩展的故事

这看起来很简单，但一个深刻的问题很快就出现了。一条指令的大小是有限的——比如 $32$ 位。这个空间必须在操作码、寄存器编号和我们的立即数之间共享。对于许多常见操作，比如加 $1$ 或将计数器设为 $0$ ，一个 $8$ 位或 $16$ 位的立即数字段就足够了。但 CPU 中的主寄存器通常要大得多，可能是 $32$ 位或 $64$ 位。

如何将一个 $8$ 位的数与一个 $32$ 位的数相加？你不能直接加。首先，你必须将这个 $8$ 位的立即数“提升”到 $32$ 位。这个过程称为扩展 (extension)，但它不像简单地附加零那么简单。指令的含义决定了数字必须如何扩展。这在硬件设计中引出了一种优美的二元性。

想象一个 $16$ 位的立即数需要变成一个 $32$ 位的操作数。我们需要在数字的“高端”填充 $16$ 个新位。我们用什么来填充它们呢？

对于逻辑运算，比如按位与（AND），答案很简单。假设你想隔离一个寄存器中 $32$ 位值的低 $16$ 位。你会使用一条 andi（立即数与）指令，其立即数的所有 $16$ 位都为 1（十六进制表示为 $0xFFFF$ ）。要将其变成一个 $32$ 位的掩码，你希望高 $16$ 位为 0，这样 任何数 AND 0 就等于 0。硬件会执行零扩展，用零填充高 $16$ 位，创建出 $32$ 位值 $0x0000FFFF$ 。这正好实现了你的意图：它清除了寄存器的上半部分，并保留了下半部分。

但对于算术运算，这将是一场灾难。在表示有符号整数的通用二进制补码系统中，最高有效位（MSB）是符号位（0 代表正数，1 代表负数）。 $16$ 位的模式 $0xFFFF$ 并不代表大的正数 $65535$ ，而是代表数字 $-1$ 。如果我们将其零扩展为 $0x0000FFFF$ ，它将变成 $+65535$ 。加上这个数会得到一个完全错误的答案。

解决方案是一个极其巧妙的技巧，称为符号扩展。要扩展一个有符号数同时保持其值不变，你只需将其符号位复制到所有新的、更高位的比特上。对于我们的数字 $0xFFFF$ ，符号位是 1。因此，为了将其扩展到 $32$ 位，硬件用 1 填充新的 $16$ 位，产生 $0xFFFFFFFF$ 。这个 $32$ 位的模式是 $-1$ 的正确表示。当 addi（立即数加）指令看到操作数 $0xFFFF$ 时，它知道在加法之前要执行符号扩展。实现这一点的物理布线非常简单：ALU 输入的高位全部连接到立即数字段的单个符号位上。

因此，同一个 $16$ 位模式 $0xFFFF$ ，可以表示 $+65535$ 或 $-1$ ，这取决于使用它的指令！操作码就像管弦乐队的指挥，告诉硬件是演奏逻辑乐章（使用零扩展）还是算术乐章（使用符号扩展）。这种对数据的上下文相关解释是计算机科学中一个反复出现且强大的主题。

架构师的困境：权衡的宇宙

立即数不仅仅是程序员的便利工具；它还是工程权衡的战场，这些权衡定义了 CPU 的特性。

首先，有一个明显的矛盾：我们应该为立即数字段分配多少位？一个较大的字段，比如 $21$ 位，可以让一条分支指令向前或向后跳转超过 $800$ 万字节的代码，这是一个巨大的范围。而一个较小的字段，比如算术指令的 $12$ 位，只能表示大约到 $2047$ 的数字，这对于小的常量来说没问题，但对于许多其他常量来说则不够。架构师必须根据最可能的使用方式来明智地分配位数。

那么，当你需要一个太大而无法容纳的常量时，比如 $32$ 位值 $0xC0FFEE01$ ，该怎么办呢？解决方案是回到我们那个冰箱便签的类比。汇编器将这个大常量放置在内存中一个邻近的、隐藏的区域，称为文字池 (literal pool)。然后，指令变成一种特殊的加载指令，它会说：“我的操作数位于我自己的地址，再加上某个小的偏移量。”这被称为 PC 相对寻址。例如，一条位于地址 $0x0001003C$ 的指令可能会从 $0x00010120$ 加载一个值，通过编码一个小的偏移量（如 $55$ ），硬件会将其缩放并加到程序计数器（PC）上，以找到完整的地址。这是一个优雅的妥协，它提供了访问完整大小常量的能力，而无需在每条指令中都设置一个巨大的立即数字段。

这导致了代码密度和取指性能之间更宏大的权衡。想象三个相互竞争的 CPU 设计：

设计 D16： 使用微小的 $16$ 位指令。非常适合小的立即数。如果需要更大的立即数，它会附加 $16$ 位的扩展字。这导致代码非常紧凑（高密度），对于内存有限的系统（如嵌入式控制器）来说非常棒。然而，获取一条逻辑指令可能需要多个周期，从而降低性能。
设计 D64： 使用巨大的 $64$ 位指令。它甚至可以容纳一个 $32$ 位的立即数，还有富余空间。每条指令都在一个周期内获取，这对性能非常有利。但对于使用小常量的常见操作，这 $64$ 位中的大部分都被浪费了，导致代码臃肿（低密度）。
设计 D32： 一个 $32$ 位的指令，是经典的折中方案。它可以直接处理中等大小的立即数，只对最大的立即数使用扩展。它平衡了代码密度和性能。

哪种最好？没有唯一的答案。对于给定的工作负载——比如说，60% 的操作使用小立即数，25% 使用中等立即数，15% 使用大立即数——我们可以计算每种设计的平均代码大小和平均取指周期。结果通常显示，D16 最密集但最慢，D64 最快但最臃肿，而 D32 是理想的中间方案。这种选择从根本上塑造了架构的特性，使其为特定目的量身定制，无论是微型微控制器还是性能强大的超级计算机。

机器中的幽灵

让我们在旅程的最后，看看立即数两个微妙、近乎幽灵般的方面，它们却有着非常实际的后果。

首先是字节序 (endianness)。像 $0x12345678$ 这样的一个 $32$ 位指令字是一个逻辑实体。它的四个组成字节—— $0x12$ , $0x34$ , $0x56$ , $0x78$ ——在字节可寻址内存中是如何物理排列的？“小端序”机器将最低有效字节（ $0x78$ ）存储在最低的内存地址。“大端序”机器则会将最高有效字节（ $0x12$ ）存储在那里。当 CPU 获取指令时，其内存接口会在解码器看到它之前，自动将字节重新组装成正确的逻辑字。这意味着立即数字段的概念（例如，包含 $0x5678$ 的位 15:0）是一个抽象，它对底层发生的字节重排一无所知。理解逻辑指令与其物理存储之间的这种分离是掌握底层编程的关键。

其次是调试。假设一个程序失败了，你发现寄存器 R1 包含错误的值。是什么导致的？是一条带有错误立即数值的 add-immediate 指令吗？还是一条 add-from-memory 指令，从特定地址加载了一个损坏的值？如果你唯一的调试工具是一份最终寄存器值的日志，你是无法区分的。操作数的来源是模糊的。为了解决这个问题，高性能处理器包含了复杂的硬件追踪功能，它不仅能记录结果，还能记录每条指令操作数的来源——一个标志，指示它是立即数还是来自内存，如果来自内存，使用了哪个地址。这让我们回到了原点，再次强调了区分嵌入在指令中的操作数和从远处获取的操作数是需要理解的最关键属性。

从一个嵌入在命令中的数字开始，我们穿越了大小问题、架构权衡的宏大艺术，以及内存布局和调试的微妙现实。事实证明，谦逊的立即数是一个强大的透镜，通过它我们可以审视整个计算机架构学科——一个充满逻辑、妥协和将简单位模式转化为计算本身这一无尽追求的学科。

应用与跨学科联系

在我们迄今的旅程中，我们探索了机器的核心，发现了“立即数”的原理——一个不是从某个遥远的内存位置获取，而是指令本身不可分割的一部分的数字。它是一个常量，一个已知量，一个此时此地的信息。这就像记住一个事实和必须去图书馆查阅它之间的区别。前者是瞬时的；后者则需要一段旅程。

现在，让我们退后一步，欣赏这个简单概念所塑造的壮丽景观。我们将看到，“立即性”这个想法不仅仅是一个巧妙的工程技巧，更是一个基本原则，在软件、安全、经济学甚至演化生物学的宏大舞台上回响。

架构师的工具箱：计算的构建模块

想象一位总建筑师在设计一座城市。他们不只使用原材料，还使用具有内置尺寸的预制构件。在处理器的世界里，立即数正是这样的构件，一个被融入操作蓝图的常量。

这在基本算术中最为明显。一条给寄存器加 $5$ 的指令，并不需要处理器先去内存中找到数字 $5$ 。这个 $5$ 是指令本质的一部分。但其应用远比这更微妙和强大。考虑通过内存映射 I/O 控制外围设备。为了打开控制面板上的一个特定灯而不干扰其他开关，程序员会执行一个“读-改-写”操作。他们读取所有开关的当前状态，使用按位 AND 清除他们想要改变的位，然后用按位 OR 来设置新的位。用于这些 AND 和 OR 操作的“掩码”是立即数的完美候选。它们是用于操作硬件寄存器特定部分的定制形状的钥匙，直接随命令提供。同样，在计算内存地址时——例如，将一个值存储在某个已知位置的偏移处——该偏移量通常作为立即数提供。指令实际上在说：“到这个寄存器中的地址，然后向前走 $16$ 步”。

也许立即数最优雅的用法是在跳转的艺术中。当程序需要分支时，它有两种方式。它可以使用一个直接地址，就像说“跳转到主街 123 号”。或者它可以使用一个相对地址，就像说“从我们现在的位置向前跳三个街区”。这个相对偏移量就是一个立即数。相对跳转的美妙之处在于，指令变得与位置无关。你可以把整个代码块捡起来，移动到城市的其他地方（内存），“向前三个街区”这个方向仍然完全有意义。而“主街 123 号”这个地址则无法做到这一点，它仍然会指向旧的、现在已经空了的位置。这种位置无关代码的原则是现代操作系统的基石，它允许库和程序被加载到内存的任何地方而不会中断。例如，一个真实的引导加载程序（bootloader）通常会把自己复制到一个新的内存位置来开始其主要工作。它只有在其内部逻辑依赖于立即数常量和相对跳转时才能成功做到这一点，因为这些对重定位是免疫的，而任何试图使用固定的、绝对地址访问数据的尝试都会惨败。

软件与硬件的对话

立即数的概念在人类可读的软件世界和机器可执行的硬件世界之间架起了一座至关重要的桥梁。当一个 C++ 程序员写下 const int COUNT = 10; 时，他们表达了一个意图，即某个东西是一个固定的、已知的值。一个聪明的编译器，作为翻译者，通常会抓住这一点。编译器不会为 COUNT 在内存中预留一个位置并强迫处理器每次都去获取它，而是会将值 $10$ 直接嵌入到任何使用它的指令中。这就是常量传播。如果代码是 WIDTH = COUNT * 2;，编译器可能会将其预计算为 $20$ ，并将该值作为立即数嵌入。这种被称为常量折叠的优化，是编译器拥抱立即性哲学以使最终程序更快、更高效的体现。

但这场对话有一个引人入胜的转折。在定义了大多数现代计算机的冯·诺依曼架构中，指令和数据之间没有根本的区别。它们都只是内存中的比特。这开启了一种奇特而强大的可能性：自修改代码。一条位于地址 $0x1000$ 的指令可能包含一个立即数。但另一条指令可以过来，向地址 $0x1000$ 写入新数据，覆盖原始指令及其“立即”值。当程序循环回来时，它执行的是一条全新的指令。这既是编程奇技淫巧的源泉，也是一个巨大的安全漏洞。

正是这种危险凸显了关于立即数的一个深刻真理。一条像 ADDI r1, r1, 0x80001000 这样给寄存器加上一个大数的指令，与 LOAD r1, [0x80001000] 这样从该地址加载数据的指令，有着本质的不同。即使立即数值 $0x80001000$ 恰好对应一个禁止访问的、受保护的内存地址，ADDI 指令也会毫无问题地执行。CPU 的内存管理单元（MMU），内存的警惕守卫，甚至不会被咨询。它知道这个值只是一个供 ALU 处理的数字，而不是一个要去访问的地方。然而，LOAD 指令试图去往那个地址，MMU 会立即发出警报，触发一个异常。立即数是信息；直接地址是目的地。理解这种区别是构建安全系统的第一步。

数字堡垒中的立即性：一堂安全课

在网络安全的猫鼠游戏中，攻击者具有惊人的创造力。一些最微妙的攻击不是破门而入，而是在墙边窃听。他们测量的不是计算机计算了什么，而是花了多长时间。这就是时序侧信道攻击。

想象一个密码算法需要在一个大表中查找一个值，而表索引依赖于一个秘密密钥。攻击者看不到索引，但他们可以测量操作完成所需的时间。如果密钥 A 的表项已经在快速的缓存内存中，查找就很快。如果密钥 B 的表项在慢速的主内存中，查找就很慢。通过仔细计时不同输入的计算时间，攻击者可以推断出正在访问表的哪些部分，并由此重建秘密密钥。

我们如何防御这种情况？我们必须编写常数时间代码，即无论秘密输入如何，执行时间都相同的代码。在这里，立即数成为了英雄。漏洞源于数据相关的内存访问。解决方案通常是完全消除该内存访问。修改后的代码可能不是从表中加载掩码 mask = M[secret_index]，而是使用一系列分支来选择一个代码块，该代码块使用立即数操作数应用正确的掩码：result = data 0xDEADBEEF;。由于使用立即数操作数的 ALU 操作具有固定的、可预测的延迟，这条路径消除了来自数据缓存的时序泄漏。

当然，这不是万能的。攻击者现在可以尝试对指令缓存或分支预测器进行计时！但这揭示了一个原则：要关闭时序通道，我们必须用常数时间操作替换依赖于秘密的、可变延迟的操作（如内存加载）。从内存地址到立即数的旅程，是走向密码安全的旅程。

在其他世界的回响：一个概念的统一性

“此时此地”与“遥远而不确定”之间的权衡是如此基本，以至于它以不同的形式在看似与计算机芯片毫无关系的学科中重现。

考虑一个计算经济学中的问题。一家公司必须决定是否投资一个项目。未来的回报 $X$ 是不确定的——它是一个具有已知分布的随机变量。然而，公司可以支付一个立即的、固定的成本 $c$ 来进行市场调研。这项研究提供了一个信号 $S$ ，从而减少了关于 $X$ 的不确定性。决定支付成本 $c$ 就是决定接受一个立即成本，以换取一个指向未来不确定“内存”中某个值的更好“指针”。问题的核心是计算“信息的现值”，看未来不确定性的减少是否值得立即的成本。

现在让我们来到演化生物学的世界。一只吸血蝙蝠，在一次成功的捕猎后，可能会与一只饥饿的、未成功的邻居分享它的血餐。这种互惠利他主义的行为给捐赠者带来了立即的适应度成本 $C$ 。潜在的回报是邻居将在未来的某个晚上回报这份恩情。这个未来的利益 $B$ 并非板上钉钉（它以概率 $p$ 发生），而且由于在未来，其价值在心理上打了折扣。生物学家用一个时间折扣因子 $\delta$ 来对此建模，未来的回报 $B$ 在今天只被感知为价值 $\delta B$ 。只有当预期的、折扣后的未来回报大于立即成本时，演化才会青睐这种利他行为： $p \delta B > C$ 。如果动物对未来的折扣过高（一个小的 $\delta$ ），立即成本将总是显得太高，合作就会瓦解 [@problem_-id:1877299]。

无论是 CPU、公司还是蝙蝠群，同样的基本演算都适用。在确定的、当前的、立即的成本或价值与不确定的、延迟的、“从内存中获取”的未来价值之间存在一种张力。编码在机器指令比特中的谦逊的立即数操作数，是这一普遍权衡中一方的完美、晶莹剔透的例子。从这个微小的思想种子中，一个丰富而复杂的行为、策略和设计的世界就此展开。