指令集架构 (ISA)

玻尔百科

定义

指令集架构 (ISA) 是定义处理器所能执行操作的抽象协议，作为软件与硬件之间的接口。该领域将计算机的功能定义与其底层的微架构实现相分离，并涵盖了 RISC 和 CISC 等核心设计哲学。指令集架构 (ISA) 为系统软件奠定了基础规则，包括定义特权级、内存一致性模型以及用于人工智能加速的专用指令。

核心要点

指令集架构 (ISA) 是定义处理器能做什么的抽象合约，它将此与定义如何做的微架构分离开来。
像 RISC（精简指令集计算机）和 CISC（复杂指令集计算机）这样的设计哲学，在指令简单性、硬件复杂性和编译器效率之间呈现了根本性的权衡。
ISA 为系统软件提供了基础规则，定义了操作系统所必需的启动状态、特权级别和内存一致性模型。
现代 ISA 不断演进以应对新挑战，通过集成专用指令以加速人工智能，并减轻诸如时序侧信道攻击之类的安全漏洞。

引言

在计算世界中，指令集架构（ISA）是关键的桥梁，是允许软件命令硬件的通用语言。它是一份基本合约，定义了处理器能够执行的每一项操作，将底层芯片的巨大复杂性隐藏在一个清晰、抽象的接口之后。理解这份合约对于掌握计算机的工作原理至关重要，不仅如此，它还有助于我们理解计算机在执行某些任务时为何表现优异、成功或失败。本文旨在揭开 ISA 的神秘面纱，弥合高级编程与底层硬件设计之间的知识鸿沟。

在接下来的章节中，我们将从 ISA 的基本原则出发，探讨其深远的影响。第一章“原理与机制”将剖析核心概念，探索 ISA 与其实现（微架构）之间的关键区别，以及处理器设计的不同“语言”（如 RISC 和 CISC），还有控制内存和数据的复杂规则。随后，“应用与跨学科联系”一章将揭示 ISA 的设计选择如何在整个计算生态系统中产生涟漪效应，塑造从编译器优化、操作系统设计到人工智能工作负载性能乃至现代网络安全战场的方方面面。我们首先从审视使 ISA 成为计算基石的基本原则开始。

原理与机制

想象一下，你正站在一台极其复杂的机器前，也许是一台未来的织布机或一个自动化的化工厂。这台机器由齿轮、管道和电线构成一个迷宫，堪称工程奇迹。然而，要控制它，你得到的不是其内部工作原理的蓝图，而是一个简单、清晰的控制面板。这个面板上有一组定义明确的按钮、杠杆和拨盘。一个按钮上写着“ADD”，一个拨盘让你选择存储仓“R1”和“R2”，一个显示屏则展示结果。作为操作员，你不需要知道加法是如何执行的——无论是通过机械齿轮、液压阀门还是电子电路。你只需要相信，当你按下“ADD”时，存储仓 R1 和 R2 的内容会如约相加。这个控制面板的设计就是你（用户）与机器工程师之间的合约。

这正是我们称之为指令集架构（Instruction Set Architecture, ISA）的完美类比。ISA 是软件与硬件之间的基本合约。它是处理器的“控制面板”，定义了软件被允许请求的每一项操作。硬件工程师，就像我们那台神秘机器的建造者一样，可以自由地以任何他们认为合适的方式实现面板背后的机械装置——只要每个按钮和拨盘都履行其所宣称的功能。

两个世界间的合约：ISA 与微架构

需要掌握的最关键概念是指令集架构（ISA）与微架构之间的分离。ISA 是抽象模型，它规定了处理器能做什么。微架构是具体实现，它描述了处理器如何做。

ISA 定义了如下内容：

可用操作的集合（操作码），如 ADD、LOAD、STORE、BRANCH。
可访问的存储位置，主要是一组高速寄存器和主内存。
操作可以处理的数据类型，如不同大小的有符号和无符号整数。
指令本身的格式——即代表一个操作及其操作数的二进制编码。

另一方面，微架构则涉及流水线、缓存、执行单元和预测器等领域。它是将 ISA 变为现实的具体硅片布局。两款处理器可以共享完全相同的 ISA——这意味着它们可以运行相同的二进制程序——但它们的微架构可能截然不同，从而导致不同的性能、功耗和成本。

考虑一个简单的循环，用于对数组元素求和。编译器将此循环翻译成一系列 ISA 指令：LOAD 一个元素，ADD 到一个运行总和上，INCREMENT 一个指针，COMPARE 指针与终点，如果未完成则 BRANCH 回去。假设在一个基本处理器上，这个循环执行其 5 条指令需要 6 个周期，其平均每指令周期数（CPI）为 1.2。现在，我们能改变什么？

微架构的改变：工程师可能会意识到 COMPARE 和 BRANCH 指令几乎总是成对使用。他们可以设计一个巧妙的电路来将这两个操作“融合”成一个内部步骤，即微操作融合（micro-op fusion）。ISA 没有改变；程序员仍然看到两条独立的指令。但机器内部现在只执行 5 个微操作而不是 6 个。CPI 降至 1.0，程序运行得更快。合约得到了遵守，但机器变得更高效了。
ISA 的改变：作为另一种选择，架构师可能决定修改 ISA 本身。他们可以引入一条更强大的新 LOAD 指令，该指令在加载数据后自动增加指针。现在，编译器可以生成一个只有 4 条指令而不是 5 条指令的循环。即使这个新的指令序列需要 5 个周期，CPI 也变成了 $5/4 = 1.25$ 。

这种区别意义深远。它允许硬件在不破坏所有现有软件的情况下不断创新。为 1990 年代的 Intel 处理器编译的程序仍然可以在现代处理器上运行，因为它们都遵循相同的核心 x86 ISA。新芯片的速度要快得多，不是因为 ISA 合约发生了巨大变化，而是因为微架构实现——控制面板背后的机械装置——经过了数十年天才工程师的精炼。这种实现可以是一个刚性、超高速的硬布线控制单元——其逻辑直接蚀刻在硅片上——或者是一个更灵活的微程序控制单元，它像一个微型、快速的解释器，运行“微码”来执行每条 ISA 指令。对于开发全新 ISA 的开发者来说，微程序方法提供了一个巨大的优势：可以通过简单地更新微码来修复错误或添加新指令，这比重新设计和制造新硬件要容易得多。

机器的语言：操作码、操作数和编码

如果说 ISA 是一门语言，那么它的指令就是句子。每个句子都有一个动词——要执行的操作，即操作码——和名词——要操作的数据，即操作数。正如人类语言有不同的语法结构一样，ISA 也有不同的哲学来构建这些句子。

假设我们想计算简单表达式 $t = (a+b) \times (c-d)$ ，其中所有变量都在内存中。不同的 ISA 会如何表达这个计算？

堆栈架构：这就像一个老式的 RPN 计算器。你将操作数推入堆栈，而操作符对栈顶元素进行操作。
1. PUSH a
2. PUSH b
3. ADD （用它们的和替换 a 和 b）
4. PUSH c
5. PUSH d
6. SUB （用它们的差替换 c 和 d）
7. MUL （用它们的积替换两个中间结果）
8. POP t （将最终结果存入内存）这种风格的指令非常简单、紧凑（算术操作码无需指定操作数），但需要仔细管理堆栈，并导致更长的指令序列。
累加器架构：在这里，一个特殊的寄存器——累加器——是所有算术运算的隐含操作数和目标。
1. LOAD a （累加器 = a）
2. ADD b （累加器 = 累加器 + b）
3. STORE temp （将结果保存到一个临时内存位置）
4. LOAD c （累加器 = c）
5. SUB d （累加器 = 累加器 - d）
6. MUL temp （累加器 = 累加器 * temp）
7. STORE t 这很简单，但单一的累加器是一个瓶颈，常常迫使中间结果被“溢出”到慢速内存中，这极大地增加了内存流量。
加载-存储架构：这是现代RISC（精简指令集计算机）设计背后的哲学。算术运算只能在寄存器之间进行。内存访问完全通过 LOAD 和 STORE 指令进行。
1. LOAD R1, a
2. LOAD R2, b
3. ADD R1, R1, R2 (R1 = a+b)
4. LOAD R2, c
5. LOAD R3, d
6. SUB R2, R2, R3 (R2 = c-d)
7. MUL R1, R1, R2
8. STORE t, R1 代码看起来更长，但它干净且可预测。计算和内存访问的分离是一个强大的简化原则。
寄存器-内存架构：这是CISC（复杂指令集计算机）设计的典型特征。它允许指令混合使用寄存器和直接内存地址进行算术运算。
1. LOAD R1, a
2. ADD R1, b (R1 = R1 + mem[b])
3. LOAD R2, c
4. SUB R2, d (R2 = R2 - mem[d])
5. MUL R1, R2
6. STORE t, R1 由于操作更强大，这导致了最短的代码（最少的指令数）。

每种风格在指令数量、简单性和数据移动之间都呈现出不同的权衡。没有唯一的“最佳”方式；选择反映了一种深刻的设计哲学。

一旦选定了风格，这些指令必须被编码成二进制。对于一台具有固定 32 位指令长度的机器来说，每一位都非常宝贵。如果你想要更多的寄存器，比如 $R=32$ 个，你需要 $\lceil \log_2(32) \rceil = 5$ 位来标识每一个寄存器。一条三操作数指令（ADD R_dest, R_src1, R_src2）仅用于寄存器就已消耗 $3 \times 5 = 15$ 位。为了支持一个立即数值（例如 ADD R1, R2, 100），比如说 $k=12$ 位，通常会使用一种不同的指令格式，这种格式带有两个寄存器操作数和这个立即数。这将为操作数消耗 $2 \times 5 + 12 = 22$ 位，只留下 $32 - 22 = 10$ 位给操作码。在支持不同指令格式、寄存器数量、立即数值大小和可用操作码数量之间，这种持续的张力是 ISA 设计中的一个核心难题。

设计哲学：RISC 与 CISC 的大辩论

加载-存储架构与寄存器-内存架构之间的对比，是塑造了现代计算的一场宏大辩论的核心：RISC vs. CISC。

CISC（复杂指令集计算机），作为一种较早的哲学，旨在使硬件功能强大。其思想是创建能够反映高级编程语言操作的高级指令。一条单一的 CISC 指令可能执行一个多步操作，比如从内存加载两个数，将它们相加，然后将结果存回。这简化了编译器的任务，并减少了程序中的指令数量。

RISC（精简指令集计算机）源于一个与直觉相反的观察：这些复杂指令通常非常慢，以至于用一系列更简单、更快的指令可以更快地完成同样的工作。RISC 哲学崇尚简单：

指令应该简单，并在一个时钟周期内执行（在理想的流水线中）。
指令应具有固定的长度和规整的格式，使其更易于解码。
内存访问应限于显式的 LOAD 和 STORE 指令。

这最后一点，即所谓的加载-存储架构，尤为出色。它创造了一种编译器可以利用的清晰分离。因为算术指令保证没有隐藏的内存副作用，编译器可以更容易地分析数据依赖性并重排指令以获得更好的性能。例如，如果一个循环使用内存中的一个常量值，针对 RISC 机器的编译器可以自信地将单条 LOAD 指令移出循环。而在 CISC 机器上，许多不同的算术指令可能会不可预测地访问内存，要证明这样做是安全的要困难得多，这常常迫使编译器过于保守，生成较慢的代码。

RISC 哲学的另一个关键信条是正交性，即指令可以为任何目的使用任何寄存器。许多早期的 CISC 设计都有专用寄存器，比如累加器。如果你需要计算 $z = x+y$ ，但 ISA 强制所有加法都必须是 accumulator = accumulator + operand 的形式，你就必须编写一系列 MOVE 指令来将数据移入和移出累加器。概率分析表明，对于一台拥有 $R=32$ 个寄存器的机器，执行 $L=10^6$ 次此类操作，这种非正交性会带来近两百万条额外 MOVE 指令的惊人开销，而这与一个干净、正交的 RISC 设计相比。事实证明，简单不仅是优雅，而且是快速。

魔鬼在细节中

ISA 合约是详尽无遗的。它不仅必须涵盖计算的宏观方面，还必须涵盖那些保证程序能正确、可预测运行的微小、微妙的细节。

其中一个细节是数据表示。内存中的一个字节就是八位。字节 0x80 在二进制中是 10000000。如果我们使用有符号 8 位整数（从 -128 到 127），这个模式代表数字 $-128$ 。如果我们使用无符号整数（从 0 到 255），它代表 $128$ 。当一个 32 位处理器加载这个字节时，它应该做什么？ISA 必须提供不同的指令。一条“加载字节”（lb）指令可能会执行符号扩展，将该字节的符号位（即 1）复制到 32 位寄存器的所有高位，得到值 $-128$ 。而一条“加载无符号字节”（lbu）指令则会执行零扩展，用零填充高位，得到值 $128$ 。程序员如果混淆了这两者，可能会引入令人抓狂的错误，即同一个内存值被以两种完全不同的方式解释。

有时，硬件实现的实际情况会“泄漏”到抽象的 ISA 合约中。一个典型的例子是分支延迟槽。在流水线处理器中，芯片会提前取指。当它确定一个分支（一个 if 语句）应该跳转到不同位置时，紧跟在分支指令之后的那条指令已经深入流水线了。一些 ISA（如 MIPS）没有丢弃这部分已完成的工作，而是定义了一条规则：分支后的“延迟槽”中的指令总是会被执行，无论分支结果如何。这简化了硬件，却增加了编译器的负担，编译器现在必须找到一条有用或无害的指令放在那个槽里，以避免在一个 NOP（空操作）指令上浪费一个周期。

也许现代 ISA 中最复杂、最引人入胜的部分是其内存一致性模型。在单核世界里，内存很简单：一个写操作之后是一个读操作，顺序清晰。但在多核世界里，当两个不同核心上的两个线程访问相同数据时会发生什么？考虑一个生产者线程写入数据然后设置一个标志，以及一个消费者线程在读取数据前等待该标志。

线程 P (生产者):

data = 42
flag = 1

线程 C (消费者):

while (flag == 0)
read data

我们的直觉告诉我们，如果线程 C 看到 flag 变为 1，那么它随后看到的 data 必须是 42。但在一个具有弱序内存模型的机器上，这并不能保证！为了最大化性能，硬件可能会重排线程 P 中的写操作，使得 flag = 1 在 data = 42 之前对线程 C 可见。线程 C 随后会跳出循环并读取到 data 的旧值。

为了防止这种混乱，ISA 必须提供特殊的栅栏（fence）指令。这些是强制内存操作以特定顺序可见的屏障。生产者可以在其两次写操作之间插入一个释放栅栏（release fence），保证栅栏前的所有内存操作在栅栏后的任何操作之前可见。消费者可以在读取标志后插入一个获取栅栏（acquire fence），保证在执行任何后续内存读取之前，标志的读取已经完成。这种释放-获取配对正确地同步了线程，以微小的性能代价强制执行了我们的直觉。内存模型是合约的终极部分，是现代并行计算多车道高速公路的一套交通法规。正是在这些错综复杂的规则中，我们看到了指令集架构的真正美妙与深邃——这个驱动着数字世界的无形语言。

应用与跨学科联系

如果将计算机系统比作一座宏伟的城市，那么指令集架构（ISA）既不是单一的建筑，也不是某个人。它是这座城市的总体规划、法律法规及其通用语言的集合体。它是让混乱而富有创造力的软件世界与严谨而物理的硅片世界得以沟通的基本协议。我们讨论过的 ISA 原理不仅仅是抽象的奇谈怪论；它们是无形的丝线，贯穿于计算的方方面面，从编写快速程序的艺术，到构建安全系统的挑战，甚至延伸到我们对未来计算范式的梦想。现在，让我们在这座城市中漫步，看看 ISA 是如何塑造我们这个世界的。

翻译的艺术：编译器与 ISA 的对话

软件世界的核心是编译器，一位将人类思想的高级语言（如 Python 或 C++）转换成机器原始语言的大师级翻译家。ISA 是编译器的目标语言，而该语言的丰富性和结构对翻译质量有着深远的影响。一个设计良好的 ISA 就像一套设计精良的词汇，能让编译器简洁高效地表达复杂的思想。

考虑一个简单的日常任务：遍历内存中的对象列表（例如客户记录列表），并从每个对象中提取特定信息，比如客户的电话号码。每条记录都是一个特定大小的结构体，电话号码在该结构体内的固定偏移处。一种天真的方法是，编译器为每一位客户生成代码，从头重新计算内存地址：(列表起始地址) + (客户编号) \times (记录大小) + (电话号码偏移量)。这很笨拙。一个巧妙的 ISA 提供了更优雅的方式：一种“带位移的变址寻址模式”。这是一条指令，它说：“这是一个寄存器中的列表起始地址，另一个寄存器中的客户位置。现在，直接跳转到正确的位置，并加上这个小的、内置的偏移量来找到电话号码。”通过使用这种专门的指令，编译器可以避免在循环中为每条记录重新计算基地址，从而节省数百万次算术运算，使代码速度大幅提升。编译器与 ISA 之间的这种对话，即使在优化最基本的数据访问时，也是一场持续的效率之舞。

当我们考虑到 ISA 本身的设计哲学时，这场舞蹈变得更加复杂。ISA 应该提供一个包含复杂指令的大词汇表，还是一个精简的小集合？这是复杂指令集计算机（CISC）与精简指令集计算机（RISC）之间的经典辩论。想象一下，编译器需要计算一个数的绝对值。CISC ISA 可能会提供一条强大的 ABS 指令。而 RISC ISA 则可能要求编译器通过一系列原始逻辑操作（如移位和异或）来构建绝对值。如果 ABS 指令可用，编译器的任务就简单了，生成的代码也更紧凑。如果不可用，编译器必须更聪明，但底层的硬件可以更简单。哪种更好？答案取决于权衡。复杂的指令可能比巧妙的简单指令序列更慢，也可能不会。编译器的指令选择过程，通常被建模为操作图上的“覆盖”问题，是一个寻找最低成本指令序列来完成任务的迷人谜题 [@problem_gpid:3634921]。

然而，最美妙的互动往往是最微妙的。假设编译器需要一个常量值，比如一个嵌套数据结构中某个字段的地址。这个地址是一个基指针和两个或多个固定偏移量的总和。如果总偏移量是一个大数，它可能无法放入单条指令中。编译器现在面临一个选择。一种策略是计算一次这个总偏移量，将其存储在一个寄存器中，然后重用。但如果寄存器不足，即所谓的“寄存器压力”过高，该怎么办？存储它可能意味着将其“溢出”到主内存中，这是一个存储和重新加载的缓慢过程。这时，一个绝妙的替代方案出现了：重物质化（rematerialization）。与其保存这个值，为什么不在每次需要时重新计算它呢？这似乎很浪费，但如果 ISA 提供了快速的指令，可以从能够放入指令中的较小立即数常量生成这个值，那么这可能比往返内存要快得多。决定是保存还是重新创建值，是编译器做出的一个深刻的战略选择，这个选择完全由 ISA 提供的工具所促成和限制。

隐藏的世界：ISA 如何塑造芯片

ISA 是一种抽象，一份合约。它规定了指令做什么，但没有规定如何做。“如何做”是微架构的领域——由晶体管、流水线、缓存和预测器组成的错综复杂的网络，它们将 ISA 变为现实。但这种抽象是双向的。正如 ISA 塑造编译器一样，高性能微架构的需求也塑造了 ISA。

对于现代深度流水线处理器来说，最大的难题之一是条件分支——即简单的 if 语句。流水线就像一条装配线；为了保持其满负荷高速运转，处理器必须在分支实际被解析之前很久就猜测它会走向哪条路。如果猜错了，整个流水线必须被清空并重启，浪费几十个周期。为了解决这个问题，一些 ISA 引入了一种名为谓词执行（predication）的特性。它不是用一条分支指令说“如果这个条件为真，就跳转到一个新位置”，而是允许你用一个条件来“标记”普通指令。像 ADD_IF_TRUE r1, r2, r3 这样的指令只有在指定条件为真时才会执行其加法操作；否则，它什么也不做，变成一个无害的 no-op。编译器可以利用这一点完全消除小型 if-else 块的分支。它将一个控制流问题转化为一个数据流问题，使得装配线能够平稳运行，而没有潜在错误预测带来的中断和重启。这是一个 ISA 为与微架构合作而演进的美丽例子，它减轻了分支预测器的压力，并平滑了执行流。

ISA 对硬件的影响甚至更深。古老的 RISC 与 CISC 之争对芯片的物理设计产生了非常实际的后果。RISC ISA 使用定长指令（例如，每条指令恰好是 4 字节）。CISC ISA 使用变长指令。这个看似简单的选择会产生巨大的连锁反应。对于 RISC 机器，处理器前端（从内存中获取指令）的工作很简单：它只需抓取 4 字节的数据块。但在 CISC 机器上，解码器面临一个难题：一条指令在哪里结束，下一条又从哪里开始？这给硬件增加了显著的复杂性。当涉及到像踪迹缓存（trace cache）这样的高级性能特性时，这种差异变得至关重要。踪迹缓存是一种特殊的缓存，用于存储已解码的指令序列。对于 CISC ISA，踪迹缓存必须存储额外的元数据来记录指令边界的位置，而 RISC ISA 则完全避免了这种复杂性。当我们添加像 SIMD（单指令，多数据）这样的现代特性以实现并行计算时，这种复杂性仍在继续。定长或变长编码方案的选择直接影响了取指和解码带宽，在 RISC 和 CISC 设计扩展以解决现代问题时，为它们制造了不同的性能瓶颈。

系统的基石：作为社会契约的 ISA

当你打开电脑时，你见证了一个小小的奇迹。从一片漆黑的状态中，一个复杂的操作系统（OS）焕发生机。这个过程不是魔法；它是一个精心编排的序列，始于 ISA。ISA 规范是操作系统和固件开发者所依赖的基石合约。它保证在复位的那一刻，处理器会以一个特定的、已知的状态苏醒：处于特定的特权级别，内存管理被关闭，程序计数器指向内存中一个预定义的物理地址。

这个“复位向量”是所有软件的起点。它是机器将要运行的第一行代码所存储的地址。有趣的是，这个合约在不同架构之间有所不同。出于历史原因，x86 处理器在 16 位的“实模式”下唤醒，并从前 4GB 内存顶部附近的一个地址获取其第一条指令。相比之下，RISC-V 处理器在其最高权限的“机器模式”下，在一个由实现定义的地址唤醒，其虚拟内存系统被明确禁用。ARM 处理器则在其已实现的最高异常级别唤醒，这可能是几种可能性之一。对于任何编写操作系统或底层固件的人来说，这些架构保证不是琐碎的知识；它们是构建整个系统软件大厦所依赖的不可变初始条件。

迎接现代世界：人工智能与安全时代的 ISA

计算的世界并非一成不变。新的工作负载和新的威胁迫使 ISA 不断演进。当今最强大的两个推动力是人工智能的兴起和网络安全这一永恒的挑战。

现代神经网络推理本质上是大量的矩阵乘法和其他数学运算，逐层处理。这种数据流完美地映射到我们这个时代主流的 ISA 范式：加载-存储架构。在这种模型中，数据被显式地从内存加载到一个大的寄存器堆中，所有算术运算都在这些寄存器中的数据上执行，结果再被显式地存回内存。这个大型、可随机访问的寄存器文件为编译器提供了巨大的灵活性来调度操作，并将中间结果（如一个神经网络层的输出）保存在快速寄存器中，以便立即被下一层使用。这与一个更古老的思想——堆栈 ISA——形成了鲜明对比，后者的操作隐式地使用一个后进先出的堆栈。堆栈僵化的 LIFO 特性使得编排 AI 复杂的数据重用模式变得非常困难，导致了向内存推入和弹出值的瓶颈。加载-存储 ISA 配合强大的向量（SIMD）能力的统治地位，是我们当前硬件在 AI 工作负载上如此高效的一个关键原因。

与此同时，ISA 也已成为计算机安全领域的一个关键战场。ISA 承诺的是一个抽象的功能行为，但底层的微架构可能会泄露信息。一个臭名昭著的例子是缓存时序侧信道攻击。像 AES 这样的加密算法的软件实现可能会使用查找表。访问这个表涉及一次内存加载。如果内存位置已经在处理器的快速缓存中（“命中”），加载就很快。如果它在慢速主内存中（“未命中”），加载就很慢。如果表索引依赖于一个秘密密钥，攻击者就可以精确测量这些微小的时间差异来逆向工程出密钥！这是一种“抽象泄漏”——缓存的实现细节通过 ISA 的抽象层泄露了出来。为了对抗这种情况，现代 ISA 引入了专门的指令，如 Intel 的 AES-NI。这些指令在一个单一的、原子的硬件步骤中完成一整轮 AES 加密。指令的时序被设计成与数据无关，从而有效地创建了一个“恒定时间”操作，为密码学提供了一个“隔音室”，堵住了时序泄漏。像这样的特性，以及其他控制推测性执行的栅栏指令，表明 ISA 正在从纯粹的性能合约演变为安全合约。

尾声：迈向量子及更远

ISA 的原则是如此基础和强大，以至于即使我们展望计算的未来，它们仍在指导我们的思维。想象一个未来，我们的经典处理器被一个量子协处理器所增强。我们将如何与这样的设备对话？多个程序将如何安全地共享它？我们需要为它定义一个 ISA。

我们可以想象一套新的指令或“量子操作（q-ops）”：一个用于分配量子比特，一个用于应用量子门，一个用于测量结果。这个量子 ISA 需要是抽象的，隐藏特定量子设备奇异而复杂的物理原理。在这个 ISA 之下，会有一个操作系统和设备驱动程序，负责将这些抽象的量子操作转换成实际的微波脉冲，管理有限的物理量子比特池，并使用像 IOMMU 这样的硬件来确保一个进程的量子实验不会破坏另一个进程的内存。在 ISA 之上，会有一个用户空间库和编译器，将物理学家的高级量子算法翻译成新的指令。现代计算机系统优美的分层结构——ISA、操作系统、驱动程序、运行时——是管理复杂性的通用模式。它告诉我们，无论我们未来的计算机变得多么奇特和美妙，定义清晰接口、分离关注点和构建抽象层的核心思想，仍将是驾驭其力量的关键。ISA 不仅仅是当今计算机的语言；它是计算本身的语言。