首页全局偏移表 (GOT)

全局偏移表 (GOT)

玻尔百科

定义

全局偏移表 (GOT) 是可执行文件和共享库用于在运行时管理外部函数及变量地址的一种数据结构。它是实现位置无关代码（PIC）的核心机制，确保程序能在开启地址空间布局随机化（ASLR）的环境中正确运行。通过与过程链接表（PLT）配合，全局偏移表 (GOT) 支持延迟绑定技术以加快程序启动速度，但其可写性也引入了需要通过 RELRO 等安全特性进行防护的漏洞风险。

核心要点

全局偏移表 (GOT) 是一种数据结构，由可执行文件和共享库用于在运行时管理外部函数和变量的地址。
它是使位置无关代码 (PIC) 能够在地址空间布局随机化 (ASLR) 环境下与共享库正常工作的核心机制。
GOT 与过程链接表 (PLT) 协同工作，实现了“延迟绑定”这一优化策略。该策略将函数地址的解析推迟至其首次被调用时，从而加快程序启动速度。
延迟绑定期间 GOT 的可写性带来了一种名为“GOT 投毒”的安全漏洞，该漏洞可通过 Full RELRO 等安全特性加以缓解。
GOT 的间接寻址带来了性能开销，这在代码灵活性、启动速度和运行时安全之间构成了一项根本性的权衡。

引言

在现代软件开发中，效率与安全至关重要。效率的一大基石是共享库的使用，它允许多个程序共享同一份通用代码的副本，从而节省大量内存。然而，这种做法与一项关键的安全特性——地址空间布局随机化 (ASLR)——产生了根本性的冲突。ASLR 会在每次运行时打乱内存布局，以挫败攻击。那么，如果像 printf 这样的函数的地址 sürekli 变化，程序又该如何可靠地调用它呢？这正是创建位置无关代码 (PIC) 的核心难题。

本文将揭开这一难题的优雅解决方案：全局偏移表 (GOT)。我们将探讨该机制如何成为当代操作系统中动态链接的关键。首先，在“原理与机制”部分，我们将剖析 GOT 如何与 PC 相对寻址及过程链接表 (PLT) 一道，在运行时解析外部函数地址。接着，在“应用与跨学科关联”部分，我们将审视这一设计对性能、系统安全、调试乃至编译器和处理器架构设计所产生的深远影响。读完本文，您将认识到 GOT 并非一个孤立的技术细节，而是硬件与软件设计的一个关键交汇点。

原理与机制

在探索计算机如何运行我们程序的旅程中，我们常常会遇到一些不仅实用，而且设计上堪称优雅的机制。全局偏移表（Global Offset Table），简称 GOT，便是这样一项工程杰作。它不仅仅是一个技术细节，更是对一系列深刻而富有挑战性的难题的精妙解答——这些难题源于我们构建高效、安全、灵活软件的渴望。让我们从第一性原理出发，逐层揭开它的工作方式。

随机世界中的共享代码之谜

想象一下，你正在建造一座城市。每栋房子都需要管道系统。你会为每一栋房子都设计和建造一套独特的管道吗？当然不会。你会设计一套标准管道并集中生产，从而节省巨大的精力。在软件世界里，像 printf（用于打印文本）或 malloc（用于分配内存）这样的函数就是标准管道。如果计算机上的每个应用程序都内嵌一份这些通用函数的私有副本，那将是极大的浪费。

显而易见的解决方案是共享库。我们将标准“管道”函数（如 C 标准库 libc）的一份副本放在磁盘和内存中，每个运行中的程序或进程都可以使用它。这节省了磁盘空间，更重要的是，节省了宝贵的内存。

但这个简单的想法立刻带来了一个深刻的问题。当你的程序想要调用 printf 函数时，机器码中的 call 指令需要知道 printf 的内存地址。但它在哪里呢？在现代操作系统中，为了安全，程序和库在内存中的位置每次运行时都会改变。这是一种名为地址空间布局随机化 (ASLR) 的关键防御机制。你的程序今天可能被加载到地址 0x10000，明天可能在 0x50000。包含 printf 的共享库这一刻可能在 0x80000，下一刻又可能在 0x9A000。

如果 printf 的地址被硬编码到你的程序的机器指令中，那么它只在一种不可预测的内存布局下是正确的。在任何其他布局中，call 指令都会跳转到错误的地方，导致程序崩溃。我们如何编写无论自身或其依赖项在内存中位于何处都能正确工作的代码呢？这便是创建位置无关代码 (PIC) 的根本挑战。

正确方向上的一步：相对寻址的力量

如果你不知道自己在宇宙中的绝对地址，你仍然可以给出相对于当前位置的方位。“向北走三个街区，再向东走一个街区。”同样的原则也适用于代码。如果一条指令不说 call 0x80000，而是说 从这里向前调用 500 字节，会怎么样？

这正是程序计数器相对 (PC 相对) 寻址所允许的。程序计数器 (PC)，也称为指令指针 (IP)，是 CPU 中的一个寄存器，始终保存着下一条待执行指令的地址。PC 相对指令编码了一个位移或偏移量，CPU 通过将该位移加到当前 PC 值上来计算目标地址。在流行的 x86-64 架构上，这通常被称为 RIP 相对寻址。

这对于同一个库内的引用来说，是一个绝妙的技巧。假设你的库有两个函数，foo 和 bar。在链接时，工具链知道 bar 在 foo 之后，比如说 500 字节处。因此，从 foo 到 bar 的调用可以编码为一个 +500 的位移。现在，让我们看看在运行时，当 ASLR 将库放置在一个随机的基地址 $B$ 时会发生什么。foo 的地址变为 $B + \text{offset}_{foo}$ ，bar 的地址变为 $B + \text{offset}_{bar}$ 。它们之间的距离是 $(B + \text{offset}_{bar}) - (B + \text{offset}_{foo}) = \text{offset}_{bar} - \text_offset}_{foo}$ 。基地址 $B$ 神奇地抵消了！相对距离是恒定的。

这个见解是革命性的。它意味着共享库的代码段（或 .text 段）在运行时无需修改。它可以被加载到内存中一次，并由数十个甚至数百个进程共享，从而极大地节省内存。此外，由于代码页不需要写入，它们可以被标记为只读和可执行，但不可写。这符合一项名为W^X (写入异或执行) 的关键安全策略，有助于防止某些类型的攻击。

缺失的一环：路标之表

但是 PC 相对寻址只解决了谜题的一半。它适用于库内部的调用，但最初的问题——调用像 printf 这样的外部函数——又该如何解决？包含 printf 的共享库是一个完全独立的模块，加载在它自己独立的随机地址上。我们的代码和 printf 之间的相对距离不是固定的，它随每次执行而变化。

我们需要一层间接寻址。想象一下，你想给你一个经常旅行的朋友寄信。你不能在信封上写下他当前的酒店地址，因为信寄到时地址就变了。相反，你把信寄到他的永久邮箱地址，并相信他会及时更新那里的转寄信息。

在动态链接的世界里，这个“邮箱”就是全局偏移表 (GOT)。GOT 是一个位于我们自己库的可写数据段内的小型、私有的地址表。对于我们的代码引用的每一个外部符号，GOT 中都有一个专属的槽位。

新的策略是一支双人舞：

当我们的代码想要调用 printf 时，它不再试图直接跳转到 printf 的地址。相反，它使用一条 PC 相对指令来访问其自身 GOT 中的一个条目。由于 GOT 和代码同属一个库，它们之间的相对距离是固定的，并且在链接时已知。
这个 GOT 条目保存着 printf 的真实、最新的绝对地址。CPU 从 GOT 中加载这个地址，然后跳转到它。

但是，是谁最先把正确的地址写入 GOT 的呢？这就是动态加载器（在 Linux 上是 ld.so）的工作。当你的程序启动时，加载器会将所有必需的库映射到内存中。它会算出所有东西的位置。例如，它发现 printf 在地址 0x9A000。然后它会遍历你的库的 GOT，找到为 printf 保留的槽位，并将值 0x9A000 写入该内存位置。这个过程称为重定位。

这个设计非常优雅。代码段保持纯净、位置无关且高度可共享。所有混乱的、依赖于位置的绝对地址都被整齐地隔离在一个小型的私有数据表中。当动态加载器通过写入 GOT 来执行重定位时，操作系统的写时复制 (COW) 机制确保每个进程都获得其自己私有的、被修改过的 GOT 内存页副本，而广大的、未修改的代码页则保持共享。

延迟的艺术：性能与风险

故事还未结束。我们可以让系统变得更加巧妙。一个大型应用程序可能会引用共享库中的数千个函数，但在一次典型的运行中可能只使用少数几个。在启动时解析每一个符号的地址（一种称为立即绑定的策略）可能会明显拖慢程序的启动速度。

为了解决这个问题，系统设计者发明了延迟绑定。其思想非常简单：直到一个函数第一次被调用时，才去解析它的地址。这是由另一个名为过程链接表 (PLT) 的小型可执行代码存根表来协调完成的。

延迟绑定是这样工作的：

初始状态：启动时，动态加载器不会将 printf 的真实地址放入 GOT。相反，PLT 和 GOT 被以一种特殊的方式设置。从你的代码调用 printf 首先会跳转到 PLT 中的一个短存根。这个存根接着跳转到存储在 printf 的 GOT 条目中的地址。最初，该条目指向动态加载器自身的一个特殊辅助函数，称为解析器。
首次调用：当你的程序第一次调用 printf 时，它在不知不觉中被重定向到了解析器。解析器立即行动：它识别出请求的函数是 printf，找到其真实的内存地址，然后——这是关键的一步——修补 GOT。它用 printf 的真实地址覆盖掉 printf GOT 条目中自己的地址。最后，它跳转到 printf，你的程序继续执行，对此毫无察觉。
后续调用：下一次你的程序调用 printf 时，它会沿着同样的路径到达 PLT，然后到 GOT。但现在，GOT 条目包含了 printf 的真实地址。调用会直接进行到 printf，完全绕过了解析器。

解析的开销只在第一次使用时支付一次。这是一个经典的权衡，优化了常见情况，并改善了应用程序的启动时间。

然而，这种巧妙的设计也引入了安全风险。延迟绑定要求 GOT 在程序执行期间是可写的。如果攻击者能在你的程序中找到任何内存损坏漏洞，他们或许就能覆写 GOT 中的一个条目。想象一下，他们将 printf 的地址替换成他们自己恶意代码的地址。这就是GOT 投毒。下一次程序无辜地调用 printf 时，就会执行攻击者的载荷，从而让他们获得控制权。

这在性能和安全之间造成了紧张关系。作为回应，现代系统引入了像完全只读重定位 (Full RELRO) 这样的缓解措施。启用此功能后，它会指示动态加载器放弃延迟绑定，在启动时立即解析所有符号，然后在程序主代码运行之前，使用操作系统将整个 GOT 标记为只读。这关闭了 GOT 投毒的攻击途径，以牺牲一点启动性能为代价，换取了安全性的显著提升。

因此，全局偏移表不仅仅是一个数字表。它是一个复杂系统的关键所在，该系统平衡了内存效率、程序灵活性、启动性能和运行时安全等相互竞争的需求。它证明了计算机科学分层解决问题的本质，即每一个新的挑战都会催生一个更巧妙的解决方案。

应用与跨学科关联

在窥探了全局偏移表的内部工作原理之后，人们可能很容易将其归档为一种巧妙但晦涩的系统底层技术。然而，这样做将完全错失其要点。GOT 并非一个孤立的技巧，它是软件工程各大主干道的交汇点。它是一个优雅、甚至看似简单得令人迷惑的解决方案，其解决的问题是如此根本，以至于其影响几乎波及现代计算的每一个层面——从处理器的原始性能，到我们数据的安全性，再到我们在编程语言中表达思想的方式本身。理解 GOT 的应用，就是去欣赏硬件与软件之间、编译器与操作系统之间那场错综复杂的舞蹈，正是这场舞蹈使我们动态的数字世界成为可能。

链接器的舞蹈：为代码注入生命

在任何程序运行之前，一场无声、无形的芭蕾便已上演。想象一个共享库是一部戏剧的剧本，充满了诸如“爱丽丝上场”或“从鲍勃那里拿信”之类的抽象指令。在帷幕拉开之前，一个舞台工作人员——动态加载器——必须将此翻译成舞台上的具体方案。爱丽丝究竟站在哪里？哪个道具是那封信？全局偏移表就是舞台监督的总提示单。

编译器和链接器准备了一份重定位条目列表，这是给加载器的明确指令。对于代码或数据中每一个需要真实运行时地址的地方，都会创建一个重定位条目。当你启动一个程序时，加载器会读取这个列表。对于 R_x86_64_RELATIVE 类型的重定位，它会根据库被加载到内存的位置计算一个地址。对于 R_x86_64_GLOB_DAT 或 R_x86_64_JUMP_SLOT 类型的重定位，它会找到一个符号（函数或变量）的真实地址，并将该地址写入 GOT 中相应的槽位。这个一丝不苟的过程，通常遵循严格的多阶段顺序以确保正确性，将一个静态、通用的文件转变为一个运行中进程的活生生的组件，其指针现在指向了内存中的正确位置。 GOT 正是符号的抽象世界与内存地址的具体现实相遇的地方。

对话的成本：动态世界中的性能

这种灵活性并非没有代价。GOT 核心的间接寻址引入了性能成本，这是对每次访问征收的一笔微小的税。当位置无关代码需要读取一个全局变量时，它不能直接访问其地址。相反，它必须首先查询 GOT 以找出该变量的位置。这意味着一次额外的内存访问：首先从 GOT 读取地址，然后从该地址读取数据。这就像熟记朋友的地址与每次拜访前都必须在共享地址簿中查找的区别一样。

对于函数调用，情况则更为微妙。过程链接表 (PLT) 与 GOT 携手合作，实现了一种名为延迟绑定的巧妙优化。系统不是在程序启动时就解析每一个函数地址——这可能是一个缓慢的过程——而是等到函数第一次被实际调用时才做。这加快了应用程序的启动速度，但对任何函数的第一次调用都要支付一次性通过解析器的开销。后续的调用速度更快，但仍然需要经过 PLT/GOT 机制。

这产生了一个有趣的权衡。是一次性支付巨大的前期成本好，还是每次调用都支付较小的成本好？对于有许多循环调用外部函数的程序，PLT 累积的开销可能相当可观。认识到这一点，现代编译器提供了诸如 -fno-plt 之类的选项来改变策略。编译器不再生成对 PLT 存根的轻量级调用，而是发出在调用点直接从 GOT 加载函数地址并跳转的代码。这可能会稍微增加代码大小，但通过减少一层分支，可以带来显著的性能提升，尤其是在高频循环中。

故事还未结束。编译器本身也变得越来越智能。通过链接时优化 (LTO)，编译器可以一次性分析整个库或程序。它可能会发现一个函数，虽然标记为全局可见，但实际上只在其自己的库内部使用。编译器于是可以悄悄地将其状态更改为“内部”，从而允许所有对它的调用都变为直接调用，完全绕过 PLT 和 GOT。类似地，如果它能证明一个导入的函数从未被实际调用，它就可以完全移除相应的 PLT 条目。这种“瘦身”减少了 GOT 和 PLT 的大小，并消除了间接寻址的开销，展示了编译器智能与链接机制之间的美妙协同。

机器中的幽灵：安全与调试

GOT 作为一个存放敏感地址的公共目录，是一把双刃剑。它既是防御的工具，也是攻击的地图。在系统安全领域，它的机制被巧妙地用于保护。防范缓冲区溢出攻击的一个主要防御措施是“栈金丝雀”，一个放置在栈上的秘密随机值。在函数返回之前，它会检查这个值是否被覆写。但是函数从哪里获取这个秘密值的主副本进行比对呢？在许多系统中，它通过引用一个全局变量 __stack_chk_guard 来获取。在位置无关的可执行文件中，访问这个变量自然要通过……全局偏移表。C 运行时在启动时初始化这个值，每个受保护的函数序言都通过 GOT 间接读取它。

当然，将你的安全卫士的钥匙地址放在一个公共目录里是有风险的。能够读取 GOT 的攻击者可以找到主金丝雀存储的位置。这导致了更巧妙的设计，例如将金丝雀存储在线程局部存储 (TLS) 中，通过特殊的寄存器相对指令访问。这种方法完全避免了通过 GOT 访问金丝雀，从而更有效地隐藏了秘密值，同时仍然依赖动态加载器和 C 运行时在主程序开始前正确设置它。

从另一个角度看，PLT 和 GOT 的有序结构对逆向工程师、调试人员和安全分析师来说简直是天赐之物。在分析一个未知的二进制文件时，直接调用一个像 0x400560 这样的地址可能看起来很晦涩。但是通过理解 PLT 的布局——了解它的基地址和每个条目的固定大小——分析师可以推断出这个调用是针对一个特定的 PLT 槽位。通过将这个槽位与相应的重定位条目进行交叉引用，他们可以揭示出被调用函数的符号名称，例如 printf。这将一个无意义的数字变成了一条关于程序行为的重要线索。GOT 和 PLT 就像一条面包屑小径，让人们能够解构即使是被剥离了符号信息的位置无关二进制文件的控制流。

机器的语言：编译器、ABI 与架构对话

也许 GOT 最深远的影响体现在它如何支持高级编程语言的特性，以及如何与处理器架构的设计相互作用。它是构建其他抽象层的基础构件。

考虑一下 C++ 或类似面向对象语言中的虚方法调用。这本身就是一种间接形式：程序从对象中读取一个指针（vtable 指针），然后从 vtable 中读取一个函数指针，最后调用它。当这个虚调用跨越共享库边界时会发生什么？系统只是将一种间接形式叠加在另一种之上。vtable 条目并不包含最终的函数地址；相反，它包含函数 PLT 存根的地址。因此，虚调用触发了一个级联：对象到 vtable 指针，vtable 到 PLT 存根，PLT 存根到 GOT 条目，最后 GOT 条目到目标函数。这是一个美丽而复杂的指针俄罗斯套娃，每一层都解决了动态派发问题的不同部分。对于闭包或 lambda 函数，也存在类似的故事，闭包的代码指针必须被间接调用，通常使用 PLT/GOT 来访问它需要的任何全局状态。

这种对位置无关性的持续需求塑造了现代处理器的设计本身。实现 GOT 机制的“最佳”方式是软件和硬件设计师之间持续对话的主题。像 IA-32 这样的旧架构缺乏强大的 PC 相对数据寻址能力，迫使编译器占用一个宝贵的通用寄存器来保存 GOT 的基地址，这是一个代价高昂的开销。相比之下，像 x86-64 这样的现代 64 位架构具有强大的 RIP 相对寻址功能，允许代码在不牺牲寄存器的情况下定位 GOT。这条指令是一项硬件天才之作：它让程序能够问：“数据相对于我现在的位置在哪里？” 这非常有效，以至于它也可以用于其他表；例如，switch 语句的跳转表可以实现为一个由相对于表自身基地址的 32 位偏移量组成的表，而该基地址在运行时使用一条 RIP 相对指令找到。这避免了重定位并保持了表的只读性，是比使用 GOT 进行纯粹局部跳转更优雅的解决方案。

不同的架构家族已经演化出自己独特的风格。x86-64 的 PLT 条目是紧凑的间接跳转，而像 AArch64 和 RISC-V 这样的架构则使用一系列指令先计算 GOT 条目的地址，然后再从中加载目标地址。一些 RISC 传统倾向于指定一个特定寄存器作为全局指针 (GP)，指向一个包括 GOT 在内的全局数据区域。这是一个应用二进制接口 (ABI) 的设计选择，它用一个通用寄存器换取了可能更高效的全局数据访问。没有唯一的“正确”答案；每一种都是对相同基本约束的不同解决方案，反映了其创造者独特的哲学。

归根结底，全局偏移表远不止是一个指针表。它是共享库的默默推动者，是动态链接的支点，是性能调优中的一个因素，是系统安全中的一个考量，也是我们最强大的编程抽象实现中的一个沉默伙伴。它证明了一个简单思想——间接寻址——解决复杂问题的力量，创造了一个若无此思想便不可能实现的、灵活而动态的软件世界。