try ai
科普
编辑
分享
反馈
  • 数字:数字表示法的艺术与科学

数字:数字表示法的艺术与科学

SciencePedia玻尔百科
核心要点
  • 补码表示法是现代计算机的标准,因为它能唯一地表示零,并通过将减法转化为加法来简化硬件。
  • 定点表示法通过使用一个隐式约定的二进制小数点位置,使得在简单的整数硬件上能够高效地进行小数运算。
  • 数字表示法的选择具有切实的现实影响,会影响系统性能、功耗,甚至数字信号处理等应用中的细微行为。

引言

在每一台数字设备的核心,从最简单的计算器到最强大的超级计算机,都潜藏着一个根本性的挑战:如何用一种只懂“开”和“关”这两个词的语言来表示广阔的数字世界。这种二进制的限制迫使工程师和计算机科学家们发挥非凡的创造力,尤其是在处理负值和分数等概念时。虽然直接的方法看似合乎逻辑,但它往往导致硬件复杂且低效,这个问题困扰着早期计算。本文旨在探讨这个问题的核心,探索那些已成为现代技术基石的优雅解决方案。它将引导您了解计算机数字表示法的原理和机制,揭示为何补码系统是一项天才之举,它简化了计算的根本结构。随后,我们将深入探讨其深远的应用和跨学科联系,展示这些基础性选择如何影响从处理速度、功耗到复杂系统行为的方方面面。准备好,来揭示驱动我们数字世界的 0 和 1 背后隐藏的艺术与科学吧。

原理与机制

想象你自己是一台计算机。你的大脑,即处理器,是一个简洁的奇迹。它只能看到两种东西:导通的电流和截止的电流。我们称之为 1 和 0。你的整个思想世界——从计算航天器的轨迹到渲染一幅美丽的艺术作品——都必须由这两个符号构建而成。你面临的第一个、也是最根本的挑战是计数。对于正数来说,这相当容易:1 是 1,2 是 10,3 是 11,4 是 100,依此类推。但负数呢?在一个基本上只有“开”或“关”的世界里,你如何表示“小于无”的概念?

挑战:一个充满正负的世界

最直接的想法,也就是可能最先跳入你脑海的想法,就是我们所说的​​原码​​(sign-magnitude)表示法。这与我们在纸上写数字的方式完全一样。我们用一个位——比如说最左边的一位——作为符号标志:0 代表正数,1 代表负数。其余的位表示数值的大小,即绝对值。因此,在一个 8 位世界里,+5 就是 00000101,而 -5 则是 10000101。很简单,对吧?

但这种简单是具有欺骗性的。它带来了一个奇特的麻烦:我们现在有两种方式来表示零。00000000 是 +0,而 10000000 是 -0。对于一台依赖逻辑和一致性的计算机来说,同一个值有两种表示是冗余且混乱的。更糟糕的是,执行算术运算变得非常繁琐。为了将两个数相加,计算机首先要检查它们的符号。如果符号相同,它就将数值部分相加。如果符号不同,它必须用较大的数值减去较小的数值,然后确定结果的正确符号。这需要复杂的硬件:比较器、减法器和额外的逻辑电路。这并不优雅。自然偏爱效率,好的工程设计也是如此。一定有更好的方法。

天才之举:补码

我们故事的主角登场了:​​补码​​(two's complement)表示法。几乎每一台现代计算机都使用这个系统,其原因非常充分。这是一个巧妙、近乎神奇的解决方案,它消除了两个零的问题,并且正如我们将看到的,它极大地简化了算术运算。

那么,它是如何工作的呢?对于正数,它和以往一样:在一个 8 位系统中,+27 就是 00011011。但对于负数,我们遵循一个听起来很奇怪的步骤:要得到一个负数(比如 -71)的表示,我们首先写下它的正数形式 +71(01000111),然后我们​​将每一位都取反​​(10111000),最后,我们​​再加一​​(10111001)。这最后的模式 10111001,就是计算机看待 -71 的方式。最左边的位仍然充当符号位(1 代表负数),但它不再仅仅是一个标志;它是数值不可或缺的一部分,带有一个负的权重。

这个系统为我们提供了一个固定且明确的数字表示范围。对于一个 NNN 位系统,其范围并非对称。它从 −2N−1-2^{N-1}−2N−1 一直延伸到 2N−1−12^{N-1}-12N−1−1。对于一个 8 位系统,这意味着我们可以表示从 −128-128−128 到 +127+127+127 之间的每一个整数。请注意,负数的数量比正数多一个!这是因为只有一个零(00000000)。“最小的负数”值,即 −128-128−128,由 10000000 表示,而“最大的负数”值(最接近零的负数),即 -1,由 11111111 表示。这种唯一、连续的范围对于机器处理来说远为优雅。

魔术戏法:减法如何变为加法

现在来看看补码真正的美妙之处,那个能让任何物理学家或工程师会心一笑的“啊哈!”时刻。通过这个系统,​​减法被转化为了加法​​。

假设我们想在一个简单的 5 位处理器中计算 9−149 - 149−14。处理器不会去构建一个专门的减法电路,而是做了一些巧妙的事情。它先求出 141414 的补码来得到 −14-14−14 的表示,然后将这个数与 999 相加。

  • X=9X=9X=9 在 5 位中是 01001。
  • Y=14Y=14Y=14 在 5 位中是 01110。
  • YYY 的补码(得到 −14-14−14)是 invert(01110) + 1,即 10001 + 1 = 10010。
  • 现在,我们只需相加:01001 (+9+9+9) + 10010 (−14-14−14) = 11011。

结果是 11011。这是什么数字呢?由于最高位是 1,它是一个负数。为了找出它的绝对值,我们可以反向应用规则:取反(00100)再加一(00101),得到 5。所以,结果是 −5-5−5。确实,9−14=−59 - 14 = -59−14=−5。完美成功!

这为什么能行得通?秘密在于模运算,这是你看时钟时每天都在使用的概念。如果现在是 9 点,你想知道 4 小时前是几点,你可以减去 4 得到 5 点。或者,你可以加上 8 小时(12−412 - 412−4)得到 17 点,在 12 小时制的时钟上也就是 5 点。你是在“模 12”下工作。

一台有 nnn 位的计算机在“模 2n2^n2n”下工作。当我们把两个 nnn 位数相加时,从最高位产生的任何进位都会被简单地丢弃。这在数学上等同于对结果取模 2n2^n2n。一个数 BBB 的补码只是一种书写值 2n−B2^n - B2n−B 的巧妙方式。所以,当计算机计算 A−BA - BA−B 时,它实际上计算的是 A+(2n−B)A + (2^n - B)A+(2n−B)。因为机器在模 2n2^n2n 下工作,2n2^n2n 这一项就消失了,只剩下 A−BA - BA−B。通过这一优美的数学特性,一个单一、简单的无符号加法器电路,无需任何额外逻辑,就能同时处理有符号数的加法和减法。这是一个深刻的例子,说明了巧妙的表示法选择如何极大地简化硬件。

位移的优雅

这种简单操作产生强大结果的主题仍在继续。计算机能执行的最快操作之一是​​位移​​,也就是将寄存器中的所有位向左或向右移动一个位置。在补码的世界里,这个简单的动作等同于乘以或除以二。

​​逻辑左移​​将所有位向左移动,并在右侧的空位填充一个 0。对于数字 −10-10−10(在 8 位中为 11110110),一次左移得到 11101100,这是 −20-20−20 的表示。它有效!这提供了一个极快的“乘以二”指令。但这里有一个陷阱:这个技巧只有在结果保持在可表示范围内时才有效。如果我们对 −96-96−96(10100000)尝试这个操作,一次左移会得到 01000000,也就是 +64+64+64。正确答案 −192-192−192 太小,无法用 8 位表示。这被称为​​算术溢出​​,是程序员必须始终尊重的一个关键边界条件。

为了实现除以二,我们需要​​算术右移​​。这个操作将所有位向右移动,但它不是在最左边的空位填充一个 0,而是复制原始的符号位。这保留了数字的符号。如果我们取 −25-25−25(11100111)并进行一次算术右移,我们得到 11110011,这是 −13-13−13 的表示。这是 −25/2-25 / 2−25/2 的正确整数结果,结果是向负无穷舍入的(⌊−12.5⌋=−13\lfloor -12.5 \rfloor = -13⌊−12.5⌋=−13)。

但请注意:我们为加法找到的美妙简洁性并不能延伸到所有操作。如果你试图用一个为无符号数设计的简单电路来计算 −1×−1-1 \times -1−1×−1,你会得到错误的答案。无符号乘法器会将 −1-1−1 的位模式(在 4 位中为 1111)解释为数字 15。因此它会计算 15×15=22515 \times 15 = 22515×15=225,而不是 +1+1+1。原因在于,补码中的符号位带有一个负权重(例如,在一个 4 位系统中是 −23-2^3−23),而一个无符号乘法器完全忽略了这个细微差别。这给我们一个重要的教训:游戏规则至关重要。

超越整数:想象中的小数点

到目前为止,我们只处理了整数。但现实世界充满了分数。我们如何表示像 −5.25-5.25−5.25 这样的值呢?一种方法是使用​​定点表示法​​。这并非一种新的数字类型,而是一种解释相同比特的新方式。我们只需约定,一个想象中的“二进制小数点”存在于我们比特串的某个固定位置。

例如,在一个 8 位 Q4.4 格式中,我们约定最左边的 4 位表示整数部分(第一位是符号位),最右边的 4 位表示小数部分。要编码 −5.25-5.25−5.25,我们实际上是将其放大 24=162^4 = 1624=16 倍得到一个整数 −84-84−84,然后找出它的 8 位补码,即 10101100。硬件并未改变;它仍然只是一个 8 位寄存器。其值并不在于比特本身,而在于我们对二进制小数点位置的共同约定。

这揭示了一个深刻的真理:一串比特本身没有内在含义。8 位模式 11111111 在一个标准有符号整数系统中表示整数 −1-1−1。但如果一个软件错误意外地将此模式送入一个期望 Q1.7 定点数(1 个整数位,7 个小数位)的模块,该模块会将其解释为值 −1/27=−1/128=−0.0078125-1/2^7 = -1/128 = -0.0078125−1/27=−1/128=−0.0078125。比特是相同的;解释决定了一切。

比特的物理现实

这把我们带到了最后一点。数字表示法的选择不仅仅是一个抽象的数学练习。它具有真实、有形、物理的后果。考虑一个移动设备中的 4 位总线,它快速地将一连串数字从处理器发送到内存。每当一根导线上的比特从 0 翻转到 1 或从 1 翻转到 0 时,都必须移动微量的电荷,消耗微量的电能。

让我们想象发送一串像 +3, -3, +2, -2, ... 这样的数字流。

  • 在原码中,从 +3(0011)到 -3(1011)只需要翻转一个比特(符号位)。
  • 在补码中,从 +3(0011)到 -3(1101)需要翻转三个比特。

在成千上万次这样的操作中,补码系统——尽管其算术上非常优雅——可能会导致更多的比特变化,从而导致更高的功耗和更短的电池寿命。这是一个典型的工程权衡。对于计算来说数学上更优越的系统,对于数据传输来说可能不是最节能的。这是数字理论的抽象世界与能量和热量的物理世界之间一个美丽而出人意料的联系。我们选择书写数字的方式,直接影响着你手机电池的续航时间。

至此,我们穿越 0 和 1 世界的旅程,揭示了一片充满惊人美感和创造力的景象。从书写负数这个简单的挑战出发,我们发现了一个系统——补码——它不仅解决了问题,而且其优雅之处贯穿于计算机硬件的设计之中,将减法变为加法,将位移变为乘法。然而,我们也发现这些选择并非没有后果,它们将数学的空灵领域与功耗和能量的具体物理现实联系在一起。机器内部的世界与我们自己的世界并无太大不同:充满了创造性的解决方案、隐藏的简洁性和迷人的权衡。

应用与跨学科联系

既然我们已经探索了如何用比特构建数字的原理和机制,我们可能会感到某种满足感。我们已经窥探了数字世界的内部,看到了补码、定点和浮点算术的巧妙齿轮。但要真正欣赏这些思想的天才之处,我们必须看到它们在实际中的应用。了解规则是一回事;看到它们在技术的宏大舞台上上演则完全是另一回事。这正是我们旅程的下一站——从抽象的原理到塑造我们世界的具体应用,揭示这些数字系统作为现代计算无形建筑师的深刻且往往令人惊讶的方式。

我们将看到,选择一种数字表示法不仅仅是学术练习。它是一个具有深远影响的基础性设计决策,影响着从处理器的原始速度到复杂信号处理系统的细微行为的方方面面。

计算的基石:逻辑、算术与优雅

在最基本的层面上,计算机的处理器必须做两件事:存储数字和对它们进行算术运算。我们现代系统的优雅之处在于这两项任务如何巧妙地交织在一起。考虑一个简单的动作,比如在处理器寄存器中存储一个负数,如 -3。计算机没有一个特殊的符号来表示负号。相反,它使用一种巧妙的方案——补码——将符号直接编码到数字的二进制模式中。一个 4 位的 -3 表示变成了 1101,这并非出于某个随意的约定,而是因为这个特定的模式,当与 +3 的模式(0011)相加时,结果为零(忽略溢出),从而满足了加法逆元的数学定义。这个技巧将减法与加法统一起来,使得硬件设计者可以构建更简单、更快的电路。

这种优雅与节俭的主题是数字设计的一个标志。工程师们乐于寻找让一个组件完成多个任务的方法。想象你有一个“全减器”,一个计算 A−B−BinA - B - B_{in}A−B−Bin​ 的基本逻辑电路。你能用它来执行一个不同但相关的操作吗:求一个数 BBB 的补码?也就是说,一个减法器可以被配置成一个“取反器”吗?这似乎像一个谜题,但答案揭示了算术的深层结构。通过将主输入 AAA 设为 0,借位输入 BinB_{in}Bin​ 设为 0,该电路计算 0−B−00 - B - 00−B−0,这恰好就是 −B-B−B。同样的硬件,通过巧妙地固定其输入,执行了一个新的功能。这不是巧合;它反映了一个数学事实,即取反本质上就是从零开始的减法。数字设计的艺术就在于发现并利用这些优美的内部对称性。

接口的艺术:说不同的数字语言

没有哪个芯片是孤岛。在现实世界中,数字系统必须不断地与“遗留”硬件、外围设备以及不同尺寸和能力的组件进行通信。这通常需要翻译不同“方言”的二进制。例如,一些较旧的处理器使用一种称为反码的系统来表示负数。这个系统的一个关键特征是它对零有两种表示:一个“正零”(0000)和一个“负零”(1111)。要将这样一个老式设备与使用补码的现代处理器连接,就需要一个转换电路。

转换规则本身很简单:如果数字是负数,就在其位模式上加一。挑战和应用在于创建执行这种条件加法的物理逻辑电路。这个转换器体现了翻译者的角色,确保信息在从一个系统跨越到另一个系统时意义得以保留。

当一个数字从一个小寄存器移动到一个大寄存器时,比如从一个 3 位空间移动到一个 4 位空间,也需要类似的翻译。对于像 3(011)这样的正数,你可以简单地在前面填充一个前导零,得到 0011。但对于像 -3(在 3 位补码中为 101)这样的负数呢?如果你用零填充它(0101),你会得到正数 5!数值被破坏了。正确的程序,被称为​​符号扩展​​,是复制最高有效位(符号位)。因此,101 变成了 1101,这是 -3 的正确 4 位表示。这个简单的规则确保了数字的值在不同数据宽度之间得以保留。在硬件中,这可以通过多种方式实现,从专用逻辑电路到一个存储在可编程只读存储器(PROM)中的简单查找表,其中输入数字作为地址来查找其符号扩展后的版本。

超越整数:定点与高性能算术的世界

到目前为止,我们只谈论了整数。但现实世界充满了分数和测量值。一台只懂整数的机器如何处理像 4.1254.1254.125 这样的数字?其中一种最强大的技术是​​定点算术​​。这个想法非常简单:硬件操作的是整数,但设计者们约定了一个隐式的二进制小数点位置。一个数可能被存储为一个 8 位整数,但我们将其解释为有 4 个整数位和 4 个小数位(一种称为 Q4.4Q4.4Q4.4 的格式)。

当我们乘以两个定点数时,比如 Qm1.n1Qm_1.n_1Qm1​.n1​ 格式的 AAA 和 Qm2.n2Qm_2.n_2Qm2​.n2​ 格式的 BBB,我们可以简单地将它们底层的整数表示相乘。关键部分是知道二进制小数点在结果中的位置。规则是,乘积将有 m1+m2m_1+m_2m1​+m2​ 个整数位和 n1+n2n_1+n_2n1​+n2​ 个小数位。这个简单的原理允许工程师在简单的整数硬件上执行高速小数运算,这是一种在数字信号处理(DSP)、图形学和嵌入式系统中至关重要的技术,因为在这些领域性能和效率至高无上。

在这些高性能领域,每一个时钟周期都至关重要。标准的乘法,本质上是一系列的移位和加法,可能太慢了。这种对速度的需求催生了更高级的数字表示方法以用于特定操作。​​Booth 算法​​就是一个典型的例子。它不把乘数看作一串 0 和 1,而是将其重新编码成一个新的字母表:{−1,0,+1}\{-1, 0, +1\}{−1,0,+1}。例如,数字 7,在二进制中是 0111,可以被看作是 +8-1。这种重新编码使得乘法器可以跳过长串的 1,用一次减法代替多次加法,从而显著加速计算。这是一个完美的例证,说明表示法的改变如何直接带来性能的提升。同样的原理也适用于更复杂的操作,如除法,其中在核心算法开始之前,通过位移对齐被除数和除数的定点格式是一个关键的预处理步骤。

机器中的幽灵:高级系统中的微妙效应

我们现在来到了地图的边缘,在这里,数字表示法的选择会对系统行为的最高层次产生影响,有时其方式是极其不明显的。这些就是“机器中的幽灵”。

考虑​​移码​​(或偏置表示法),其中一个值 VVV 被存储为 V+kV+kV+k 的位模式。这个系统通常不用于通用算术,但它是表示浮点数中指数的标准。为什么?因为它使比较变得微不足道:要看一个指数是否大于另一个,你只需将它们的位模式当作简单的无符号整数来比较。但是,如果你需要使用为补码构建的标准处理器对这些数进行算术运算怎么办?你需要一整套新的电路吗?

答案出人意料地是“不”。通过一些数学上的巧妙处理,你可以让一个标准的加法器/减法器处理偏置数。事实证明,要计算两个 Excess-2N−12^{N-1}2N−1 数的差,你可以,例如,直接输入第一个数,但输入第二个数时将其最高有效位(MSB)反转。然后,标准减法器就会神奇地以所需偏置格式输出正确的结果。这是可行的,因为在模运算的有限精度世界里,反转最高有效位在数学上等同于加上或减去偏置值。这是不同数字系统之间深层统一性的一个惊人例子。

这些低层选择最迷人的表现或许出现在​​数字信号处理​​领域。想象一个数字滤波器,比如音乐处理器中的回声效果。当输入信号停止时,你期望回声会逐渐消失至完全静默。然而,由于用于存储信号的数字精度有限,滤波器的内部状态可能会“卡”在一个小循环中,产生微小、持续的嗡嗡声或振荡,而不是稳定到零。这种现象被称为​​零输入极限环​​。

真正令人匪夷所思的是,这种不希望出现的行为的确切性质直接取决于硬件设计者选择的数字表示法!如果系统使用原码表示法,其中舍入通过简单地截断数值(称为“向零截断”)来进行,那么被量化为零的值的范围在零周围形成一个对称的“死区”。但如果系统使用更常见的补码表示法,其中截断是向负无穷舍入,死区就会变得不对称。这种在比特层面上的细微差异改变了量化误差的动态特性,导致了具有不同可闻特征的不同类型的极限环。一个关于如何在硬件中表示负号的决定,对一个复杂系统的音频输出产生了直接、可观察的影响——这有力而深刻地提醒我们科学与工程之间是相互关联的。

从逻辑门的核心到数字回声的空灵之声,数字表示法的原理是那无声、无处不在的基石。它们不仅仅是约定俗成,而是一种丰富的语言,一旦掌握,就能让我们构建出我们所居住的这个复杂、强大而美丽的数字宇宙。