首页静态CMOS逻辑

静态CMOS逻辑

玻尔百科

定义

静态CMOS逻辑是一种利用互补的NMOS和PMOS晶体管对来构建数字电路的设计方法，旨在实现全摆幅输出和接近零的静态功耗。该设计遵循对偶原理，即PMOS上拉网络在结构上是NMOS下拉网络的逻辑对偶。静态CMOS逻辑具有高噪声容限和主动再生特性，使其在大型集成系统中比传输门等替代方案更加可靠。

关键要点

静态CMOS逻辑使用互补的NMOS和PMOS晶体管对来构建高效的开关，其具有轨到轨输出和近乎为零的静态功耗。
复杂逻辑门的设计遵循对偶性原理，即上拉网络是下拉网络的结构和逻辑对偶。
NMOS晶体管中电子的更高迁移率使得NAND门在多输入逻辑中天生比NOR门更快且更受青睐。
静态CMOS门是主动再生的，提供高噪声容限和可靠性，使其比传输门等替代方案在大型系统中更为鲁棒。
静态CMOS的物理操作中，功耗与比特翻转相关，这产生了可被侧信道攻击利用的安全漏洞。

引言

在每一台现代设备的数字心脏中，数十亿个微型开关在 silent, perfect concert 中协同工作。主导这场复杂芭蕾舞的技术是静态CMOS逻辑。它的发明不仅仅是一次渐进式的改进，而是一次革命性的飞跃，解决了创造不仅快速可靠，而且功耗惊人地高效的逻辑门这一关键工程挑战。这种高效正是移动计算革命得以建立的基石。本文旨在探讨这一基础技术的优雅原理和深远应用。

旅程始于“原理与机制”部分，在这里我们将揭示构成近乎完美开关的互补晶体管这一简单而 brilliant 的概念。我们将探索对偶性的优美对称性，它使工程师能够异常轻松地设计复杂的逻辑功能，并理解决定门速度的物理现实。随后，“应用与跨学科联系”一章将展示如何将这些基本门组装起来，创造出计算的两大支柱——算术和存储，并探究为何静态CMOS是鲁棒系统设计的首选。我们还将发现这些电路的物理特性如何延伸至意想不到的网络安全领域，揭示了从晶体管到系统层面数字设计的深层统一性。

原理与机制

在从您的智能手机到模拟我们气候的超级计算机等每一个数字奇迹的核心，都存在一个开关。这不是您可以用手指拨动的机械开关，而是一种微观、无声且速度惊人的开关：晶体管。静态CMOS逻辑是将这些开关排列成能够思考——即能够执行逻辑运算——的家族的艺术与科学。要理解这一点，我们无需深入量子力学的最深层次；相反，我们可以从一个简单而优美的想法开始，就像一场互补对立的游戏。

完美的开关：两种晶体管的故事

想象一下，您有两种类型的自动门。一种我们称之为n沟道MOSFET（NMOS），只有在您给出“高”信号（逻辑'1'）时才会打开。另一种是p沟道MOSFET（PMOS），是其古怪的对立面：它只有在您给出“低”信号（逻辑'0'）时才会打开。

如果我们把它们堆叠起来会发生什么？让我们将PMOS门连接到天花板（我们的高压电源， $V_{DD}$ ），并将NMOS门连接到地板（我们的地， $GND$ ）。我们将它们的控制信号连接在一起，然后观察它们之间的空间——这就是我们的输出。这种布置是CMOS技术的基石：反相器。

当我们在输入端施加'1'时：

NMOS门打开，将输出连接到地。输出电压变为'0'。
PMOS门关闭，切断通往高压电源的路径。

当我们在输入端施加'0'时：

PMOS门打开，将输出连接到高压电源。输出电压变为'1'.
NMOS门关闭，切断通往地的路径。

请注意这里的简洁优雅。对于任何稳定的输入，一扇门是开的，另一扇是关的。输出总是牢固地连接到“高”的天花板或“低”的地板，为我们提供了干净、明确的逻辑电平。这被称为轨到轨输出。更重要的是，从天花板到地板之间绝不会有直接、开放的通路。总有一扇关闭的门阻挡電流。这意味着一旦输出稳定下来，就没有电流流过。电路在保持其状态时几乎不消耗功率。这就是CMOS中的“C”——互补——这也是现代电子设备 incredible energy efficiency 的秘诀。

要真正欣赏这种设计，可以考虑一种替代方案，一种“比率”逻辑风格，如伪NMOS ``。在这种设计中，上拉部分可能是一个始终导通的PMOS晶体管，就像一个弱弹簧将输出拉高。当NMOS导通以将输出拉低时，它必须与这个弹簧对抗。结果是一场持续的拉锯战，不断浪费功率，并且无法将输出完全拉到一个完美的逻辑'0'。CMOS的互补特性优雅地回避了整个问题，创造了一个近乎完美的开关。

从开关到逻辑：对偶性的诗篇

一个反相器很有用，但真正的力量来自于做出更复杂的决策。我们如何构建像NAND（非与）和NOR（非或）这样的门？答案在于将我们的开关串联或并联。让我们关注将输出拉到地的NMOS晶体管网络，即下拉网络（PDN）。规则非常简单：

要创建逻辑与，我们将NMOS晶it管串联放置。只有当输入A和输入B和...都为'1'时，所有串联的晶体管都导通，通往地的路径才完整。
要创建逻辑或，我们将NMOS晶体管并联放置。如果输入A或输入B或...为'1'，至少打开一条并联路径，通往地的路径就完整了。

因此，对于一个双输入NAND门，当 $A$ 和 $B$ 都为'1'时应输出'0'，我们只需为我们的PDN串联放置两个NMOS晶体管。

那么PMOS晶体管的上拉网络（PUN）呢？人们可能认为这需要一个全新的设计过程，但在这里我们遇到了数字设计中最深刻和优美的概念之一：对偶性原理。上拉网络 просто是下拉网络的对偶。这意味着：

PDN中的每一个串联连接在PUN中都变成并联连接。
PDN中的每一个并联连接在PUN中都变成串联连接。

对于我们的双输入NAND门，串联的两个NMOS晶体管变成了并联的两个PMOS晶体管。就是这样。这不是巧合；它是逻辑基本定律——德摩根定理——的物理体现。逻辑表达式 $\overline{A \cdot B} = \overline{A} + \overline{B}$ 被物理地雕刻在硅片上。串联的NMOS实现了 $A \cdot B$ 部分（用于下拉），而并联的PMOS实现了 $\overline{A} + \overline{B}$ 部分（用于上拉）。

这一原理适用于任何复杂程度。如果我们有一个PDN，描述为“两个晶体管（A, B）的并联结构与一个复杂子网络串联” ``，其对偶的PUN将是“两个晶体管（A, B）的串联结构与该子网络的对偶并联”。这种强大的对称性意味着我们只需要设计电路的一半；另一半是免费赠送的。

逻辑的通用法则

有了这些原则，我们就拥有了构建几乎任何逻辑功能的通用法则。因为CMOS门是固有反相的（它们有一个上拉和一个下拉网络），它们自然地实现了外部带有一个非（NOT）的函数，如NAND、NOR或更复杂的表达式。

假设一位数字架构师要求我们为函数 $F = \overline{A \cdot (B + C)}$ `` 构建一个定制门。这是我们的法则：

找到下拉逻辑： 当 $F$ 为'0'时，PDN必须将输出拉到'0'。这种情况发生在非（NOT）内部的表达式为真时。所以，PDN必须实现逻辑 $G = A \cdot (B + C)$ 。
构建下拉网络： 我们使用我们的规则将 $G$ 转化为硬件。表达式 $A \cdot (B+C)$ 意味着“A与B和C的并联组合串联”。所以我们精确地构建它：一个用于A的NMOS晶体管，与一对用于B和C的并联NMOS晶体管串联。
构建上拉网络： 我们构造PDN的对偶。串联连接变为并联，并联连接变为串联。所以，我们的PUN是一个用于A的PMOS晶体管，与一对用于B和C的串联PMOS晶体管并联。

这个简单的三步过程非常可靠。它使我们能够将即便是像 $F(A,B,C,D,E) = (A + B)(C + \overline{D}) + E$ 这样令人望而生畏的[布尔表达式](/sciencepedia/feynman/keyword/boolean_expressions)，转化为具体的晶体管示意图。我们首先使用[德摩根定律](/sciencepedia/feynman/keyword/de_morgan_s_laws)找到使输出拉低的函数（$\overline{F}$），然后构建相应的PDN，最后取其对偶来创建PUN, ``。这是布尔代数与固态物理优雅结合的证明。

速度的物理学：努力、负载与NAND-NOR之争

在我们的理想世界里，这些门是瞬间工作的。实际上，它们受物理定律的限制。门的速度由一个简单的关系决定，就像用软管给水桶装水一样：所需时间取决于水压（晶体管的驱动强度）和水桶的大小（它所连接的电线和其他门的电容）。这可以用一个优美的线性模型来描述延迟 [@problemid:4291544]:

$d = g \cdot h + p$

$h$ 是电气努力，或称负载。它是衡量门需要填充多大“水桶”的指标。驱动连接到许多其他门的长导线比驱动只连接一个门的短导线更困难。
$p$ 是寄生延迟。这是门自身的内部电容——软管本身的“重量”。每个门仅驱动其内部节点就存在一些固有延迟。
$g$ 是逻辑努力。这是最有趣的术语。它捕捉了门拓扑相对于简单反相器的内在复杂性。一个反相器的逻辑努力为1。像NAND门这样更复杂的门，由于其晶体管排列导致内部电阻更高，使其在“逻辑上”更难通过信号。

这个模型揭示了CMOS技术中的一个关键不对称性 ``。NMOS晶体管中的电荷载流子（电子）的迁移率大约是PMOS晶体管中载流子（空穴）的两到三倍。这意味着相同尺寸的NMOS晶体管天生就比PMOS晶体管“更强”或电阻更低。

现在考虑一个高扇入（多输入）NOR门。它的PUN由许多慢速的PMOS晶体管串联而成。由于串联电阻会相加，上拉路径的总电阻变得巨大，使得该门的低到高转换慢得令人痛苦。相比之下，NAND门将慢速的PMOS并联（这减少了总电阻），而将快速的NMOS串联。虽然不完美，但这种安排要优越得多。这就是为什么在数字设计中，对于多输入的函数，NAND门远比NOR门更受青睐——这是一个由硅的基本特性决定的高层架构选择。

机器中的幽灵：当完美失效时

当我们的完美、互补的世界被打破时会发生什么？一个制造缺陷可能导致一个晶体管永久损坏，即“断路故障” ``。想象一下，在我们的NAND门中，PDN里的一个串联NMOS晶体管发生了断路故障。现在，考虑一个输入情况，此时通往地的路径应该是活动的，但PUN也应该是关闭的。突然之间，两个网络都不导通。输出没有连接到任何地方——它处于浮空状态。

这种状态，被称为高阻态，是机器中的一个幽灵。它既不是逻辑'0'也不是'1'。它的电压不确定，随 stray electric fields 的摆布。它可能导致链中的下一个门行为异常，可能使整个系统瘫瘓。这个场景生动地说明了互補性保证是多么重要：对于任何有效的输入，必须有一个网络导通，提供一个坚实、稳定的连接到电源轨。

最后，我们必须面对终极的不完美：我们的“零”静态功耗并非真正的零。一个“关闭”的晶体管更像一个拧得很紧但仍在微小滴漏的水龙头。这种亚阈值泄漏电流对于单个晶体管来说非常小，但在拥有数十亿个晶体管的现代芯片上，这些滴漏汇集成一条河流，浪费了大量功率。

在现代纳米级晶体管中，这种泄漏的主要元凶之一是一种称为漏致势垒降低（DIBL） `` 的效应。可以把晶体管的栅极看作一个控制着阻止电子流动的势垒的守卫。漏极保持在高电压下，施加着强大的静电引力。在一个非常短的晶体管中，漏极离源极如此之近，以至于它的引力足以物理上降低势垒，使得一些坚定的电子即使在守卫说“停”的时候也更容易泄漏过去。随着晶体管的缩小，这种效应变得更糟，这意味着现代电子设备中的相当一部分功耗不是由主动计算消耗的，而是由数十亿个“关闭”晶体管的集体泄漏消耗的。

从互补开关的简单舞蹈到泄漏和性能的复杂挑战，静态CMOS逻辑是一个写在抽象数学和现实物理交汇点的故事。它的原理是优雅和效率的大师级课程，构成了我们数字文明赖以建立的基石。

应用与跨学科联系

在理解了静态CMOS反相器的基本原理——其优雅的对称性、轨到轨的输出摆幅以及近乎为零的静态功耗之后，我们现在可以踏上更宏大的旅程。我们将从“是什么”转向“为什么”，探索这个简单的构建模块在被复制和互连数十亿次后，如何构建出我们所居住的广阔而复杂的数字世界。正是在其应用中，静态CMOS哲学的真正美丽和力量得以展现。我们将看到，选择这种特定的逻辑风格并非任意；它是对一系列深层工程挑战的深思熟慮的解决方案，其影响甚至波及到像计算机安全这样意想不到的领域。

计算的两大支柱：算術与存储

在其核心，所有的计算都建立在两大支柱之上：执行算术运算的能力和记住结果的能力。静态CMOS提供了一种异常鲁棒和直接的方式来构建这两者。

让我们首先考虑算术。我们如何教一堆晶体管进行加法？我们从小处着手，构建一个称为半加器的电路，它接收两位比特，产生一个和与一个进位。这可以由几个基本逻辑门构成。要添加更大的数字，我们需要一个全加器，它也接受来自前一级的进位。正如人们可能猜到的那样，一个全加器可以优雅地由两个半加器和一个额外的或门构建而成。这种层次化的方法——从更简单的功能构建复杂的功能——是数字设计中一个反复出现的主题。但我们并不仅限于将简单的门串联起来。对于像计算进位输出這樣的关键功能，设计师可以打造一个单一的、专门的复合门。这样的门，比如一个与或非（AOI）单元，一次性实现了整个逻辑功能，通常能带来更快、更紧凑的电路，尽管它在输入电容和时序风险方面也带来了自身的设计权衡。

第二个支柱是存储器。一个由无状态开关组成的电路如何能保持一个值？魔力通过反馈发生。通过交叉耦合两个简单的静态CMOS NAND门，我们创建了一个称为SR锁存器的电路。在这种配置中，每个门的输出都反馈到另一个门的输入。这创建了一个双稳态系统：它有两个稳定状态，我们可以标记为'0'和'1'。电路将无限期地保持在其中一个状态，几乎不消耗功率，直到被明确告知要改变。这个简单而优美的结构是基本的1位存储单元。从这个基本锁存器出发，我们可以构建更复杂的存储元件，如D锁存器，并进而构建出每个微处理器中的主力军——多位寄存器，它们为下一次计算存储数据。

选择的逻辑：数据的鲁棒路由

计算不仅仅涉及计算和存储；它还要求能够选择和路由数据。实现这一功能的主要工具是多路复用器（MUX），它是一个数字开关，从多个输入信号中选择一个传递到其输出。

在构建多路复用器时，设计师面临着两种流行的CMOS风格之间的根本选择。第一种是使用标准静态逻辑门来实现MUX的布尔函数。第二种是使用一种更精简的组件，称为传输门（TG），它由一个PMOS和一个NMOS晶体管配对组成，作为一个近乎完美的开关。在纸面上，基于TG的MUX是明显的赢家：它非常紧凑，所需的晶体管数量远少于其静态门 counterparts。

然而，这种效率是有代价的，当构建大型级联系统时，这个代价变得显而易见。考虑一个桶形移位器，这是每个处理器中用于将数据移动可变位数的电路，它本质上是一个多级多路复用器网络。如果我们用传输门来构建它，我们会得到一个非常紧凑和节能的设计。但传输门是一个无源开关；它仅仅是将其输入信号传递过去。信号上的任何噪声或电压退化都会被传递下去，甚至在通过后续级时可能被放大。

相比之下，静态CMOS门是一个有源的、可再生的器件。由于其互补的上拉和下拉网络，其输出总是被强力驱动到 $V_{DD}$ 或地。它接收一个可能微弱或有噪声的输入，并产生一个干净、全幅度的输出。它在每一级都“恢复”信号。在像桶形移位器這樣的长链中，这种被称为具有高噪声容限的特性是无价的。静态CMOS版本虽然更大、更耗电，但远为鲁棒和可靠。两种风格之间的选择成为一个经典的工程权衡：传输门的原始效率与静态CMOS的“蛮力”可靠性之間的取捨。

更广阔的前景：为何静态CMOS占据主导地位

静态CMOS的主导地位最好通过与它的替代方案进行比较来理解。它的设计理念直接解决了其他逻辑系列的缺点。

一种替代方案是传输晶体管逻辑（PTL），其中数据通过单个NMOS晶体管传递。虽然简单，但PTL有一个致命缺陷：一个NMOS晶体管无法传递一个“强”的逻辑'1'。其输出电压只能上升到 $V_{DD} - V_{th,n}$ （比电源电压低一个阈值电压）。如果这个弱高信号被输入到一个标准的静态CMOS门中，该门的PMOS晶体管将不会完全关闭。这会产生一条从电源到地的直接静态电流路径，不断泄漏功率，从而破坏了CMOS的主要优势。静态CMOS中的互补PMOS上拉网络正是为了防止这种情况而存在的，确保输出总是能达到完整的电源电压，并且在稳态下其中一个网络总是完全关闭。

另一个主要的替代方案是动态逻辑。与静态CMOS中输出总是通过低阻抗路径连接到电源轨不同，动态门的状态是暂时作为电荷保存在一个“浮动”节点的微小电容上的。它的操作是一个两步舞：一个“预充电”阶段将节点设置为已知状态，一个“求值”阶段根据输入有条件地将其放电。对于某些类型的函数，动态逻辑可以非常快速和紧凑，因为它通常使用更少的晶体管。然而，这种对存储电荷的依赖使其更加脆弱——电荷会随着时间的推移而泄漏，从而破坏逻辑状态。在像能量延迟积（EDP）這樣的每瓦性能指标上比较两者时，赢家并非总是明确的，并且在很大程度上取决于具体的函数和操作条件。最终，静态CMOS的鲁棒性、设计简易性和可靠性使其成为绝大多数数字应用的基石技术。

机器中的幽灵：安全性与物理现实

我们通常在布尔代数的抽象领域思考数字逻辑，但每一次计算都是一个物理过程。而静态CMOS的物理特性具有深远而 surprising 的后果，延伸到网络安全领域。

一个微妙的物理现实是信号需要时间通过门传播。在像超前进位加法器这样的电路中，如果一些输入比其他输入晚到，逻辑可能会在其输出端产生一个短暂的、虚假的脉冲或“毛刺”，即使最终值是正确的。电路的设计——例如，使用一个单一、结构良好的复合门而不是多个独立的门——可以最小化这些风险的持续时间并提高电路的可靠性。

一个远为 dramatic 的后果源于功耗。每当一个静态CMOS门开关时，它都会从电源吸取一个微小的电流脉冲。通过仔细监控芯片的功耗，对手可以执行侧信道攻击，从而获得关于内部正在处理的秘密数据的线索。静态CMOS电路的功耗特征与其基本操作原理内在相关。由于逻辑状态是静态保持的，只有当比特翻转时才会消耗显著的功率。因此，一个时钟周期内消耗的总功率与从前一个状态变为当前状态的比特数量相关。这被称为汉明距离模型。

这与动态逻辑形成鲜明对比。在动态电路中，节点每个周期都被预充电到一个固定状态（比如'1'）。然后，在求值阶段根据哪些节点转换为'0'来消耗功率。因此，功耗不是与数据的变化相关，而是与数据的最终值相关——具体来说，是'1'的数量。这是汉明重量模型。一个逻辑系列的架构与其数据依赖的功耗特征之间的这种基本联系是设计安全硬件时必须考虑的关键漏洞。这是一个 stunning 的例子，说明了最低层的晶体管排列选择如何决定一个系统的最高层安全特性，这是一个美丽而 sobering 的提醒，提醒我们数字设计的深层统一性。