硬件安全：从 JTAG 漏洞到全系统信任

玻尔百科

定义

硬件安全：从 JTAG 漏洞到全系统信任是网络安全领域的一个分支，旨在通过防御 JTAG 调试端口漏洞和未授权固件固件提取来保护物理设备。该领域利用密码学挑战应答协议、安全设备生命周期管理以及 IOMMU 等硬件强制执行原则，为汽车、工业控制和医疗系统构建信任基础。在实施这些安全策略时，必须在增强系统防御能力与维持实时控制系统所需的低延迟性能之间取得平衡。

核心要点

JTAG 调试端口对开发至关重要，但若不加保护，则会带来严重的安全风险，允许攻击者转储固件并控制设备。
保护 JTAG 端口涉及加密方法，如挑战-响应协议，以及基于安全设备生命周期（例如，开发、生产、返厂维修）的管理访问。
硬件强制执行的安全原则，例如用于 DMA 保护的 IOMMU 和签名固件更新，对于在汽车、工业控制系统（ICS）和医疗保健等不同应用中建立信任至关重要。
安全性和性能之间存在固有的权衡，因为加密操作会引入延迟，可能影响实时控制系统的稳定性。

引言

在数字电子世界中，用于创造和调试的工具往往具有危险的双重性：能让工程师洞察一切的东西，也能让攻击者掌控一切。这正是硬件安全的核心挑战，即为维护目的而设的访问权限变成了恶意利用的门户。本文深入探讨了这一关键冲突，并以最普遍、最强大的工程工具之一——JTAG 调试端口——为视角，来理解基本的硬件安全原则。许多系统之所以脆弱，仅仅是因为必要的调试功能未受保护，从而从一项优势转变为一个关键的攻击向量。在硬件层面理解如何缓解这种风险，已不再是小众问题，而是构建任何可信技术的先决条件。

我们将在第一章 原则与机制 中开始探索，首先剖析 JTAG 标准。您将了解它如何像“制表师的放大镜”一样，用于检查电路板和处理器，以及这一功能本身如何被滥用以损害系统的核心完整性。然后，我们将构建一套防御体系，详细介绍锁定这一强大接口所需的加密协议和生命周期管理策略。在第二章 应用与跨学科联系 中，我们将拓宽视野，探索这些核心安全原则如何被应用于建立广泛领域的信任，从现代汽车内部的复杂网络，到航空航天和医疗保健领域的生命攸关系统。

原则与机制

制表师的放大镜：一个窥探内部的端口

想象一下你是一位制表师，面前摆着一项工程奇迹——一块现代数字手表。它的外壳是密封的，其内部构造是微观齿轮和电路组成的迷宫。现在，假设电路板上一根比头发还细的导线连接不良，你该如何找到它？或者，如果其微型处理器上运行的软件存在一个错误，导致它每天慢一秒，你又该如何暂停其运行，检查其内部状态，并修复代码？

这正是集成电路（IC）及其所处的复杂电路板的创造者们所面临的问题。他们的解决方案是一项天才之举，一个被称为 JTAG 的优雅标准，其名称源自创立该标准的联合测试行动组（Joint Test Action Group）。本质上，JTAG 就是一个通用的制表师放大镜——一个专为测试和调试而设计的特殊用途端口。

它最初的主要目的是一种叫做边界扫描（boundary scan）的技术。这个想法非常简单。想象一下，芯片上的每个输入和输出引脚都像是串在一根长长的、无形的项链上的珠子，这条项链被称为扫描链（scan chain），它环绕着芯片的边缘。JTAG 提供了一种方法，可以让你沿着这条项链缓慢地“移位”数字比特。你可以精心加载一个特定的 $1$ s 和 $0$ s 模式到链中，直到每个引脚都设置到所需的状态。然后，你可以命令芯片将这些值驱动到其引脚上，从而测试电路板上的物理连接。反之，你也可以捕获进入引脚的信号，并沿着链将它们移出，以读取芯片所看到的内容。这是一种巧妙的方法，可以在无需物理探测每个连接点的情况下，发现诸如焊桥或开路等制造缺陷。

除了测试边界，JTAG 还演变成一个强大的工具，用于调试芯片的“大脑”——中央处理器。它为开发人员提供了一个后门，可以暂停 CPU，检查其寄存器和内存的内容，并逐行单步执行代码。对于试图在复杂系统中追踪错误的工程师来说，JTAG 是一个洞察机器灵魂的不可或缺的窗口。

万能钥匙：当调试变为控制

这个对创造和维护至关重要的调试端口，具有危险的双重性。一个旨在赋予其创造者上帝般控制权的工具，也能将同样的能力赋予任何能接触到它的人。一个在现场设备上未受限制且保持开放的 JTAG 端口，不仅仅是一个维护舱口，更是一个巨大的安全漏洞。它变成了一把万能钥匙，可以解锁设备最深层的秘密，并使其屈从于攻击者的意志。其影响可能是毁灭性的，会危及整个系统的机密性、完整性和可用性。

让我们通过几个受典型现代片上系统（SoC）架构启发的场景，来探究这种权力如何被滥用。

首先，攻击者可以劫持边界扫描功能本身。假设设备的固件存储在一个外部闪存芯片上。连接主 SoC 与该存储芯片的引脚几乎肯定属于 JTAG 边界扫描链的一部分。拥有物理访问权限的攻击者可以连接 JTAG 探针，并使用扫描链直接控制这些引脚。通过精细地移入和移出比特，他们可以模拟存储芯片的通信协议——这种技术被称为比特撞击（bit-banging）。这使他们能够发出“读取数据”等命令来转储整个固件，或发出“写入数据”命令来注入自己的恶意代码。核心处理器对此完全不知情；攻击者正在直接操纵它的“四肢”。

其次，许多制造商会包含他们自己的、非标准的私有 JTAG 指令，用于内部测试和验证。这些指令可能比标准命令更强大。一个常见的特定于供应商的指令可能会提供对芯片内部总线（连接 CPU、内存和外设的主要数据高速公路）的直接访问。如果攻击者发现了这个秘密命令，他们就不再需要费力地对比特撞击外部引脚。他们可以直接发出该指令，并使用 JTAG 直接向芯片上的任何内存地址发送读写命令。这使他们能够即时转储内部 RAM、窃取密钥或修改固件，即使主 CPU 处于复位状态。

第三，攻击者可以利用 JTAG 来颠覆系统安全的根基：启动过程。许多安全系统依赖一个硬件引脚，我们称之为 $SECURE\_EN$ ，设备在开机时会检查该引脚。如果该引脚设置为‘ $1$ ’，设备会正常启动，验证其固件的数字签名。如果为‘ $0$ ’，它可能会进入一个特殊的不安全模式。攻击者可以使用 JTAG 的 EXTEST 命令将这个特定引脚强制设置为‘ $0$ ’值，保持该状态，然后重置设备。芯片唤醒后，读取引脚上的欺骗性值，并顺从地禁用其自身的安全机制，从而允许未经身份验证的、潜在恶意的代码运行。在更广泛的系统安全领域，这种通过 JTAG 的物理访问代表了整个攻击面（attack surface）上的一个关键向量。

构建数字锁：挑战-响应握手

鉴于 JTAG 既不可或缺又充满危险，我们不能简单地移除它。解决方案不是把门堵死，而是安装一把非常好的锁。这把锁的形式是一种加密的挑战-响应协议（challenge-response protocol）。

想象设备是一座有守卫的堡垒。当一个外部调试工具试图连接时，守卫不会直接打开大门，而是会发出一个挑战：一个全新的、不可预测的随机数，我们称之为 $r$ 。这就像是问“暗号是什么？”，但又有所不同。

一个经过授权的工具，即“友方”，拥有一个密钥 $K$ ，这个密钥也安全地存储在设备内部，可能被烧录在一次性可编程（OTP）内存中。友方接收挑战 $r$ ，将其与密钥 $K$ 结合，并计算结果的加密哈希值。一种标准且安全的方法是使用基于哈希的消息认证码（HMAC）。假设响应为 $y = \text{HMAC}(K, r)$ 。

该工具将响应 $y$ 发回给设备。设备内部的守卫，同时知道原始挑战 $r$ 和相同的密钥 $K$ ，执行完全相同的计算。如果其本地计算的结果与来自工具的响应 $y$ 相匹配，大门就会打开，JTAG 访问权限即被授予。

这个简单的握手协议非常稳健，理解其原因能揭示几个基本的安全原则：

防止重放攻击。 如果攻击者窃听并记录了一次成功的登录，他们会捕获一对特定的 $(r, y)$ 。因为守卫为每次新的连接尝试都会生成一个新的随机 $r$ ，所以旧的、被记录的响应 $y$ 就毫无用处。这就是为什么使用静态不变的密码如此脆弱——它容易受到重放攻击。随机挑战确保了新鲜性（freshness）。
它需要一个秘密。 没有密钥 $K$ ，就无法正确计算响应。看到挑战 $r$ 的攻击者无法生成正确的 $y$ ，因为加密哈希函数是抗原像攻击（preimage resistant）的——你无法从哈希输出反向推导出输入。这提供了身份验证（authentication）。
它限制了爆炸半径。 如果攻击者成功从一台设备中提取了密钥怎么办？为防止单个漏洞危及整个产品线，每台设备都必须配置其自己唯一的、每设备独立的密钥。为所有设备使用一个全局密钥是一个灾难性的设计缺陷。

最后，为了防御试图猜测密钥或响应的攻击者，设备必须实施速率限制，在少量失败尝试后锁定端口。

时间维度上的安全：设备生命周期

一把坚固的锁是必不可少的，但安全的故事并未就此结束。我们还必须问：门应该在何时上锁？答案取决于设备在其生命周期中所处的阶段，从在实验室中诞生到部署在你的家中。这就引出了安全设备生命周期（device lifecycle）的概念，其中调试访问由一个随时间变化的策略来管理，并始终遵循最小权限原则（principle of least privilege）。

开发阶段（ $L=\text{DEV}$ ）： 当设备处于最初设计阶段时，其 JTAG 端口是完全开放的。工程师需要完全、不受限制的访问权限来测试硬件、编写初始软件和修复错误。在此阶段，设备就像一本打开的书，但不包含任何敏感机密。
配置阶段（ $L=\text{PROV}$ ）： 接下来，设备进入工厂生产线。在这里，它被赋予了其独特的身份和机密信息。我们之前讨论过的唯一 JTAG 认证密钥 ( $K$ ) 就是在这里被永久烧录到其熔丝中。此时，调试访问权限被收紧，可能需要一个特殊的、仅限工厂使用的认证密钥。
生产阶段（ $L=\text{PROD}$ ）： 一旦设备售出并部署，它就进入了生产状态。现在，最小权限原则全面生效。JTAG 端口默认是禁用的。只有受信任方（如原始制造商）成功完成安全的挑战-响应协议后，才能解锁它。
返厂维修授权（ $L=\text{RMA}$ ）： 如果现场的设备发生故障，需要返厂进行分析，该怎么办？工程师可能需要再次访问 JTAG。然而，设备中可能包含敏感的用户数据。解决方案是一条单行道。要进入 RMA 状态，设备可能需要制造商提供的一个特殊的、经过数字签名的令牌。在验证令牌后，设备首先执行清零（zeroization）：它会安全且不可逆地擦除所有密钥和用户数据。只有在完成这种对敏感信息的自我销毁之后，它才会永久解锁 JTAG 端口以进行故障分析。关键的是，这一转变是不可逆的；处于 RMA 状态的设备永远不能再回到生产状态。

这种生命周期管理表明，硬件安全不是单一的机制，而是一种贯穿设备整个存在过程的深思熟虑的策略。不起眼的 JTAG 端口，一个用于测试和调试的简单工具，成为了安全工程领域一个深刻的案例研究——它告诉我们，任何强大的工具都必须小心使用，用加密锁加以保护，并由一个尊重时间流逝的明智策略来管理。

应用与跨学科联系

在了解了硬件安全的原则与机制之后，我们可能感觉自己一直在研究锁匠的精湛技艺。我们检查了锁芯、钥匙和材料。但锁之所以有趣，是因为它所保护的东西。现在，我们将离开作坊，走向世界，看看这些“锁”都用在何处。我们会发现，硬件锚定的安全原则并非间谍和银行家的专属领域；它们是维系我们现代技术世界结构的无形丝线。同样的基本思想，仿佛魔法般地，在最意想不到的地方重现——从你的汽车引擎到医院的手术室，从浩瀚的太空到超级计算机的核心。

根基：守护机器的内殿

在我们可以信任任何软件之前，我们必须首先信任它所运行的硬件。我们怎么能在流沙上建造堡垒呢？虚拟化技术应运而生，但它也带来了自身的挑战。当我们在单台物理计算机上运行多个虚拟机（VM）时，我们实际上是在一栋大楼内建造了多个独立的、有围墙的公寓。CPU 有自己的内存管理机制，以防止虚拟机之间相互干扰。但像网卡或存储控制器这样的设备呢？这些设备通常需要直接将数据写入内存，这个过程称为直接内存访问（DMA）。一个不受检查、具有 DMA能力的设备，就像一个拥有大楼里每间公寓万能钥匙的住户——一场等待发生的灾难。

这时，一个专门的硬件部件——输入输出内存管理单元（IOMMU），就扮演了系统警惕的门卫角色。当一个设备试图访问内存时，它不会获得通行无阻的权限，而必须向 IOMMU 提交请求。IOMMU 会根据一份严格的访客名单——由虚拟机监视器（hypervisor，即运行全局的主控软件）配置的一组权限——来检查地址。IOMMU 将设备的“I/O 虚拟地址”转换为“主机物理地址”，确保设备只能写入其指定的内存区域。它在硬件层面强制执行隔离，将潜在的混乱局面转变为一个有序且安全的系统。这是一个硬件强制边界的绝佳范例，一个简单而深刻的想法，让我们能够安全地共享强大的硬件资源。

看不见的嵌入式系统世界

现在让我们把注意力从数据中心的强大服务器转向那些无形中协调着我们世界的数十亿个微小的专用计算机。这些嵌入式系统存在于我们的汽车、工厂和家庭中。在这里，挑战有所不同；处理能力、内存和能源等资源稀缺，而且系统通常必须实时运行。

在你的汽车内部

现代汽车是由几十台计算机组成的轮上网络。以电动汽车中的电池管理系统（BMS）为例。它的固件——运行它的永久性软件——需要通过空中下载（over-the-air）更新来提高性能和安全性。但我们如何确保发送到车辆的不是恶意更新呢？解决方案是一条精心设计的信任链。当新固件开发完成后，它会使用存储在高度安全的硬件安全模块（HSM）中的私钥进行加密签名。当汽车的 BMS 收到更新时，它的引导加载程序（bootloader）——一个小的、不可变的程序——会使用永久蚀刻在其内存中的公钥来验证签名。如果签名有效，更新继续进行；否则，更新被拒绝。

这个过程为攻击者关上了许多门，但也揭示了薄弱环节所在。如果攻击者入侵了构建服务器，并在代码签名之前注入了恶意代码怎么办？签名将是有效的，但代码却是恶意的。这突显出安全是一个全系统的问题。那么物理访问呢？像联合测试行动组（JTAG）接口这样的调试端口在开发过程中至关重要，它提供了对处理器的底层控制。然而，在量产车上，这个端口是一个巨大的安全漏洞。解决方案既优雅又残酷：在汽车出厂前，使用“生产熔丝”物理上永久禁用 JTAG 端口，从而有效地“烧毁开发者身后的桥梁”。

汽车中的安全故事并不仅仅止于更新。这些嵌入式控制器通过 CAN 总线等内部网络持续通信。每百分之一秒，BMS 可能会向主车辆控制器发送一次充电状态读数。这些消息中的每一条都必须得到保护，但安全操作不能太慢，否则会扰乱实时控制回路。在这里，我们看到了安全性与性能之间一个有趣的权衡。对于高频遥测数据，像基于哈希的消息认证码（HMAC）这样快速的对称原语是完美的。它以最小的计算延迟提供了完整性和身份验证。而对于像固件更新这样罕见但关键的操作，则使用像椭圆曲线数字签名算法（ECDSA）这样较慢但更强大的非对称原语，因为其公开可验证性和不可否认性的特性至关重要。这是为正确的工作选择正确工具的大师级应用，平衡了对速度的需求和对强度的需求。

在关键基础设施的核心

在管理我们电网、水处理厂和工厂的工业控制系统（ICS）中，这种在安全性、性能和遗留约束之间的紧张关系甚至更为突出。许多这些系统依赖于像 Modbus 这样有数十年历史的协议，这些协议当初是为隔离网络中的可靠性而设计的，完全没有考虑安全性。在今天这个互联世界里，这就像把发电站的前门敞开一样。网络上的攻击者可以自由地向可编程逻辑控制器（PLC）发送伪造的命令，命令它断开断路器或关闭涡轮机。

现代的解决方案是将这些不安全的遗留协议“包装”在一个加密外壳中。通过在每个 Modbus 数据包后附加一个消息认证码（MAC），我们可以提供完整性和真实性。但这又引入了新问题。MAC 标签增加了消息的字节数，额外的带宽可能超出了老旧、缓慢网络的承受能力。加密计算本身，虽然在现代个人电脑上很快，但对于远程终端中一个古老的 8 位微控制器来说可能太慢，有可能违反控制回路严格的实时期限。此外，在安全关键系统中，更改已认证设备上的软件可能会触发一个成本高昂的重新认证过程。一个巧妙的变通方法是“线路内嵌”（bump-in-the-wire）方案：在网线上放置一个专用的小型安全网关，它负责添加和验证 MAC，而终端设备对此一无所知。这说明，保障真实世界系统的安全，既需要应用加密理论，也同样需要在实际约束中寻找出路。

网络与物理的交汇点：比特与原子的相遇

也许最深刻的联系在于数字控制器与其所管理的物理世界之间的接口。现代系统越来越多地使用“数字孪生”（digital twin）——一个实时镜像物理资产的复杂模拟。这创建了一个紧密的反馈循环，其中传感器数据为孪生体提供信息，孪生体则为执行器计算命令。这个循环的安全性至关重要。

考虑一个高性能控制系统的稳定性，比如用于机器人手臂或飞行控制面的系统。其稳定性取决于一个精细的时间平衡，用“相位裕度”（phase margin）来量化。可以把它想象成你在手指上平衡一根长杆时的缓冲；你的反应延迟越长，就越有可能失控。我们增加的每一次安全检查——每一次 MAC 验证——都会引入微小的延迟。虽然微不足道，但这种加密延迟会侵蚀相位裕度。如果延迟变得太大，系统可能会变得不稳定，导致危险的振荡。这揭示了一个深刻的数学真理：安全不是“免费”的。它有物理成本，必须在系统的动态设计中为其编列预算。

除了时序，数字孪生必须信任它收到的数据。攻击者可能会尝试进行“虚假数据注入”攻击，通过向控制器提供看似合理但不正确的传感器读数，慢慢地将系统引向不安全状态。传感器数据上的 MAC 可以防止网络攻击者篡改传输中的消息。但如果传感器本身被攻破了呢？传感器可以生成虚假数据，然后用一个完全有效的 MAC 对其进行签名。对此的终极防御需要将信任更深地推入硬件。我们可以设计一个系统，其中一个安全的硬件模块直接从传感器获取模拟信号，将其转换为数字信号，并对其进行签名，所有这些都在一个可信边界内完成。这将信任边界从软件转移到了物理接口，迫使攻击者必须操纵物理世界本身——这是一项困难得多的任务。

高风险领域：航空航天与医疗保健

最后，我们来看看那些失败成本以人的生命和科学本身的完整性来衡量的领域。

航空航天与国防

一架在争议环境下通过卫星链路操作的无人机，是安全性的终极试验场。在这里，我们需要一整套的加密保护措施。通信协议必须提供双向身份验证，以便无人机知道它在与正确的地面站通信，反之亦然。它需要前向保密性，这样即使无人机被俘获，敌人也无法解密其先前记录的通信。每个数据包都需要一个唯一的、不可重用的 nonce，以防止重放攻击。并且，每次固件更新都必须经过签名，并与一个基于硬件的单调计数器进行验证，以防止对手将系统回滚到更旧、更易受攻击的版本。这是最严格的安全工程，每个可想象的攻击向量都必须被分析和缓解。

医疗保健与患者数据

在医学领域，信任就是一切。我们必须相信我们的私人健康信息保持机密，并且我们必须相信支撑医学突破的科学数据是未经篡改的。硬件安全原则对这两者都至关重要。

当存储受保护的健康信息（PHI）时，我们需要一种“均衡饮食”般的加密技术来保护静态数据。一种称为 AES-XTS 的特殊加密模式用于硬盘本身，因为它专为磁盘存储的随机访问模式而设计。数字签名，如 ECDSA，用于签署审计日志，创建一个不可否认的访问记录。而另一种公钥加密技术，如 RSA，则用于安全地“包装”和分发主加密密钥。每种原语都因其独特的优势而被选用，协同工作以创建强大的防御体系。

挑战还延伸到了研究数据本身的完整性。一个生物样本从患者到临床报告的旅程涉及多个阶段：采集、测序、分析。我们如何确保在此过程中没有数据被篡改或调换？解决方案是创建一个加密的数据血缘，一个数字化的监管链。在每个阶段，都会计算数据的加密哈希值，并与前一阶段的哈希值链接，形成一条不间断的链。但这条链的强度取决于它的锚点。如果这条链存储在普通数据库中，内部人员可以轻易修改数据并重新计算整条链。为了使完整性可验证，链的头部必须锚定到一个内部人员无法控制的信任根——一个外部的、一次写入多次读取（WORM）的存储设备，或一个保存在 HSM 中的密钥。这确保了我们赖以进行拯救生命发现的数据与最初收集的数据完全相同，从而维护了科学过程本身的完整性。

从计算机的核心到太空和医学的前沿，硬件安全的故事是在最基础的层面上建立信任。这是一个迷人的学科，在这里，密码学的抽象之美与物理世界的硬性约束相遇，共同促成了定义我们时代的技术。