保密容量公式：完美安全的物理学

玻尔百科

定义

保密容量公式：完美安全的物理学是信息理论中的一个基本原理，它定义了两方之间秘密信息传输的最大速率。该数值被设定为合法接收者与窃听者信息速率之间的差值，且要求合法信道必须具备信息优势。这一概念为从经典工程到量子通信的系统设计提供了实际的门槛，通过利用环境噪声或物理盲点来确保通信的安全性。

核心要点

保密容量是秘密通信的最大速率，定义为合法接收者的信息速率与窃听者的信息速率之差。
要使秘密通信成为可能，合法接收者的信道必须在信息上占优，而不仅仅是窃听者信道的降级版本。
可以通过利用环境噪声、设计具有结构性盲点的系统或利用对信道的特有知识来创造信息优势。
保密容量原则为安全系统提供了一个实用的设计阈值，并从经典工程学延伸到量子通信领域，在后者中，安全性由物理定律保证。

引言

在追求安全通信的过程中，我们通常会想到复杂的加密算法——数字密钥和无法破解的代码。但是，如果完美的保密性不是由计算难度来保证，而是由物理和信息的基本定律来保证呢？这就是信息论安全的革命性承诺，该领域旨在理解在存在窃听者的情况下安全通信的绝对极限。它解决了如何传输一条消息的核心问题，使得预期的接收者能够完全理解它，而对手尽管截获了传输，却什么也学不到。

本文深入探讨了使这一切成为可能的基础概念：保密容量公式。这个由 Aaron Wyner 首次提出的优雅原则，量化了能够以完美保密方式发送信息的最大速率。为了理解这个强大的思想，我们将分为两个不同的章节进行探讨。首先，在原理与机制中，我们将剖析公式本身，探索接收者与窃听者之间的“信息竞赛”，以及决定保密是否可能的关键条件，如信道降级。然后，在应用与跨学科联系中，我们将见证该公式的实际应用，揭示它如何为无线工程和前沿量子通信等不同领域的安全提供了蓝图，将一个理论概念转变为构建安全系统的实用工具。

原理与机制

想象一下，你正试图在课堂上给朋友传一张秘密纸条，而老师正在看着。你可以用一种特殊的代码书写，或者用一支很淡的铅笔，你的朋友视力很好能看清，但远处的老师却看不清。这个小小的课堂情景包含了信息论安全的精髓。它不是为你的数据构建一个牢不可破的保险箱，而是利用通信信道本身的根本优势。这是一场竞赛，一场你的预期接收者和窃听者之间的“信息竞赛”。问题是，你是否能以一种方式发送信息，让你的朋友在这场竞赛中赢得如此决定性的胜利，以至于窃听者只剩下噪声？

答案由 Aaron Wyner 在 20 世纪 70 年代发现，是一个响亮而优美的“是”，只要条件合适。他给了我们一个公式来衡量完美秘密通信的最大速率，这个量我们称之为保密容量 ( $C_s$ )。这个公式的结构惊人地简单：

$C_s = \max_{p(X)} [I(X;Y) - I(X;Z)]$

我们不必被这些符号吓倒。可以这样想：Alice 是发送者，Bob 是合法接收者，Eve 是窃听者。 $X$ 代表 Alice 传输的消息， $Y$ 是 Bob 接收到的内容， $Z$ 是 Eve 截获的内容。 $I(X;Y)$ 是 $X$ 和 $Y$ 之间的互信息。它代表 Bob 能从 Alice 那里可靠解码的信息速率。同样， $I(X;Z)$ 是 Eve 能可靠解码的信息速率。那么，这个公式陈述了一个非常直观的想法：你发送秘密消息的速率是 Bob 接收到的信息速率减去 Eve 接收到的信息速率。你在利用 Bob 的信息优势。“max”部分仅仅意味着 Alice 应该聪明地选择一个输入信号分布 $p(X)$ ，使这个差值尽可能大。

探索极端情况：当保密变得微不足道

为了真正领会这个想法的力量，让我们看看极端情况。首先，是间谍的梦想场景：如果窃听者的信道是完美的呢？想象一下，Eve 在 Alice 的发射器上直接放了一个窃听器，所以她毫无差错地接收到消息 ( $Z=X$ )。在这种情况下，Eve 得到的信息 $I(X;Z)$ 等于 Alice 发出的总信息量 $H(X)$ 。保密容量公式变为 $C_s = \max [I(X;Y) - H(X)]$ 。现在，信息论的一个基本定律——数据处理不等式告诉我们，Bob 得到的信息永远不会超过 Alice 发送的信息，所以 $I(X;Y) \le H(X)$ 。这意味着括号中的项 $I(X;Y) - H(X)$ 永远不可能是正数。它最多只能是零。因此，保密容量为零。这是常识：如果敌人能一字不差地清楚听到你的每一句话，你就不可能有秘密对话。

现在，让我们考虑间谍的噩梦。如果 Eve 的信道噪声极大，以至于她接收到的信号 $Z$ 与 Alice 的传输 $X$ 统计独立呢？这就像她试图在一英里外的飓风中窃听。在这种情况下，她什么也学不到，所以信息泄漏为零： $I(X;Z) = 0$ 。保密容量公式简化为 $C_s = \max I(X;Y)$ 。这正是 Alice 和 Bob 之间链路的正常信道容量！如果窃听者对你的消息完全听不见，那么 Bob 能够成功接收的每一比特信息，默认情况下都是秘密比特。

降级原则：谁的视野更好？

这些极端情况引导我们走向一个更普遍、更强大的概念。要使保密成为可能，Bob 的信道必须比 Eve 的“更好”。但“更好”意味着什么？这不仅仅是噪声更少。想象一个场景，Alice 向 Eve 发送信号，然后 Eve 位置的中继器再将信号转发给 Bob。信号路径是一个链条： $X \to Z \to Y$ 。Bob 接收到的是 Eve 已经接收到的信号的噪声版本。在这种情况下，数据处理不等式再次发挥作用。由于 Bob 的信号 $Y$ 只是 Eve 信号 $Z$ 的进一步处理版本，他关于 Alice 原始消息 $X$ 的信息永远不会比 Eve 多。形式上，对于 Alice 可能使用的任何编码策略，都有 $I(X;Y) \le I(X;Z)$ 。这迫使保密容量为零。

这是一个至关重要的见解。为了实现安全通信，Bob 的信道不能是 Eve 信道的降级版本。Bob 必须拥有一个优势，这个优势来自于他对原始信号拥有比 Eve 更直接或更清晰的“视野”。她不能成为他信息链中的中介。

不确定性的优势：一场数字游戏

让我们用一个常见的模型来具体说明这一点。假设通往 Bob 和 Eve 的信道都是二进制对称信道 (BSC)，其中传输的每个比特都有一定的概率被噪声翻转。假设 Bob 信道的交叉（比特翻转）概率为 $p_B$ ，而 Eve 的概率为 $p_E$ 。对于这样的信道，保密容量公式可以优美地简化为：

$C_s = \max \{0, H(p_E) - H(p_B) \}$

这里， $H(p)$ 是二进制熵函数， $H(p) = -p \log_2(p) - (1-p) \log_2(1-p)$ ，它衡量一个二元事件的不确定性。这个公式揭示了一些深刻的东西。保密容量是 Eve 的不确定性与 Bob 的不确定性之差。

考虑一个场景，Bob 的信道非常可靠（ $p_B = 0.11$ ），而 Eve 的信道噪声要大得多（ $p_E = 0.35$ ）。Bob 对每个比特的不确定性是 $H(0.11) \approx 0.500$ 比特，而 Eve 的不确定性是 $H(0.35) \approx 0.934$ 比特。保密容量是两者的差值： $C_s \approx 0.934 - 0.500 = 0.434$ 比特/信道使用。这意味着 Alice 每发送一个比特，她就能向 Bob 传递 $0.434$ 比特的秘密信息。如果她发送一个 1000 比特的长消息，该消息意义的大约 434 比特可以对 Eve 完全保密。

但如果情况相反会怎样？如果 Bob 的信道是噪声较大的那个（ $p_B = 0.25$ ），而 Eve 的信道更清晰（ $p_E = 0.10$ ），那么 $H(p_E) - H(p_B)$ 将为负值。公式告诉我们容量是 $\max\{0, \text{负值}\} = 0$ 。不可能实现保密。

这引出了保密的真正条件。正的保密容量要求 $H(p_E) > H(p_B)$ 。熵函数 $H(p)$ 围绕 $p=0.5$ 对称，形状像一座山，在 $p=0.5$ （最大不确定性）处达到峰值。因此，拥有更高的熵意味着更接近最大混淆点 $p=0.5$ 。因此，保密的真正条件是 $|p_E - 0.5| < |p_B - 0.5|$ 。Eve 的信道必须比 Bob 的更“像随机”。Eve 有更高的错误率是不够的。如果 Bob 的错误率是 $p_B=0.1$ ，一个错误率为 $p_E=0.9$ 的窃听者可不是傻瓜！她知道比特几乎总是被翻转。通过简单地反转她接收到的每一个比特，她可以为自己创造一个有效错误率为 $0.1$ 的信道，从而获得与 Bob 相同的信息，并将保密容量降为零。

创造自己的运气

这种“不确定性优势”不仅仅是一种被动属性；它也可以是一个战略目标。想象一下，Alice 正在向 Bob 传输（ $p_B=0.1$ ），但她也能主动干扰 Eve 的接收器，将其错误概率 $p_E$ 控制在一定范围内，比如从 $0.2$ 到 $0.4$ 。为了最大化保密性，Alice 应该尝试最大化 $H(p_E)$ 。由于熵函数在概率 0 到 0.5 之间是增加的，她的最优策略是恰到好处地干扰 Eve，将其错误率推到该范围内的最高可能值， $p_E = 0.4$ 。这最大化了 Eve 的不确定性，并因此最大化了 Alice 可以发送给 Bob 的秘密信息的速率。

最后的转折：反馈的幻觉

最后一个奇怪的问题出现了。如果 Bob 在接收到每个符号后，可以公开宣布“我收到了一个 1！”或“我收到了一个 0！”呢？这是一个公共反馈信道，Eve 也能听到。Alice 能否利用这些信息来实时纠正错误并提高保密速率？这似乎是可行的；她现在知道 Bob 听到了什么。

答案，或许令人惊讶，是否定的。信息论中的一个基础性结果表明，公共反馈信道不会增加无记忆窃听信道的保密容量。其直觉是，Alice 可能基于 Bob 的公开声明使用的任何巧妙技巧，Eve 也完全知晓。信息竞赛从根本上是由信道的物理质量——Bob 相对于 Eve 的原始优势——决定的。公共反馈对所有人开放，最终无法帮助任何一方获得相对优势。安全必须构建在物理层中，构建在通信路径的结构中，而不是事后用窃听者也能观察到的协议来附加。

应用与跨学科联系

我们已经探讨了保密容量的基本原理，揭示了支撑完美安全的优雅逻辑。但就像任何伟大的物理原理一样，其真正的美妙之处不在于孤立存在，而在于它描述和连接广阔现象图景的力量。保密容量公式看似简单，却是一把万能钥匙，能打开从无线工程到奇异而精彩的量子力学世界的门。现在，让我们开始一次应用之旅，看看“信息优势”这个抽象概念如何在现实世界中体现。

噪声的馈赠：从更差的信道中获得保密

要获得超越窃听者的优势，最直观的方式就是他们的连接比你的更差。想象一下，在安静的图书馆里听耳语，与在嘈杂的摇滚音乐会上听耳语。这个原理同样适用于电子通信：如果窃听者的信道“噪声更大”，我们就可以利用这些噪声作为我们秘密的屏障。

最简单的例证是二进制删除信道 (BEC)。在这种信道上，比特要么被完美接收，要么就丢失了——被完全删除。假设合法接收者 Bob 丢失比特的概率为 $\epsilon_B$ ，而窃听者 Eve 丢失比特的概率更高，为 $\epsilon_E$ 。几乎可以立即看出，秘密消息可以隐藏在 Bob 接收到但 Eve 没有接收到的比特中。保密容量公式证实了这一优美的直觉：我们发送秘密信息的速率恰好是它们删除率的差值， $C_s = \epsilon_E - \epsilon_B$ 。优势可以直接量化。

当然，噪声并不总是删除信息；有时它只是损坏信息。考虑二进制对称信道 (BSC)，其中每个比特都有一定的概率从 0 翻转为 1，反之亦然。假设 Bob 信道的翻转概率为 $p_1$ ，而 Eve 的翻转概率更高，为 $p_2$ 。在这里，Eve 仍然能从一个翻转的比特中获得一些信息，只是信息不太可靠。我们的优势度量必须更加精细。保密容量公式通过用更通用的信息货币——香农熵——来代替简单的丢失比特计数，从而优雅地处理了这个问题。容量变为 $C_s = h_2(p_2) - h_2(p_1)$ ，其中 $h_2(p)$ 是量化翻转概率 $p$ 引入的不确定性的二进制熵函数。保密性源于两个信道之间不确定性的差异。

这些思想直接扩展到支撑我们现代生活的模拟信号世界——无线电、Wi-Fi 和卫星链路。这些通常由加性高斯白噪声 (AWGN) 信道建模，其中信号被随机的、呈钟形曲线分布的噪声所破坏。一个距离更远、天线更小或处于更嘈杂位置的窃听者，将经历较低的信噪比 ( $SNR$ )。众所周知，这种信道的容量由香农公式给出， $\frac{1}{2} \log_2(1 + SNR)$ 。保密容量，以一种优美的综合方式，成为两个独立信道容量的差值。对于信号功率 $P$ 和 Bob 的噪声功率 $N_B$ 以及 Eve 的噪声功率 $N_E$ ，保密容量为 $C_s = \frac{1}{2}\log_2(1 + P/N_B) - \frac{1}{2}\log_2(1 + P/N_E)$ 。这一个方程告诉工程师他们需要知道的一切：要保护无线链路，请确保你的预期接收者拥有比任何潜在窃听者更好的信噪比。更好信号的物理优势直接转化为可量化的安全保证。

混淆的艺术：来自结构和知识的保密

依赖于对手拥有更差的信道可能感觉有些被动。如果我们能更聪明一些呢？事实证明，我们可以通过利用通信系统本身的结构，或利用关于环境的特殊知识，来主动创造信息优势。

想象一个情景，窃听者的设备在某种奇特的方式下受到限制。假设 Alice 以两个比特为一组 $(X_1, X_2)$ 发送信息。Bob 完美地接收它们。然而，Eve 只能观察到它们的模2和，即奇偶校验位 $Z = X_1 \oplus X_2$ 。例如，如果 Alice 发送 $(0, 1)$ ，Eve 会看到一个 '1'。但如果 Alice 发送 $(1, 0)$ ，Eve 也会看到一个 '1'。从 Eve 的角度来看，这两个不同的消息是无法区分的。她知道奇偶性，但她对于发送的是两个可能消息中的哪一个仍然完全不确定。这种不确定性就是我们的庇护所。Alice 每发送两个比特，她就可以安全地嵌入一个对 Eve 完全不可见的秘密信息比特。

如果 Eve 根本跟不上，也会产生类似的结构优势。如果她只能截获 Alice 传输的每 $k$ 个符号，那么 Alice 就可以利用中间的 $k-1$ 个符号作为与 Bob 的私有信道。秘密消息以一种对窃听者系统性不可见的方式编织在传输的结构中。在这些情况下，保密不是随机噪声的馈赠，而是巧妙设计的结果——将信息隐藏在对手的盲点中。这个想法可以进一步推进，例如，设计一些编码，使得合法接收者拥有一个更简单的设备，该设备“调谐”到消息，而窃听者看到的则是一个更复杂的信号，这个信号被他们自己信道的缺陷所掩盖。

知识也是力量。考虑一个场景，一个强大的干扰源用噪声淹没了电波。Alice 试图与 Bob 通话，而 Eve 试图窃听。现在，如果 Bob 拥有干扰信号的完美副本呢？他可以从他接收到的信号中数字减去它，就像戴着一副完美的降噪耳机。他能清晰地听到 Alice 的消息。而 Eve，由于缺乏这种完美的知识，只能部分地过滤掉干扰信号。对她来说，Alice 的消息仍然埋藏在残留的噪声中。在这里，Bob 对环境的卓越知识创造了信息优势。保密性不是由信道本身锻造的，而是源于对信道背景的特有理解。

这甚至可以应用于信道属性随时间变化的场景。想象一个信道在“公共”模式（所有人都能听到）和“私有”模式（只有 Bob 能接收到信号）之间随机切换。如果这种情况以某种概率发生，并且 Bob（而不是发送方）知道当前的状态，那么秘密只能在私有时刻发送。总体的保密容量就变得相当优雅，即信道处于安全、私有状态的平均时间比例。

连接世界：从工程阈值到量子前沿

所以，我们可以计算出一个数字，即保密容量。它在实践中意味着什么？它最重要的作用之一是在系统设计中，它提供了一个硬性的可行性阈值。想象一下需要向一个自主代理发送一个紧急命令：“待命”或“执行”。这些消息构成了一个具有一定熵 $H(S)$ 的信源，它衡量了其固有的信息内容。安全通信的基本定理指出，当且仅当信源熵小于信道的保密容量时，你才能可靠且完美保密地传输此消息： $H(S) < C_s$ 。这是你想要发送的消息与你必须通过的物理世界之间的一个深刻联系。它为工程师提供了一个明确的目标：为了保护“执行”命令，你必须设计一个系统，其中窃听者的信道噪声足够大，使得 $C_s$ 大于你信源的熵。抽象的公式变成了具体的设计规范。

也许这些思想最令人惊叹的应用是它们向量子领域的延伸。在这里，游戏规则完全改变了。安全优势不仅可以来自噪声或结构，还可以来自物理学的基本定律。在量子通信系统中，Alice 可以将她的经典比特 '0' 和 '1' 编码到不同的量子态中，然后这些量子态被物理地发送给 Bob 和 Eve。真正的魔力在于这些态的选择以及接收者执行的相应测量。

可以设计这样一个系统：Bob 对他的粒子执行一种量子测量，这使他能够完美地确定是发送了 '0' 还是 '1'。与此同时，Eve 接收到她的粒子，可能会选择一种不同的测量。由于量子纠缠和测量的性质，她选择的测量可能会产生与 Alice 的原始比特完全随机且不相关的结果。信息根本不存在让她看到。她与信源的互信息 $I(X;Z)$ 恰好为零！这并不是因为她的信道在经典意义上是嘈杂的；而是因为她寻求的信息被编码在量子态的一个属性中，而她的测量对此是根本“盲目”的。安全性由量子力学本身的定律所保证。保密容量公式 $C_s = I(X;Y) - I(X;Z)$ 仍然成立，但第二项由于没有经典模拟的原因而消失了。

从嘈杂房间里的耳语到遥远粒子的纠缠，保密容量的原则提供了一条统一的线索。它教导我们，完美的安全性不是一个神话般的绝对概念，而是一个相对且可以实现的目标。这是一个创造优势的故事——通过噪声，通过聪明才智，通过知识，或者通过现实的基本结构。它证明了一个简单的数学思想能够以最意想不到和最美丽的方式照亮和连接世界。