首页线性同余生成器 (LCG)

线性同余生成器 (LCG)

玻尔百科

定义

线性同余生成器 (LCG) 是计算机科学和数学领域中一种基础的伪随机数生成算法，它通过确定的线性递推公式产生数值序列。该生成器的质量由其周期长度决定，且常用于蒙特卡罗模拟以及通过转换方法生成正态分布等其他分布。由于其具有可预测性和格结构特征，线性同余生成器不适用于对安全性要求较高的加密场景。

核心要点

线性同余生成器（LCG）使用一个简单的确定性递推关系来创建伪随机数： $X_{n+1} \equiv (aX_n + c) \pmod m$ 。
生成器的质量由其周期长度决定，通过选择满足 Hull-Dobell 定理的参数 $a$ 、 $c$ 和 $m$ 可以最大化周期长度。
LCG 是蒙特卡洛模拟的基石，并可通过变换方法用于生成其他分布，如正态分布。
LCG 存在严重缺陷，包括使其不适用于密码学的可预测性，以及可能破坏空间模拟的晶格结构。

引言

随机性的幻象是现代计算的基石，为从视频游戏到复杂科学建模的一切提供动力。但是，确定性的机器是如何产生看起来混沌的序列的呢？本文深入探讨了线性同余生成器（LCG），这是最古老、最基础的伪随机数生成算法之一。我们将揭示驱动它的简单数学引擎，同时也将探讨其在科学和安全应用中可能导致严重错误的关键局限性和隐藏结构。我们的探索始于 LCG 的核心原理和机制，从其定义性的递推关系到获得长而有用的序列所需的条件。随后，我们将审视其多样的应用和跨学科联系，阐明其在蒙特卡洛模拟中的作用、其模拟复杂分布的能力，以及其固有的可预测性和幽灵般的晶格结构所揭示的警示故事。

原理与机制

在计算机中许多看似随机的过程（从视频游戏到科学模拟）的核心，都存在着一个惊人简单而优雅的数学机制。线性同余生成器（LCG）证明了复杂、类似随机的行为可以从一个确定性且极其简单的规则中产生。理解它，就如同掀开数字现实的引擎盖，一窥机器中的幽灵。

宇宙时钟：一个简单的随机性配方

想象一个时钟，但不是你墙上的那种。这个时钟的表面有巨大的刻度数，比如说有 $m$ 个，编号为 $0, 1, 2, \ldots, m-1$ 。这个时钟的指针并非一次移动一格。相反，它会以一种奇特的方式从当前位置向前跳跃。首先，它的当前位置乘以一个“拉伸”因子 $a$ 。然后，通过加上一个值 $c$ 给它一个额外的“推动”。此时，指针可能指向一个远超钟面的数字。神奇之处就在于：时钟的机制知道，一旦超过 $m-1$ ，就会立即回到 $0$ 。这种“回弹”是由模运算完成的。

这整个过程被一个单一、紧凑的公式所概括，这就是 LCG 的核心：

$X_{n+1} \equiv (aX_n + c) \pmod m$

在这里， $X_n$ 是指针的当前位置（即我们生成器在第 $n$ 步的状态），而 $X_{n+1}$ 是它的下一个位置。数字序列 $X_0, X_1, X_2, \ldots$ 就是我们的伪随机数流。之所以称之为“伪”随机，是因为正如你所见，它没有任何真正随机的成分。如果你知道参数 $a$ 、 $c$ 、 $m$ 和起始位置 $X_0$ （即种子），你就可以完美准确地预测整个序列。

让我们看看这个时钟机制的实际运作。想象一个玩具生成器，我们设置 $m=100$ ，乘数 $a=13$ ，增量 $c=27$ ，并以种子 $X_0 = 42$ 开始。下一个数通过计算 $13 \times 42 + 27 = 573$ 得出。为了找到这个数在我们有100个刻度的钟面上的位置，我们需要看它绕了多少圈。 $573$ 是 $5$ 个完整的 $100$ 再加上额外的 $73$ 。所以， $X_1 = 73$ 。由此，我们计算下一步： $13 \times 73 + 27 = 976$ ，绕回后落在 $76$ 。序列继续下去： $X_2 = 76$ ， $X_3 = 15$ ， $X_4 = 22$ ，依此类推。这些数字的跳跃方式乍一看似乎是杂乱无章的。这便是简单的随机性幻象。

大循环：对最长周期的追求

一个关键问题随之而来：这个生成器在数字序列开始重复之前能运行多久？这个长度被称为周期。要使生成器有用，我们希望其周期长得惊人。如果你在模拟天气，你不会希望“随机”的阵风每隔一千步就重复一次。

LCG 可能的最长周期等于其模数 $m$ 。达到这个周期的生成器称为满周期生成器。对于任何起始种子，它都会在循环重复之前，恰好遍历一次从 $0$ 到 $m-1$ 的每一个数。但我们如何构建这样一个完美的时钟呢？事实证明，并非任何 $a$ 和 $c$ 的选择都可以。参数 $a$ 、 $c$ 和 $m$ 之间的关系必须满足一组特定条件，这一结果被 Hull-Dobell 定理 优雅地概括。

对于计算中最常见的情况，即模数 $m$ 是 2 的幂（如 $m = 2^{32}$ 或 $m=2^{64}$ ），条件出奇地简单和直观：

增量 $c$ 必须是奇数。这起到了一个关键的“推动”作用，确保生成器可以在偶数和奇数之间跳转。如果 $c$ 是偶数，而我们从一个偶数种子开始，一个偶数乘数会让我们永远停留在偶数领域，将我们可能的状态减半。一个奇数 $c$ 则保证我们可以遍历整个集合。
乘数必须满足 $a \equiv 1 \pmod 4$ 。这个条件更为微妙，植根于关于模2的幂的整数的深层数论。它实质上确保了乘数的“拉伸”作用不会意外地将序列瓦解成更短的子循环。这是一种精细的调整，保证了对所有 $m$ 个状态的“大巡游”。

通过遵守这些规则，我们可以设计出具有巨大周期的生成器。对于一个48位生成器，例如许多系统上标准 drand48 函数中使用的那个，我们可以选择 $m = 2^{48}$ ，一个合适的 $a$ （如 $a=25214903917$ ，它满足 $a \equiv 1 \pmod 4$ ），以及一个奇数 $c$ （如 $c=11$ ），从而达到 $2^{48}$ 的满周期。这个数字超过281万亿；一台每秒生成十亿个数字的计算机需要三天多的时间才能完成一个周期。

对于大多数应用，我们不想要巨大的整数，而是希望得到介于 $0$ 和 $1$ 之间的随机数。我们通过简单地归一化整数输出来得到它们： $U_n = X_n / m$ 。对于我们的48位生成器，这会在一个离散的网格上产生数字，它们之间可能的最小非零间距为 $1/m$ ，即 $2^{-48}$ 。这个微小的间距是生成器的分辨率。

晶体中的裂痕：可预测性与晶格结构

我们已经构建了一台宏伟的机器，能够产生庞大且看似混沌的数字序列。但现在，让我们仔细看看。就像一颗看似无瑕的钻石，LCG 具有内部结构——其晶体般完美中的裂痕——在仔细审视下变得显而易见。

第一个也是最明显的缺陷是其可预测性。LCG 中的“L”代表“线性（Linear）”，这是其在安全方面的阿喀琉斯之踵。由于其底层关系是一个简单的线性方程，如果攻击者观察到生成器连续的几个输出，他们就可以解出“秘密”参数 $a$ 和 $c$ 。只需三个输出，比如 $X_0, X_1, X_2$ ，就可以建立一个包含两个线性方程的方程组： $X_1 \equiv aX_0 + c \pmod m$ $X_2 \equiv aX_1 + c \pmod m$ 用第二个方程减去第一个方程可以巧妙地消去 $c$ ，留下一个只含有一个未知数 $a$ 的方程。一旦求出 $a$ ， $c$ 也就迎刃而解。秘密参数一旦泄露，序列的整个过去和未来就都为人所知。这一特性使得 LCG 极不适用于密码学应用，例如生成密钥或一次性密码本。

第二个缺陷更为微妙和深刻，被称为晶格结构。如果你将 LCG 的连续输出作为坐标在空间中绘制点——例如，在一个正方形内绘制点对 $(U_n, U_{n+1})$ ——这些点并不会像随机喷洒的油漆那样均匀地填充空间。相反，它们会落在数量惊人地少的平行线上，就像晶格一样。在三维空间中，它们位于平面上；在更高维度中，它们位于超平面上。对于一个盒子中气体粒子的模拟来说，这是一场灾难。粒子将无法去到任何地方；它们可能的位置会被限制在这个看不见的晶体结构上，从而产生虽微妙但重大的错误。

对于使用2的幂为模数的 LCG，这种晶格问题在其低位比特上尤其可怕。在一项优美而具颠覆性的数学分析中可以证明，随机数的各个比特位并非同等随机。一个模为 $m=2^w$ 的满周期 LCG，其最低有效位的周期仅为 2；它只是来回翻转： $0, 1, 0, 1, 0, 1, \ldots$ 。下一位的周期为 4。第 $k$ 位的周期为 $2^{k+1}$ 。这意味着低位比特的“随机性”完全是个骗局，一个隐藏在众目睽睽之下的僵硬、短周期模式。这就是为什么现代科学代码通常更偏爱使用大素数模数的生成器，只要乘数经过极其谨慎的选择，这类生成器往往在所有维度上都表现出更好的晶格行为。

实现的艺术：整数、浮点数与测试

懂理论是一回事；构建一个能用的生成器是另一回事。一个常见的陷阱是尝试直接使用浮点数来实现 LCG 递推，比如 U_next = frac(a * U_current + c)。这是一个可怕的错误。浮点数的世界是一个充满舍入误差的世界。每一次乘法和加法都可能引入微小的、会累积的不精确性。这些误差会破坏模运算的完美数学结构。本应不同的状态可能会发生碰撞，周期可能急剧缩短，你精心设计的优美长周期也可能消失殆尽。实现 LCG 的唯一稳健方法是使用精确整数算术执行所有计算，利用 C 等语言中无符号整数类型的明确回绕行为，并且仅在最后一步将整数结果 $X_n$ 除以 $m$ 转换为浮点数。

最后，我们如何确信一个生成器是好的呢？我们测试它。我们将其输出流进行一系列统计检验，每一项检验都旨在探查特定类型的非随机性。其中一个优雅的检验是生日间距检验。其思想是生成一组随机数，将它们缩放到一个大范围内，然后观察它们排序后的“间距”。对于一个真正随机的序列，得到相同间距的次数应该遵循一个已知的统计分布（泊松分布）。如果一个生成器产生过多的间距碰撞——这是聚集或过度规律性的标志——它就通不过这项检验。

因此，LCG 在计算史中是一个引人入胜的角色。它简单、快速，并且能够产生长度巨大的序列。然而，其确定性的线性和底层的晶体结构是其根本局限。理解其优点和其优美的缺陷，是欣赏由它所启发的更深、更复杂、更强大的随机数生成方法的第一步。

应用与跨学科联系

在窥探了线性同余生成器的时钟般的核心之后，我们可能会倾向于将其视为一个虽简单但迷人的数学玩具。一台产生数字序列的确定性机器——还有什么比这更直接了当的呢？然而，仅止步于此，就好比只见一粒沙而错过了整个海滩、海洋及其中的万千世界。这个不起眼的 LCG 不仅仅是一个奇物；它是现代科学技术巨大引擎中的一个基础齿轮。它的简单既是其优点，也是其弱点，在其应用的故事中，我们发现了一场关于发现、壮观失败和深刻洞见的宏大戏剧。

数字盒子里的世界：模拟与蒙特卡洛方法

科学中最强大的思想之一是，如果你无法用纯粹、优雅的数学解决一个问题，你通常可以用计算来强行攻克它。这就是蒙特卡洛方法的精髓：你一遍又一遍地模拟一个过程，使用随机数进行概率选择，然后对结果进行平均，以近似真实世界的结果。

想象一个简单、近乎童趣的谜题：赠券收集者问题。你购买麦片盒，每盒包含 $n$ 种不同赠券中的一种。你期望购买多少盒才能集齐所有赠券？虽然我们可以为此推导出一个优美的公式，但我们也可以对其进行模拟。我们可以编写一个 LCG 程序来充当我们的麦片盒开启器，在每一步生成一个从 $0$ 到 $n-1$ 的数字。通过运行数千次此模拟并平均所需的“盒子”数量，我们可以得出一个对真实期望值的估算，其精确度惊人。这就是 LCG 最基本的作用：一个不知疲倦的骰子投掷者，一个探索由机遇主导的“如果……会怎样”情景的引擎。

但我们能模拟的远不止收集赠券。我们可以构建整个数字世界。思考一场流行病的传播。我们可以将一个人口建模为一个由易感者、感染者和康复者组成的人际网络。在我们模拟时钟的每一次滴答声中，我们的 LCG 做出关键的决定。对于一个感染者，我们问生成器：疾病会传播给你的邻居吗？对于一个病人，我们问：你在这个时间步内会康复吗？每个决定都只是一个比较：来自我们 LCG 的随机数是否小于传播概率 $\beta$ 或康复概率 $\gamma$ ？通过将数百万个由 LCG 驱动的简单事件串联起来，我们可以在计算机内观察一场流行病的展开，看到高峰的形成与消退，并估算最终的死亡人数。

同样的原理让我们能够深入探索生命密码的核心。在计算生物学中，Wright-Fisher 模型模拟了基因频率如何因随机机会而在代际间发生变化，这个过程被称为遗传漂变。在一个小种群中，一个等位基因（基因的一个变体）可能被“固定”（达到100%频率）或完全消失。我们的 LCG 再次扮演了命运的角色，决定哪些等位基因被传递给下一代。然而，在这里我们遇到了第一个引人深思的警示故事。如果我们的 LCG 质量很差，周期很短，会怎么样？“随机”数字序列开始重复。生成器中的这种确定性重复给生物过程强加了一种虚假的、非随机的模式。等位基因频率不再随机游走，而是被锁定在一个重复的路径上，导致它以远超应有速度的速度趋向固定或消失。模拟产生了一个结果——过早的等位基因固定——这不仅在数值上是错误的，而且在生物学上也是错误的。我们简单的数字生成器中的缺陷导致我们得出了一个完全错误的科学结论。我们随机性的质量不仅仅是一个技术细节；它关乎科学真理。

塑造随机性：从均匀到普适

LCG 本质上产生整数，经过缩放后，这些整数近似于一个均匀分布——原则上，范围内的每个数都是等可能的。但世界并非均匀随机的。身高、测量误差以及无数其他自然现象都遵循正态分布那优美的钟形曲线。我们这个简单的、平坦均匀的生成器如何能产生如此结构化和特定的形状呢？

答案在于一种近乎神奇的优雅技术：变换随机数本身。其中最著名的方法之一是 Box-Muller 变换。它从我们的 LCG 中取两个独立的均匀分布数 $U_1$ 和 $U_2$ ，并对它们应用一个涉及对数、平方根、正弦和余弦的精确数学配方。公式是 $Z_1 = \sqrt{-2 \ln U_1} \cos(2\pi U_2)$ 和 $Z_2 = \sqrt{-2 \ln U_1} \sin(2\pi U_2)$ 。结果是两个新数 $Z_1$ 和 $Z_2$ ，它们完全独立且完美地服从正态分布。这是一场令人惊叹的数学炼金术，将均匀分布的“铅”变成了正态分布的“金”。

这个原理是普适的。通过逆变换采样这一通用方法，任何我们可以写出其累积分布函数（CDF）的概率分布都可以被模拟。我们 LCG 产生的均匀分布是原始的黏土，我们可以用它塑造出任何我们想要的随机形状。它是一块通用的画布，所有其他形式的随机性都可以在上面描绘。

机器中的幽灵：可预测性与幻影结构

现在我们来探讨 LCG 最深层、最迷人也最危险的秘密。因为它是一台确定性的机器，所以它的随机性是一种幻象。也许是一种美丽的幻象，但这种幻象是可以被打破的。

考虑随机化快速排序（Randomized Quicksort），一种用于数据排序的基石算法。其著名的速度依赖于在每个阶段“随机”选择一个枢轴元素。但如果这个“随机”选择是由一个其参数为对手所知的 LCG 做出的，会怎么样？那么对手就可以计算出算法将要使用的完全相同的数字序列。他们可以在算法开始之前就预测出每一次枢轴的选择。利用这些信息，他们可以构造一个特殊的、恶意的输入数组。这个数组的排列方式恰好使得算法选择的每个枢轴都是最差的那个（例如，最小或最大的元素）。这个“随机化”算法，其选择被完美预测，被迫进入其病态的最坏情况性能，从飞快的 $O(n \log n)$ 慢到爬行般的 $O(n^2)$ 。随机性的幻象被打破，算法的安全性也受到了损害。

一个更微妙、更幽灵般的缺陷是 LCG 臭名昭著的晶格结构。虽然一个好的 LCG 生成的一维数字序列看起来非常均匀，但连续数字组成的数对、三元组和更高维度的元组并非真正独立。例如，点 $(U_i, U_{i+1})$ 并不会均匀地填充单位正方形。相反，它们被限制在少数固定的平行线上。在三维空间中，点 $(U_i, U_{i+1}, U_{i+2})$ 位于一组平面上。这种隐藏的晶体结构就是“机器中的幽灵”。

对于许多应用来说，这无关紧要。但对于空间过程的模拟，这可能是灾难性的。想象一下模拟一个二维随机游走，其中每一步我们行走者的方向都由一对 LCG 输出决定。如果 LCG 有缺陷，比如臭名昭著的 RANDU 生成器，那么行走者就不能自由漫步。它的步伐被底层的晶格秘密地约束着。它不是在平面上各向同性地探索，而是表现出对某些方向的奇异偏好，其路径描摹着生成器结构的幻影线。

其影响可能更加戏剧化。让我们尝试模拟一个螺旋星系的形成，那是一种惊心动魄的美。我们的模型规定，恒星更有可能沿着优雅的对数螺线臂形成。我们使用 LCG 来为新恒星提议随机位置。如果我们使用一个好的生成器，一个美丽、旋转的星系就会从模拟中浮现。但如果我们使用 RANDU，就会发生可怕的事情。在优美的螺线臂之上，我们会看到丑陋的、人为的“辐条”——那些本不该存在的径向恒星线。这些辐条是生成器隐藏的三维晶格平面在我们模拟宇宙上的直接投影。机器中的幽灵已经显现，在我们的星系上绘制出了幻影结构。

为现代驯服这头野兽

这些故事不仅仅是历史上的奇闻轶事。它们教导我们如何明智地使用这些简单的生成器。关键在于极其谨慎地选择参数 $(a, c, m)$ ，并在深层数论的指导下，确保晶格结构尽可能精细。

此外，以拥有数千个处理核心的图形处理单元（GPU）为代表的并行计算时代，提出了一个新的挑战。我们如何为数千个处理器中的每一个提供其自己的随机数流？一种天真的方法，比如给核心 $t$ 种子 $x_0 + t$ ，是灾难性的。研究表明，对于许多常见的 LCG，这样做会导致流的低位比特高度相关。例如，一个流的最低有效位可能是下一个流的完全相反——这完全违背了独立性。

正确的解决方案和 LCG 本身一样优雅。它被称为“跨步法”（leapfrogging）。我们将 LCG 视为一个单一的、巨大的数字序列。我们将第一个数给线程 0，第二个数给线程 1，...，直到线程 $p-1$ 。然后，我们将第 $p$ 个数给线程 0，第 $(p+1)$ 个数给线程 1，依此类推。每个线程接收到一个“抽取”出的子序列。为了高效地做到这一点，我们再次使用模运算的魔力。我们可以推导出一个新的类似 LCG 的公式，使我们能够在一个计算步骤中，在原始序列中“跳跃”前进 $p$ 步。这使得数千个线程可以并行工作，每个线程生成一个可证明与其他线程独立的子序列，所有子序列都来自同一个被充分理解的主序列。

从一个简单的递推关系出发，我们穿越了蒙特卡洛模拟、进化生物物理学、算法安全性、计算天体物理学的幻影，以及高性能计算的前沿。线性同余生成器远不止是一台简单的机器。它是一个镜头，通过它我们可以理解随机性、可预测性的本质，以及计算机的确定性世界与其试图模仿的概率性世界之间的微妙舞蹈。它证明了我们最简单的数学发明所产生的深远且往往令人惊讶的连锁反应。