随机系统

玻尔百科

核心要点

随机系统由其状态空间和时间索引定义，为描述由规则和随机性共同支配的现象提供了一个框架。
延迟坐标嵌入等几何技术可以区分真正的高维随机性与确定性混沌的复杂但结构化的行为。
噪声是一种创造性力量，可以塑造系统的概率景观，引发在确定性模型中看不到的质变（分岔）。
分析噪声数据中方差和自相关性上升等统计特征，为即将发生的系统性转变提供了关键的预警信号。

引言

在一个通常由精确的确定性定律（从行星的轨道到球的轨迹）所描述的世界里，存在着一个同样重要、由机遇主宰的广阔领域。许多系统，从股票的价格到基因的表达，并非遵循单一、可预测的路径，而是在一个充满可能性的景观中演化。理解这些“随机系统”是现代科学的巨大挑战与辉煌成就之一。本文旨在填补对随机性的简单承认与真正掌握其内在结构和力量之间的鸿沟，为描述机遇扮演主角的系统所使用的语言和逻辑提供基础性理解。

在本文中，我们将开启一段分为两部分的旅程。在第一章原理与机制中，我们将剖析随机过程的基本语法，探索如何对其进行分类，什么能确保其内部一致性，以及如何区分真正的随机性与复杂的确定性行为。我们将深入探究在一个充满噪声的世界中稳定与变化的本质。随后，在应用与跨学科联系一章中，我们将把这些抽象原理付诸实践。我们将看到随机模型在设计互联网路由器、训练人工智能、理解细胞的噪声生命，甚至预测流行病和金融危机方面都是不可或缺的。我们的旅程始于为随机性核心带来秩序的核心原理。

原理与机制

谈论随机系统，就是谈论一个故事。它不像炮弹的轨迹那样是一个单一、预先设定的故事，而是一个由可能故事组成的宇宙，每个故事都有其曲折，由固定规则和不可预测的机遇混合支配。本章的目标是理解这些故事的语法——即赋予它们结构和意义的基本原理。我们不只是罗列定义，而是要踏上一段旅程，去看看几个简单的思想如何构建一个框架，用以理解从花粉粒的抖动舞蹈到股票价格的波动等一切事物，从而揭示隐藏在随机性核心深处的美丽秩序。

一个充满可能性的宇宙：状态空间与时间

让我们从可以对任何系统提出的最基本问题开始：什么能够发生，以及何时能够发生？这两个问题的答案为我们提供了任何随机过程的基本构建模块。

想象你正在观察一个交通信号灯。这个灯可以是什么状态？它可以是红、黄或绿。仅此而已。这个所有可能状态的集合， $\{\text{红, 黄, 绿}\}$ ，就是我们所说的状态空间。它是系统可以占据的所有可能“状态”的集合。对于交通灯而言，状态空间是离散的——你可以用手指头数清所有可能性。在其他情况下，状态空间可以是连续的。如果你正在监测一个房间的温度，它可能是 $20.1^{\circ}\text{C}$ 、 $20.11^{\circ}\text{C}$ ，或是一个连续范围内的任何值。

接下来，我们何时进行观察？如果你有交通灯的连续视频流，你可以在任何时间瞬间检查它的状态—— $t=1.5$ 秒、 $t=\pi$ 秒，等等。你观察的时间集合就是索引集。在这种情况下，它是一个实数的连续区间，所以我们称之为连续时间过程。但如果你每30秒才检查一次灯的状态呢？那么你的索引集就是离散的： $\{0, 30, 60, 90, \dots\}$ 。这将是一个离散时间过程。

这两个特征——状态空间的性质和索引集的性质——为我们提供了一种简单而强大的方法来对任何随机过程进行分类：

离散时间、离散状态： 想象每分钟掷一次骰子。结果是离散的（1-6），时间也是离散的。
离散时间、连续状态： 在实验室里测量精确温度，但每小时只测量一次。状态（温度）是连续的，但时间点是离散的。
连续时间、离散状态： 建模在服务器队列中等待的顾客数量。顾客数量是整数（ $0, 1, 2, \dots$ ），但顾客可以在任何瞬间到达或离开。
连续时间、连续状态： 追踪股票价格，它可以在任何时刻变化，并且（理论上）可以取某个范围内的任何值。

一旦我们有了状态空间和索引集，我们就可以讨论样本路径。一个随机过程是所有可能未来的完整集合，是整个“故事的宇宙”。而样本路径，或称实现，只是其中一个上演的故事。如果我们连续四小时测量实验室温度，随机变量的集合 $\{X_0, X_1, X_2, X_3\}$ 就是这个过程。一个具体的读数序列，如 $(20.8, 20.9, 21.1, 20.9)$ ，就是一条样本路径。它是从无限可能性领域中抽取出来的一个单一、凝固的叙事。

随机性的内在一致性

人们很容易认为随机过程只是一堆不相关事件的杂乱组合。但这完全不对！一个真正的随机过程具有深刻的内部一致性，一种将其过去、现在和未来联系在一起的隐藏统一性。

思考一个过程的最深刻方式之一，不是将其看作每个时间点的独立随机变量的集合，而是将其视为一个单一的实体：一个随机函数。想象一顶巨大的宇宙帽，里面装满了无限数量的可能“路径”或“历史”。一个随机过程就是你伸手进去只抽取出其中一条路径时发生的事情。你抽出的那条路径就是样本路径，一个完整的时间函数。

这个观点立即引出了一个被称为一致性条件的关键要求，它由伟大的数学家 Andrey Kolmogorov 正式提出。简单来说，这意味着在不同时间支配系统的统计规则必须相互一致。

假设你有一个规则描述了中午时温度为某一特定值的概率（我们称这个分布为 $\mu_{(12:00)}$ ），以及另一个规则描述了中午和下午1点温度的联合概率（称之为 $\mu_{(12:00, 1:00)}$ ）。为了使这些规则描述一个单一、连贯的过程，必须满足一个简单的关系：如果你采用中午和下午1点的联合规则，并“忽略”下午1点发生的情况（通过对所有可能性求和或积分），你绝对必须得到你原先为中午单独设定的规则。边际分布必须与低维分布相匹配。

如果它们不匹配，你得到的就是一团不一致的混乱，而不是一个随机过程。例如，假设有人告诉你 $t=0$ 时的温度服从均值为 $0$ 的标准正态分布，但又告诉你 $t=0$ 和 $t=1$ 时温度的联合分布，其在 $t=0$ 处的边际分布均值为 $1$ 。这是一个矛盾！。没有任何一个“故事”能够同时满足这两个规则。Kolmogorov扩展定理告诉我们，只要这种一致性对所有可能的时间点组合都成立，我们就可以确定存在一个定义明确的故事宇宙（一个概率空间），我们的样本路径就是从中抽取的。这是将随机宇宙维系在一起的粘合剂，确保它是一个有序的宇宙，而不是一片混沌。

这是随机性，还是仅仅复杂？

我们生活在一个充满波动的、不可预测的数据的世界里。但每一个不规则的信号都真的是随机的吗？20世纪确定性混沌的发现告诉我们，非常简单、确定性的规则可以产生极其复杂的行为，以至于肉眼看来就像是随机的。那么，如果一个实验者给你一个时间序列，你如何判断它来自一个“低维确定性”源（如混沌摆）还是一个“高维随机性”源（如电阻中的热噪声）？

令人惊奇的是，有一个优美的几何技巧通常可以区分这两者，称为延迟坐标嵌入。这个想法出奇地简单。从你的单一数据流，比如 $x(t)$ ，你在一个更高维度的空间中创建一系列点。例如，对于一个三维嵌入，每个点将是 $\vec{v}(t) = (x(t), x(t+\tau), x(t+2\tau))$ ，其中 $\tau$ 是某个固定的时间延迟。你正在利用数据自身的过去和未来来构建一个更丰富、多维的自我画像。

当你绘制这些点时会发生什么？

如果数据来自一个低维确定性系统（即使是混沌系统），这些点会描绘出一个独特、复杂但结构化的物体。随着你增加嵌入维度 $d$ ，这个物体会伸展和展开，直到突然之间，它的形状停止变化。你揭示了系统的吸引子，即其动力学的几何核心。这些点被限制在一个美丽的、错综复杂的结构上，其维度远低于它们被绘制的空间维度。
如果数据来自一个高维随机过程，则不会出现这样的结构。这些点会看起来像一团弥散、无形的云。随着你增加嵌入维度 $d$ ，这团云只会填满新的、更大的空间。它永远不会坍缩到一个更简单的几何物体上。

这项技术就像一个数学棱镜。它取一道一维的数据光线并将其展开，揭示它究竟是包含了一个确定性结构的隐藏有序光谱，还是仅仅是纯粹、高维噪声的均匀白光。

随机演化的多种类型

一旦我们确信我们正在处理一个随机系统，我们就会发现“随机性”本身有许多不同的类型。这些过程的多样性和丰富性，就如同它们所描述的现象一样。

也许最著名和最基础的是维纳过程，或称布朗运动。它是连续时间、连续状态随机性的典范模型。它描述了花粉粒在水中因与水分子无数次随机碰撞而产生的狂乱、抖动的舞蹈。在其“标准”形式 $W_t$ 中，它从零开始，并具有与其正态分布增量相关的特定统计特性。美妙之处在于，许多更复杂的过程只是这个主题的简单变体。例如，一个描述股票价格的过程可能有一个总体的上升趋势（漂移， $\mu$ ）和一定的波动水平（扩散系数， $\sigma$ ）。由此产生的过程，即带漂移的布朗运动，形式为 $X_t = x_0 + \mu t + \sigma W_t$ 。通过简单地减去确定性趋势并重新缩放， $Y_t = (X_t - x_0 - \mu t)/\sigma$ ，我们就恢复了原始的、通用的标准维纳过程 $W_t$ ！。这是科学中一个反复出现的主题：复杂的现象往往只是穿着不同外衣的简单、普适的定律。

随机性的来源也可能比你想象的更微妙。考虑一个马尔可夫链，其中转移到下一个状态的概率仅取决于当前状态。如果这些概率本身随时间变化会怎样？只要它们如何变化的规则是确定性的且已知的——比如说，赌场根据一个固定的时间表每小时改变一次老虎机的赔率——这个系统本质上仍然是随机的。在每一步，结果都是不确定的，即使不确定性的规则是可预测的。

现在来看一个真正令人费解的想法：如果随机性不是通过对状态的随机“踢动”进入，而是通过时间的随机“流动”进入呢？想象一个完全确定性的系统，比如一个钟表机械装置，根据一个简单的微分方程演化。这是一个连续时间的确定性系统。现在，让我们不是用标准时钟来观察这个系统，而是用一个不可预测地加速和减速的“随机时钟”。我们在物理时间 $t$ 看到的状态，是这个钟表装置在其自身运行时间 $\tau(t)$ 时的状态，其中 $\tau(t)$ 本身就是一个随机过程。结果呢？在物理时间中观察到的系统，变成了一个连续时间的随机系统！。这个惊人的概念，称为从属，表明随机性不仅可以源于发生了什么，还可以源于它何时发生。

边缘上的生命：稳定性与突变

最终，我们常常想知道一个系统的长期命运。它会稳定下来吗？它会爆炸吗？它会突然改变其特性吗？对于随机系统，这些关于稳定性和变化（分岔）的问题，远比它们的确定性对应物更微妙和有趣。

在确定性世界里，平衡点的稳定性是直截了当的：如果你从它附近开始，你会停留在附近，并最终返回到它吗？在随机世界里，我们必须更仔细地提出这个问题。一个系统“收敛到零”意味着什么？有几种截然不同的可能性：

依概率收敛： 随着时间的推移，发现系统远离零的可能性变得越来越小。处于平衡点任何小邻域之外的概率趋于消失。
几乎必然收敛： 在开始之前任选一条样本路径。这条特定路径最终将收敛到零的概率为1。这是一个关于单个轨迹的更强的陈述。
均方收敛： 离平衡点距离的平方的平均值趋于零。这是一个关于所有可能路径整体的平均行为的陈述。

这些并不相同！几乎必然收敛意味着依概率收敛。均方收敛也意味着依概率收敛。但你可以有几乎必然收敛而没有均方收敛。想象一个几乎总是趋于零的过程，但有很小的概率产生一个巨大的、剧烈的尖峰。这些罕见的尖峰可能不影响“几乎必然”收敛，但它们可能使平方距离的平均值永远无法达到零。要驾驭随机世界，我们必须精确地说明我们指的是哪种稳定性。

这种丰富性也延伸到系统如何变化。在确定性系统中，分岔是随着参数调整而发生的行为质变——例如，一个稳定的不动点可能变得不稳定。在随机系统中，出现了纯粹由噪声驱动的新现象：

现象学（P-）分岔是长期统计景观，即平稳概率分布形状的质变。想象一个只有一个山谷的景观（单峰分布）。当你调整一个参数时，噪声可能会开辟出第二个山谷，从而在一个先前只有一个偏好状态的地方创造出一个双稳态系统（双峰分布）。这甚至可能在原始的确定性山谷从未失去其局部稳定性的情况下发生！
动力学（D-）分岔是轨迹本身稳定性的变化，通常以系统的最大李雅普诺夫指数从负（稳定、收敛的路径）变为正（不稳定、发散的路径，混沌的标志）为标志。

关键的洞见是，在一个嘈杂的世界里，这两个事件——景观的变化和局部稳定性的变化——是不同的，并且不必同时发生。噪声不仅仅是覆盖在确定性骨架上的一层恼人的绒毛。它是一种强大的、创造性的力量。它可以塑造概率景观，创造和摧毁状态，并以一种在没有机遇的世界中没有对应物的方式，从根本上改变一个系统的特性。理解这些原理是理解我们周围那个动态、不断变化且结构深邃的随机世界的关键。

应用与跨学科联系

既然我们已经学会了机遇游戏的规则，即系统不是像钟表机械那样确定地演化，而是像掷骰子一样按概率演化，那么就让我们看看这个游戏在哪里上演。你可能会惊讶地发现，它无时无刻不在发生。随机系统的框架并非某个深奥的数学分支；它是描述我们世界的基本语言，从数字信息的无形交流、活细胞的内部运作，到我们经济和气候的宏大模式。让我们穿越这些多样化的领域，看看同样的基本原理以不同的面貌发挥作用。

构建一个抖动的世界：从互联网到人工智能

我们的现代世界依赖于信息的流动，而这种流动本质上是随机的。考虑一个数据包在智能家居设备或互联网路由器中的旅程。数据包在不可预测的时间到达，排队等待处理。在任何给定时刻队列中的数据包数量 $N(t)$ 是一个随机变量。我们可以观察它在连续时间内的变化，但它的值——数据包的数量——总是一个整数。这是一个完美的连续时间、离散状态随机过程的例子。

深入研究互联网路由器的设计，可以揭示一个优美而微妙的区别。一个简单的路由器可能采用“尾部丢弃”策略：如果数据包在缓冲区满时到达，它就被丢弃。这个规则是完全确定性的。如果你知道所有数据包的精确到达时间，你就能确定地预测哪些会被丢弃。在这里，输出（被丢弃的数据包）的随机性完全来自输入（到达时间）的随机性。但现代路由器更为复杂。它们使用像随机早期检测（RED）这样的策略，即在队列积压时，远在缓冲区满之前，路由器就开始概率性地丢弃数据包。通过这样做，它向网络发出拥塞信号。在这种情况下，路由器的决策过程本身就涉及掷骰子。该系统不再是一个被喂入随机输入的确定性机器；它是一个内在随机系统。

这种数字世界的嘈杂延伸到了我们的社交生活。一个新社交媒体平台上的用户数量可以被建模为一个离散时间、离散状态过程。每天（一个离散时间步），一部分现有用户可能会离开，而随机数量的新用户加入，或许遵循泊松分布。通过理解其内在的概率，我们无法预测第100天的确切用户数，但我们可以预测可能结果的分布。

也许数字领域最具变革性的应用是在人工智能领域。驱动现代机器学习的引擎通常是一种称为随机梯度下降的算法。想象一个人工智能试图通过调整其神经网络中数百万个内部“权重”来学习识别图像。数据总量是巨大的。该算法不是一次性根据所有数据计算出完美的调整（这在计算上是 prohibitive 的），而是走了一条捷径。在每一步，它会抓取一个随机选择的小批量数据，并仅根据该样本进行调整。这使得学习过程成为一个随机过程：网络权重在广阔的可能配置空间中所走的路径是一次随机游走。这种随机性是一个特性，而非一个缺陷。它使算法能够高效地探索解空间，并帮助它逃离“局部最小值”——那些从有限视角看像是好解的坏解。

生命之舞：从基因到生态系统

如果说随机性在我们设计的系统中是一个有用的工具，那么它在生命世界中则是一个不可否认的内在特征。几十年来，生物学家使用平滑的、确定性的微分方程来模拟细胞内的化学反应。这些模型描述了分子的平均浓度，并且在有数万亿参与者的试管中效果很好。但一个活细胞不是一个巨大的试管。随着能够窥视单个细胞的技术的出现，科学家们发现了一个惊人的事实：在相同环境中的相同细胞表现出极大的多样性。这种被称为“基因表达噪声”的现象，迫使生物学发生了一次范式转变。当一个基因被转录时，它可能只产生少数几个信使RNA分子。这些少数分子的产生和降解的随机时间点，导致了所产生蛋白质数量的巨大波动。确定性的平均值对于单个细胞的生命几乎说明不了什么。要理解生命，你必须理解随机性。

这个原理可以扩展到整个生态系统。考虑一条河流中的鲑鱼种群。下一代的成年鱼数量与当前代的产卵者数量有关。我们可以写下一个简单的确定性函数来捕捉这种潜在趋势——即系统的“确定性骨架”。但真实的种群规模受到自然界反复无常的影响。一个比平均温度高的冬天、一次突然的藻类大量繁殖，或是一场干旱，都是随机的环境因素。这些冲击，我们可以用随机过程 $\{\epsilon_t\}$ 来表示，它们在任何一年里都倍增了种群的成功或失败。真实种群的轨迹是一个随机过程，是围绕确定性趋势线的一场活泼而不可预测的舞蹈。

有时，这场舞蹈可能导致剧烈而突然的变化。正是在这里，随机系统理论的预测能力变得至关重要。想象一种新的人畜共患病毒，比如一种新型冠状病毒，正在从动物宿主传播到人类群体中。最初，我们只看到零星的、会自行消亡的病例。但病毒可能在进化，在人与人之间传播的能力越来越强。它的基本再生数 $\mathcal{R}_0$ 正在悄悄逼近1这个临界阈值。如果它越过这个阈值，系统将经历一次“状态转换”，从零星的溢出事件转变为自我维持的流行病。

我们能预见到这一切吗？令人难以置信的是，随机动力系统理论说“能”。当一个系统接近这样一个临界点时，它会表现出一种被称为临界慢化的普遍行为。它变得不那么有弹性，从小的随机扰动中恢复所需的时间要长得多。通过分析病例数的时间序列，我们可以检测到这种即将发生的转变的两个明显特征：

方差上升：系统的波动变得更加剧烈。同样小的来自环境的随机推动会引起病例数更大的波动。
自相关性上升：系统产生了“记忆”。今天的病例数对明天的病例数的预测性越来越强。系统的状态变得迟缓，对变化有抵抗力。

这是一个深刻的洞见。数据中的“噪声”本身，曾经可能被当作麻烦而被丢弃，现在却包含了关键的信号。这些预警指标提供了一种有理论依据的方法来预测临界转变，不仅在流行病学中，在生态系统、金融市场和气候中也是如此。

驯服未来：预测、调控与控制

理解世界的随机性使我们不仅能够描述它，还能预测、调控甚至控制它。以天气预报为例。支配大气的物理定律是确定性的。然而，我们对大气当前状态的测量总是不完美和不完整的。为了解释这种初始不确定性，气象学家不是运行一个模拟，而是运行一个由数十个模拟组成的“集合”。每个模拟都从一个与我们的观测一致、但略有不同的随机扰动初始条件开始。每次运行都遵循其自身的确定性路径，但所有路径的集合形成了一个随机过程。结果不是一个单一、确定的预报，而是未来可能天气的一个概率分布。我们已经学会了拥抱不确定性，以便量化它。

这种积极主动的姿态也体现在我们的社会和经济系统中。金融监管机构可能会监控一个像随机过程一样行为的动荡市场。监管机构的策略不是在固定的时间进行干预，而是在市场越过某个危险阈值时采取行动。因此，这些干预的时机不是预先确定的；它是由市场自身混乱演化所决定的一系列随机事件时间。监管机构是一个离散事件随机系统，旨在动态地响应一个不遵循简单时钟的世界。

这种掌控能力的最终体现是合成生物学的新前沿，在那里我们不仅在观察随机性，还在积极地设计和控制它。我们现在可以设计合成基因线路并将其插入活细胞中，使其执行新任务，如生产药物或检测疾病标志物。正如我们所知，这些生物线路本质上是嘈杂的。我们如何用不可靠的部件构建可靠的设备？答案在于反馈和控制理论，用随机过程的语言来表述。我们可以将我们的合成线路建模为一个马尔可夫决策过程（MDP）。 “状态”是细胞中不同分子的数量。在某些时刻，我们设计的线路可以采取一个“行动”——例如，它可以释放一种分子来增强或抑制某个基因的活性，从而改变后续反应的概率。巨大的挑战是设计一个“策略”——一套规则，告诉细胞在何种状态下采取何种行动——以引导嘈杂的动力学走向一个期望的、稳定的结果。从非常真实的意义上说，我们正在学习在分子水平上与机遇进行博弈，并赢得胜利。

从数据包的短暂存在到预防大流行的宏大战略，随机系统的原理提供了一个统一的视角。它们揭示了一个世界，它不是一张静态的照片或一部确定性的电影，而是一个动态的、不断展开的故事，有着无数可能的未来。这门科学的美妙之处在于，在如此众多的领域中发现了这种深刻的、共同的结构，为我们提供了阅读这个故事、预测其情节转折，并或许开始书写其未来几行文字的工具。