随机过程：综合导论

玻尔百科

定义

随机过程：综合导论是指通过一组随时间索引的样本路径来模拟随机系统演化的数学框架。该学科利用有限维分布来描述不同时间点上的联合概率，从而捕捉动态系统的统计特性。作为金融、物理、生物和人工智能等领域建立不确定系统模型的基石，它揭示了离散随机过程在大规模缩放时如何收敛至连续布朗运动的普遍规律。

核心要点

随机过程对一个随机系统随时间的演化进行建模，其定义为所有可能的时间索引历史的集合，这些历史被称为样本路径。
一个过程的完整统计特性由其有限维分布所捕捉，这些分布描述了在任意时间点集合上的联合概率。
许多离散随机过程，如简单随机游走，在经过尺度变换后会收敛于连续的布朗运动，揭示了随机现象中深刻的普适性。
随机过程是在金融、物理、生物和人工智能等不同领域中，为动态、不可预测的系统建模的基础语言。

引言

随机性是我们宇宙的一个基本方面，从水中花粉粒的抖动到股票市场的波动。虽然像掷硬币这样的单个随机事件可以用概率论来描述，但许多现实世界的系统会随着时间不可预测地演化。为了理解这些动态的随机系统，我们需要一个更强大的框架：随机过程理论。本文旨在弥合单个随机变量的概念与系统随机历史的丰富、演化叙事之间的鸿沟。我们将踏上一段旅程，去理解这些强大的数学对象。在第一部分“原理与机制”中，我们将剖析随机过程的核心组成部分，从样本路径的直观概念到分布的形式化机制，以及离散游走与连续运动之间的深刻联系。随后，在“应用与跨学科联系”中，我们将见证这些理论在实践中的应用，发现它们如何为描述金融、物理、生物和人工智能等领域的现象提供了必不可少的语言。

原理与机制

要真正理解随机过程“是”什么，我们必须超越单个、静态的随机快照。掷一次骰子是一个随机变量。而随机过程则是整部电影。它是一个系统随时间不可预测地演化的故事。让我们从最直观的画面开始，层层揭开这个美妙概念的面纱，探寻支配整个随机历史宇宙的深刻原理。

历史的宇宙：样本路径

想象一下，你身处一个高科技实验室，任务是监测一个恒温室的温度。一个传感器在每小时的开始记录温度。由于无数微小、不可预测的影响——气流、传感器的电子噪声、宇宙的量子抖动——温度会轻微波动。一天结束时，你得到了一张包含24个数字的列表。例如，你可能记录下了序列 $(20.8, 20.9, 21.1, 20.9, \dots)$ 摄氏度。

这一串单独的测量序列，这份特定的一天室内温度日记，被称为样本路径或实现。它是无穷可能性中的一种可能的历史。如果你第二天再进行一次实验，你会得到一串不同的数字——另一条样本路径。随机过程本身并非这些路径中的任何一条。相反，它是所有可能路径的“整个系综”，以及决定每条路径可能性大小的规则。它是一个抽象概念，是房间温度可能讲述的所有故事的集合。形式上，我们将其表示为一个随机变量的集合 $\{X_t\}$ ，其中 $X_t$ 是时间 $t$ 时的随机温度。

这里的“时间”不一定是时钟时间，“值”也不必是数字。想象一个微小粒子在一个标记为 $V_1, V_2, V_3, V_4$ 的正方形的四个角之间跳跃。每一步，它以相等的概率移动到它的两个邻居之一。从 $V_1$ 开始，前几步的一个可能样本路径可以是 $(V_1, V_2, V_3, V_4)$ 。在这里，索引集（我们的“时间”）是离散步数集合 $\{0, 1, 2, \dots\}$ ，而状态空间（可能值的集合）是顶点集合 $\{V_1, V_2, V_3, V_4\}$ 。这个过程同样是这个随机游走的抽象概念，包含了粒子可能采取的所有旅程。一条不可能的路径是 $(V_1, V_3, \dots)$ ，因为 $V_1$ 和 $V_3$ 不相邻。过程是有规则的！

过程的DNA：有限维分布

那么，如果一个过程是所有可能历史的庞大集合，我们如何才能描述它呢？我们不可能写下一个无限长的列表。秘密，即过程的数学“DNA”，在于它的统计特性。

我们可以从一个简单的快照开始。考虑一个赌徒玩掷硬幣的游戏。正面他赢 $3$ ，反面他输 $2$ 。我们可以定义一个过程 $X_n$ 作为他掷 $n$ 次后的总赢利。我们可以问：掷50次后，他的赢利的概率分布是什么？我们可以计算其均值和标准差来理解可能的结果及其分布范围。这给了我们过程在单个时间点上的图像。

但这还不够。过程的灵魂在于不同时间点之间的“关系”。想象我们在一个半径为1的圆内随机均匀地投点。我们定义一个过程 $M_n$ 为投下 $n$ 个点后所见到的离中心的最大距离。知道 $M_{10}$ 的分布很有用，但更有趣的是 $M_{10}$ 与 $M_{20}$ 之间的关系。显然， $M_{20}$ 必定至少与 $M_{10}$ 一样大，因为它是更大点集上的最大值。关键信息不仅仅是 $M_{10}$ 和 $M_{20}$ 的各自的分布，而是它们的联合概率分布。这个联合分布告诉我们，例如，找到 $M_{10}$ 在某个范围内“并且” $M_{20}$ 在另一个范围内的概率。

这就是中心思想。一个随机过程的完整描述由其有限维分布（FDDs）族给出。如果你能告诉我过程在任意有限时间点集合 $(t_1, t_2, \dots, t_n)$ 上的值的联合概率分布，对于任何 $n$ 而言，你就完全指定了这个过程。

现在，一个优美的数学逻辑发挥作用了，它被称为Kolmogorov扩展定理。你不能随便创造一组有限维分布就称之为一个过程。它们必须是自洽的。假设你为 $(X_0, X_1)$ 定义了一个联合分布，又为 $X_0$ 单独定义了一个分布。要使之成为对单个过程的有效描述，你通过联合 $(X_0, X_1)$ 分布“积分掉”或忽略 $X_1$ 变量得到的边缘分布，“必须”与你最初为 $X_0$ 指定的分布完全相同。这是一个简单而强大的一致性检验：你对这对变量讲述的故事必须与你对单个变量讲述的故事相符。如果这种一致性对所有可能的有限时间点集合都成立，那么——也只有在那时——我们才能确定一个具有这些统计特性的随机过程确实存在。

游戏规则：信息与时间

一个过程随时间展开，而随着时间的推移，信息也在积累。这个想法被信息流（filtration）的概念所捕捉，你可以把它看作是直到某个时间 $t$ 为止已知的关于过程的所有信息的总和。我们称这段历史为 $\mathcal{F}_t$ 。它是迄今为止发生的一切。

大多数模拟现实世界的过程都适应于一个信息流。这是一种形式化的方式，陈述了一个非常符合常识的规则：过程在时间 $t$ 的值 $X_t$ ，仅由截至时间 $t$ （包括 $t$ ）可用的信息确定。换句话说，过程不能“看到未来”。我们随机游走粒子在第3步的位置取决于它在第0、1、2步的位置，而不取决于它在第4步将要去哪里。这个因果性原则被内置于许多最有用的随机过程的定义之中。

同样值得注意的是，过程的“相同性”有不同层次。两个过程可能具有完全相同的有限维分布——意味着它们在统计上是不可区分的——但在形式化的数学层面上可能是以不同方式构建的。一种更微妙且更强的相同性形式是它们的样本路径以概率1相同；这被称为不可区分的。对于科学和工程中的大多数应用来说，使用有限维分布才是最重要的，因为它捕捉了所有的统计行为。

从锯齿状步态到平滑流动：连续统

自然界中的许多过程不是以离散步骤发生的；它们是连续演化的。其中最著名的是布朗运动，即一个微小粒子（如水中的花粉粒）在更微小的水分子撞击下不停地、随机地抖动。

这种现象的物理学由Langevin方程描述，这只是牛顿第二定律在该粒子上的应用：它的加速度由流体的阻力和来自分子碰撞的随机涨落力 $\xi(t)$ 决定。这个随机力是连续时间过程的原型，通常被理想化为高斯白噪声。

白噪声是一种奇妙而奇特的野兽。“白”这个词来源于它的功率均匀分布在所有频率上，就像白光由所有颜色的光组成一样。其定义的数学特征是，它在任何时间 $t$ 的值与在任何其他时间 $t'$ 的值完全不相关，无论它们多么接近。这由一个包含Dirac delta函数的相关函数来捕捉： $\langle \xi(t)\xi(t') \rangle \propto \delta(t-t')$ 。当然，这是一个物理理想化——实际上，碰撞有一个微小但有限的持续时间。但对于比这些微观事件更长的时间尺度来说，它是一个极其有效的模型。

在这里，我们发现了物理学中最深刻的联系之一，即涨落-耗散定理。随机力 $\xi(t)$ 的强度不是一个你可以任意选择的参数。它从根本上与摩擦力或阻力 $\gamma$ 的强度相关联。两种现象——耗散（阻力）和涨落（随机踢动）——都源于同一个来源：与流体分子的混沌碰撞。一个更热、能量更高的流体会导致更强的踢动和更大的粘性阻力。这确保了平均而言，粒子的动能会稳定在热力学预测的值上，即 $\langle \frac{1}{2} m v^2 \rangle = \frac{1}{2} k_B T$ 。随机性不仅仅是噪声；它是热平衡的回声。

布朗粒子最终的路径是一个奇迹。它是连续的——粒子不会瞬移——但它处处不可微。这条路径是如此的锯齿状和不规则，以至于在任何一点你都无法定义一个唯一的切线或瞬时速度。它的连续性由数学定理保证，这些定理大致说明，如果跳跃的平均大小随着时间间隔的缩小而增长得不是太快，那么该过程的连续版本必定存在。

宏伟的统一：随机游走如何变成布朗运动

我们从简单的离散过程开始，比如掷硬币游戏。然后我们跳到布朗运动的复杂、连续的舞蹈。最后，一个惊人的洞见是，这两个世界是同一个。

以一个简单的随机游走为例，每一步你掷一枚硬币，正面则向右走一步，反面则向左走一步。现在，想象你以一种非常具体、协调的方式，缩小每一步的步长，同时加快你行走的频率。这就是Donsker不变性原理的核心，一个中心极限定理的泛函版本。

当你从离散的随机游走中“缩小”观察时，一个奇迹般的转变发生了。那一步一步、颠簸的运动变得平滑——不是变成一条简单的直线，而是变成布朗运动那无限复杂、锯齿状的路径。所有可能按比例缩放的随机游走路径的集合，在统计意义上，变得与所有可能的布朗运动路径的集合不可区分。

这揭示了自然界中一种深刻的普适性。你的基本随机步骤是来自掷硬币、掷骰子，还是其他具有有限方差的随机过程，都无关紧要。当你将足够多的这些步骤加起来，并从远处观察所产生的路径时，单个步骤的细节就被冲淡了，而布朗运动的普适形式就显现出来。这就是为什么布朗运动如此普遍，出现在从股票市场到细胞内分子扩散的各种现象中。它是一个充满无数独立随机踢动的微观世界的宏观结果。卑微的随机游走，当通过正确的镜头观察时，其内部蕴含着连续随机演化的全部复杂性。

应用与跨学科联系

我们花了一些时间来建立随机过程的形式化语言——指数集、状态空间和样本路径的机制。这可能感觉有些抽象，好像我们一直在仔细描述一种你尚未听过的语言的语法。但现在，有趣的部分开始了。我们将走向世界，看看这种语言在哪里不仅被使用，而且本身就是现实世界的母语。你会惊奇地发现，我们讨论过的同样的基本思想，使我们能够描述股价的抖动之舞、演化不可阻挡的进程、人工智能心智的学习过程，甚至纯粹数学混沌中美丽的隐藏秩序。

进步与价格的醉汉游走

让我们从许多人都熟悉的东西开始：一个在线视频游戏。你的技能等级，一个向世界宣告你实力的数字，并不是静止的。每场比赛后，它都会改变。你赢了，它上升；你输了，它下降。但不是一个固定的量。变化取决于你的表现、比赛的难度，以及从你的角度看相当随机的其他因素。你的技能等级从一场比赛到下一场比赛的演变， $S_n$ ，是离散时间随机过程的一个完美例子。这是一种“随机游走”，其中每一步本身就是一个随机变量。通过对输赢结果和随机“表现因子”进行建模，我们可以分析这个系统，例如，计算在一个赛季的 $N$ 场比赛中，你的技能等级不确定性——即方差——如何增长。

这个完全相同的想法，即价值的随机游走，是金融学中最强大也最具争议的理论之一的基石。不考虑技能等级，而是考虑一个商品投资组合——黄金、白银和铂金。分析师可能会在每小时开始时记录它们的价格。这些价格向量随时间的集合构成了一个向量值的离散时间随机过程。“随机游走假说”假定这些价格变化基本上是不可预测的，就像掷硬币一样。虽然现实远比这复杂，但这个简单的随机模型提供了所有复杂金融理论都必须检验的基本基准。它是理解风险、衍生品定价和管理庞大投资组合的起点。

宇宙的等待游戏

从游戏和市场的离散步骤，让我们将注意力转向在连续时间中演化的过程。想象一下一个智能家居系统的中央处理器，它在英勇地试图处理来自你的灯、恒温器和安全摄像头的持续数据冲击。数据包在随机时间到达，并在随机时间被处理。缓冲区中等待的数据包数量 $N(t)$ 是一个随机过程。“时间”变量 $t$ 连续流动，但系统的状态——数据包的数量——只能是整数：0, 1, 2，等等，直到缓冲区的容量。这是一个连续时间、离散状态的过程，是“排队论”中的基本研究对象。描述你智能家居CPU等待队列的数学，与描述银行排队、高速公路交通堵塞以及互联网数据流量的数学是完全相同的。它支配着我们现代世界的流动与瓶颈。

等待随机事件发生这个想法，比人类工程系统要深刻得多。它深入到物质的结构之中。考虑一小块放射性材料。在量子层面，单个原子的衰变是一个根本上随机的事件。我们永远无法知道“何时”一个特定的原子会衰变，只能知道它在给定时间间隔内衰变的概率。如果我们从一个含有 $N$ 个原子的样本开始，在时间 $t$ 剩余的未衰变原子数 $X(t)$ 是一个随机过程。通过理解单个衰变事件的概率，我们可以计算整个事件序列的可能性，即一条“样本路径”——例如，从4个原子开始，一秒后剩下3个，两秒后仍然剩下3个的概率。这不仅仅是一个学术练习；它是碳定年法、医学成像和核能发电背后的原理。宇宙在最基本的层面上，遵循着随机过程的规则。

生命与心智的随机心跳

如果说随机性编织在无生命物质的结构中，那么它就是生命与智能的引擎。考虑演化过程。一个基因从亲代传给子代，从一代传到下一代。在每一步，都可能发生随机突变。在第 $n$ 代中，特定基因出现的新突变数量 $X_n$ 是一个离散时间、离散状态的随机过程。这个缓慢、随机的滴答声是所有遗传新颖性的来源，是自然选择作用的原材料。

但随机性的作用比仅仅创造变异更为深刻。在有限种群中，它可能导致令人惊讶的、不可逆转的结果。在无性繁殖种群中，一种称为“穆勒棘轮”的现象可能发生。个体根据它们携带的有害突变数量进行分组。“最适应”的群体是突变最少的群体。纯粹由于偶然，这个最适应群体中的所有个体可能都未能繁殖，或者它们所有的后代都获得了新的突变。当这种情况发生时，最适应的类别就永远消失了。棘轮“咔哒”一声，整个种群朝着更低的适应性迈出了不可逆转的一步。随机过程模型使我们能够计算这种棘轮点击的概率，揭示了随机性如何成为演化中一个强大的、有方向性的力量。

令人着迷的是，同样这个原理——对随机性的有效利用——现在正处于人工智能的核心。当我们训练一个神经网络时，我们实际上是在试图找到最好的一组内部“权重”来执行一项任务。所有可能权重的空间是一个巨大的、高维的景观，有许多山峰、山谷和高原。一个简单的“下坡”搜索最佳解决方案的方法很容易陷入次优的山谷中。解决方案是什么？“随机”梯度下降。该算法不是使用整个数据集来计算真正的“下坡”方向，而是在每一步使用一个随机选择的小批量数据。这使得它所走的路径成为一个随机过程。这种随机性为下降过程注入了噪声，使得算法能够从糟糕的山谷中抖动出来，更好地探索广阔的解决方案景观。在深层次上，我们训练最先进人工智能的方式，呼应了演化利用随机性来探索生物适应性景观的方式。

一种更高级的随机性

到目前为止，我们过程的“状态”一直是一个数字或一个数字向量。但随机过程的框架远比这强大。状态可以是一个更抽象的对象。

想象一个移动机器人在建筑物中导航。它永远无法“确切”知道自己的位置。它的知识是一个概率分布——一个“信念”——分布在地图上。例如，它可能认为有0.6的概率在走廊里，0.4的概率在办公室里。这个信念就是系统的状态。随着机器人移动及其传感器收集新信息（这些信息本身也是嘈杂和不确定的），它的信念状态会更新。这个信念分布随时间的演化是一个随机过程。在这里，每个时间步的状态不是一个数字，而是一个概率向量。这是现代机器人学的基础，使机器能够在不确定性下导航和行动。

我们可以更进一步。如果我们过程在给定时间的状态是一个完整的函数呢？考虑模拟河口中污染物浓度。浓度不仅仅是一个数字；它是一个随河口位置 $x$ 变化的剖面 $C(x, t)$ 。由于随机流入和湍流，这个完整的函数会随时间随机演化。我们可以将其建模为一个函数值随机过程，其中时间 $t$ 的状态是函数 $C_t(x)$ 本身。这个强大的思想使我们能够模拟天气模式、大脑活动（EEG信号）和生物膜的波动形状等现象。

最后，让我们考虑一个纯粹数学美的例子。想象一个首一（monic）随机多项式，其除最高次项外的系数是从标准正态分布中抽取的独立随机数。对于任何一个这样的 $n$ 次随机多项式，在复平面上都存在一组 $n$ 个根。这组根就是我们过程的状态。我们能对这堆混乱的点说些什么呢？它看起来像一团无望的混乱。然而，借助随机过程的工具，我们可以提出精确的问题。例如，这些根的平方[和的期望值](@article_id:313620) $E\left[\sum z_i^2\right]$ 是多少？利用多项式的根与其系数之间的优美联系（韦达定理），可以证明这个期望值恰好是1，而与多项式的次数 $n$ 无关（对于 $n \ge 2$ ）。这是一个惊人的结果。从完全随机的系数中，浮现出一个惊人简单和恒定的结构。这只是随机矩阵理论领域的一瞥，在该领域中，这样的过程揭示了概率、物理和数论之间深刻而出人意料的联系。

从实践到深奥，从工程到演化，随机过程提供了一种统一的语言，来描述一个机会不仅是麻烦，而且是一种基本和创造性力量的世界。