科学中的随机模型

玻尔百科

定义

科学中的随机模型指一套用于描述受随机波动和稀少事件主导的系统的数学框架，其核心在于处理确定性模型无法解释的不确定性。该领域根据时间处理方式和随机性对过程进行分类，并利用随机微分方程等工具来模拟白噪声和布朗运动等复杂现象。这些模型在基因演化、流行病传播、金融市场行为以及人工智能开发等科学领域中发挥着至关重要的作用。

核心要点

基于平均值的确定性模型对于小种群或稀有事件系统可能具有危险的误导性，在这些系统中，随机波动主导着最终结果。
随机过程可以根据其处理时间（离散与连续）和随机性的方式进行分类，而像马尔可夫性质这样的简化假设使得强大的分析成为可能。
复杂的连续时间随机性由随机微分方程（SDEs）进行数学描述，这是一种专门用于处理白噪声和布朗运动等概念的微积分学。
随机模型在整个科学领域都至关重要，为基因演化、金融市场行为、流行病传播以及人工智能的发展提供了关键见解。

引言

几个世纪以来，科学一直通过确定性定律来寻求确定性，这些定律像钟表宇宙一样，能从现在预测未来。这种专注于平均值和可预测结果的方法曾非常强大。然而，当面对主导着许多自然和工程系统的内在随机性时——从单个细菌的存活到股票价格的波动——这种方法就显得力不从心了。在这种情况下，依赖平均值不仅可能不准确，甚至可能具有危险的误导性。本文旨在填补这一空白，全面介绍随机模型——即概率的语言。在第一部分，我们将探讨基本的“原理与机制”，对比随机与确定性观点，对不同类型的随机过程进行分类，并介绍用于驾驭不确定性的数学工具。随后，“应用与跨学科联系”部分将展示这些模型如何在分子生物学、流行病学、金融学和气候科学等不同领域提供关键见解，揭示随机性思维的统一力量。

原理与机制

想象一下，你正站在海岸线上看海浪。你无法预测下一个拍岸浪花的具体形状，也无法精确说出每一滴浪花会落在何处。然而，你可以描述海洋的总体特征——是风平浪静，是波涛汹涌，还是狂风巨浪？你可以谈论海浪之间的平均时间，以及浪峰的典型高度。在很长一段时间里，科学主要关注的就是这些平均值，以及那些支配行星运动和水流的确定性、钟表般的定律。这就是确定性模型的世界，在这个世界里，如果你能完美地了解当前状态，你就能以绝对的确定性预测未来。

但如果你关心的不是整个海洋，而是在浪涛中颠簸的一叶扁舟的命运呢？如果一个随机出现的、异常巨大的浪头将其掀翻，那么波浪的平均行为便毫无慰藉可言。正是在这里，基于平均值的确定性世界崩塌了，我们必须进入随机模型的世界——关于机遇、随机性和概率的科学。

平均值的暴政：当“足够好”变得极其错误

让我们从一个生死攸关的情境开始。在对医疗植入物进行消毒时，工程师必须确保没有有害细菌存活。一个传统的确定性模型可能会计算消毒周期后残留微生物的平均数量。假设模型基于15个孢子的初始数量和已知的死亡率，预测平均只有 $0.85$ 个孢子会存活。一个小于1的数值！似乎可以安全地断定植入物是无菌的。但这个结论是极其错误的。

存活细菌的数量不是可以以分数形式存在的连续流体；它是一个整数。幸存者要么是零，要么是一个，要么是两个，以此类推。存活的过程是随机的。某个特定的孢子可能异常顽强，或者它可能只是幸运地避开了消毒剂的全部冲击。一个使用泊松分布等工具的随机模型则会考虑到这一点。它不预测一个单一的数字，而是给出每种结果的概率。在这个真实世界的场景中，一个随机模型揭示了，即使平均幸存者数量为 $0.85$ ，至少有一个孢子存活——即消毒失败——的概率也可能高达惊人的57%。平均值告诉我们一回事，但随机波动讲述了一个完全不同且重要得多的故事。

这种“人口随机性”，即个体出生和死亡事件中固有的随机性，在处理小种群时至关重要。想象一下，为了改善健康，向肠道微生物组中引入一种新的益生菌。一个确定性模型，着眼于平均出生率和死亡率，可能会预测如果出生率超过死亡率，种群就保证能够增长并稳定下来。但是当初始剂量非常小时，这种益生菌的命运就完全取决于偶然性。一系列随机的不幸事件——例如一些细胞在分裂前就被冲出系统——可能导致其完全灭绝，即使在平均条件有利的情况下也是如此。确定性模型由于其本质，对这种随机灭绝的可能性是视而不见的。这就像抛一枚略微偏向于正面的硬币；平均来看你期望得到更多的正面，但你很可能在开始时连续得到一串反面。对于一个小种群来说，最初那串坏运气可能是致命的。

一种新的概率语言：变化的四种风格

为了精确地讨论这些随机过程，我们需要一种清晰的语言。我们可以沿着两个基本轴线对任何模型、任何变化的描述进行分类：确定性与随机性，以及连续时间与离散时间。

第一个轴线我们已经见过了。确定性过程就像一部预先录制好的电影；整个事件序列从一开始就是固定的。随机过程是交互式的，每一步都像掷骰子一样决定接下来会发生什么。一个种群的状态根据出生和死亡的随机二项式抽取进行演化，这是一个经典的随机模型。

第二个轴线关乎时间本身的性质。时间是按时钟的一系列清晰“滴答”声前进，还是平滑连续地流逝？离散时间模型在固定的时间间隔更新其状态，就像银行账户每天计息一次，或者我们的种群模型在每一代 $t=0, 1, 2, \dots$ 统计新个体一样。相比之下，连续时间模型描述的是变化可以在任何瞬间发生的过程。一杯咖啡的冷却或一个放射性元素的衰变由一个变化率 $\frac{dx}{dt}$ 控制，这暗示了时间的连续流动。

关键是不要将底层模型与我们在计算机上模拟它的方式相混淆。对一杯冷却咖啡的计算机模拟必然会将时间分割成小步长，比如 $\Delta t$ 。其更新规则可能看起来像 $x(t+\Delta t) = x(t) - k \cdot x(t) \cdot \Delta t$ 。这看起来是离散的，但它仅仅是一个底层连续时间模型——常微分方程(ODE) $\frac{dx}{dt} = -kx$ 的数值近似。

最引人入胜的模型常常结合了这些元素。细胞中的化学反应可能在连续时间内进行，但事件本身——即单个反应——却是离散和随机的。像Gillespie随机模拟算法(SSA)这样的算法通过为下一次反应的发生选择一个随机的时间间隔 $\tau$ ，然后将时钟推进这个连续的量 $t \to t + \tau$ ，从而完美地捕捉了这一点。这是一个连续时间、离散事件的随机过程。

也许最深刻的例子来自物理学的核心。一个量子系统，比如一个单独的量子比特，在不受干扰时，其演化由薛定谔方程描述。这种演化是完全连续且确定的。但当我们测量这个量子比特的瞬间，情况就变了。测量行为是一个离散且随机的事件。系统会瞬间并随机地“坍缩”到其中一个可能的结果状态，其概率由玻恩定则给出。因此，一个量子比特的完整生命周期是一个混合系统：平滑、可预测的演化被突然的、随机的跳跃所打断。

最后，关于一个常见的混淆点需要说明。我们使用带有伪随机数生成器（PRNGs）的计算机来模拟随机模型。如果你固定一个PRNG的初始“种子”，你每次都会得到完全相同的“随机”数序列。这意味着模拟的运行是完全可复现的，从这个意义上说，是确定性的。这是否意味着该模型不再是随机的？不是。模型是由其包含随机变量的数学结构定义的。使用固定种子的一次运行只是真实随机过程可能采取的无限多条路径中的一种可能实现。良好的科学实践要求我们承认这一点：我们报告种子以保证可复现性，但我们也会用许多不同的种子运行模拟，以理解所有可能的行为范围，即随机模型灵魂所在的内在变异性。

无记忆的宇宙……真的是这样吗？

在许多随机模型中，一个强大的简化假设是马尔可夫性质。简单来说，这意味着在给定现在的情况下，未来与过去无关。接下来发生什么只取决于系统现在的状态，而与它如何达到这个状态的历史无关。蛇梯棋游戏是一个完美的马尔可夫过程：你的下一步只取决于你现在在哪一格，而与带你到那里的掷骰子序列无关。

在一个关于公众意见的社会学模型中，如果我们假设它是马尔可夫的，那么一个人将其立场从'A'变为'B'的概率仅取决于他们目前持有立场'A'这一事实。这个思想使我们能够使用随机矩阵和马尔可夫链的优雅数学来分析系统的长期行为，例如找到一个稳态分布——这是一种平衡状态，在该状态下，持有各种意见的人的总体比例随时间不再变化。

但世界往往更加微妙。有时一个过程看起来是非马尔可夫的，好像它有记忆，这是因为我们没有看到全局。考虑一个股票价格模型。一个简单的模型，几何布朗运动，假设波动性（随机价格波动的幅度）是恒定的。在这种情况下，股票价格过程是马尔可夫的：其未来只取决于其当前价格。

然而，一个更现实的模型承认波动性本身不是恒定的；它会随着时间的推移随机变化，受市场恐慌和新闻的驱动。在这样的随机波动率模型中，价格 $S_t$ 由波动率 $\nu_t$ 驱动，而 $\nu_t$ 本身也有其随机演化过程。现在，如果我们只观察股票价格 $S_t$ ，这个过程还是马尔可夫的吗？答案是否定的。为了预测股票价格的未来，我们不仅需要知道它当前的价格 $S_t$ ，还需要知道其波动率 $\nu_t$ 当前的、隐藏的值。价格的历史记录携带着关于当前波动率可能是什么的信息。过去一段时间的剧烈波动暗示当前波动率较高，而一段平静期则暗示较低。单独看过程 $S_t$ 似乎有记忆，但这种“记忆”实际上只是未被观察到的隐藏变量 $\nu_t$ 投下的影子。二维过程 $(S_t, \nu_t)$ 作为一个整体是马尔可夫的，但它的一维投影则不是。这是一个优美而深刻的思想：我们所感知的记忆和复杂性有时可能是隐藏的简单性的结果。

驯服无穷：连续随机性的机制

我们如何构建一个数学机器来描述连续时间的随机过程，比如游走的股票价格或水中花粉的随机运动（布朗运动）？第一个冲动是写出这样一个方程： $\frac{dx}{dt} = \text{drift} + \text{noise}(t)$ 在这里，“噪声”项代表连续发生的随机冲击。这种噪声的理想化是一个称为白噪声的概念，它被想象成在任意两个瞬间都是完全不相关的，并且具有平坦的功率谱。

只有一个问题：白噪声是一个数学上的虚构。一个在时间上真正不相关的过程必须具有无限的方差和无限的功率。它不能作为普通的时间函数存在。那么我们该如何继续呢？

Norbert Wiener 和 Kiyoshi Itô 的卓越洞见在于，不再关注随机过程的速度（虚构的白噪声），而是转而关注其位移。想象一个粒子被随机地踢来踢去。它在任何瞬间的速度是无法明确定义的，但它在一段时间内的总位移是完全良态的。这种积分后的白噪声被称为维纳过程或布朗运动，记为 $W_t$ 。它是一条连续的路径，但却如此崎岖不平，以至于处处不可微。

这一洞见迫使我们放弃熟悉的微分学语言，而采用一种新的语言：随机微积分。我们将非正式的方程重写，不是用变化率（ $dx/dt$ ）的形式，而是用无穷小增量（ $dx$ ）的形式： $dx(t) = f(x,t) dt + G(x,t) dW_t$ 这是一个随机微分方程（SDE）。它应被理解为一个积分方程的简写。它表示在微小时间间隔 $dt$ 内 $x$ 的微小变化由两部分组成：一个确定性的漂移部分 $f(x,t)dt$ ，和一个随机的扩散部分 $G(x,t)dW_t$ ，其大小与维纳过程的增量成正比。这种新微积分（伊藤微积分）的规则是不同的，其中最著名的一条规则是 $(dW_t)^2 = dt$ ，它捕捉到了这样一个事实：随机波动是如此显著，以至于它们在比经典微积分更低的阶上对动力学做出了贡献。这个诞生于驯服白噪声无穷性需求的框架，如今已成为从量化金融到控制理论等领域的基石。

这种数学理想化也有一个优美的物理解释。现实世界中的噪声从来不是真正的“白色”；它总有一些微小的相关时间。然而，如果这个相关时间远小于我们研究的系统的时间尺度，我们就可以将真实的“有色”噪声近似为理想的白噪声。在精确的数学意义上，当噪声的相关时间缩减到零时，由有色噪声驱动的过程会收敛到一个由维纳过程驱动的过程。因此，伊藤微积分的优雅虚构是对混乱现实的强大而准确的近似。

随机建模的原理提供了一个统一而强大的视角来观察世界。从细胞内分子的微观舞蹈——其中大数定律将化学主方程的崎岖随机现实平滑为生物化学的确定性常微分方程（）——到区分确定性混沌的可预测的不可预测性与真正的内在随机性的巨大挑战（），这种概率的语言都是不可或缺的。它教导我们尊重单个事件的力量，寻找隐藏变量，并建立将不确定性视为宇宙基本特征而非麻烦的模型。

应用与跨学科联系

我们已经看到，当我们仔细观察时，世界并不是一个确定性的钟表。它是一个沸腾、闪烁、不确定的地方。随机建模的原理为我们提供了一种语言来谈论这种不确定性，对其进行推理，并在此基础上——或者说，正因为如此——做出预测。现在，掌握了“是什么”和“为什么”之后，让我们踏上一段旅程，看看这些思想在实践中的应用。我们将从我们自己细胞内的微观剧场，走向全球气候的宏大舞台；从金融的复杂舞蹈，到智能机器的初生心智。在此过程中，我们将发现一个非凡的真理：关于随机性、概率和结构的相同基本概念反复出现，将现代科学多样化的织锦用一根统一的线索编织在一起。

生命之舞：分子、基因与演化

我们的旅程始于一个难以想象的微小世界。几个世纪以来，化学是一门关于平均值的科学，将一烧杯的水当作是平滑、连续的流体。当你有阿伏伽德罗常数那么多的分子时，这套方法非常有效。但在一个活细胞内部，关键反应可能仅由少数几个酶分子控制时，情况又会如何？在这样一个小数目的世界里，大数定律抛弃了我们。行为不再是平滑、可预测的华尔兹，而是一场颠簸、随机的舞蹈。

考虑一个正在处理底物的单个酶分子。一个确定性方程，如著名的 Michaelis-Menten 模型，描述的是大量此类酶的平均速率。但对于单个分子或一小群分子而言，不存在平均速率。只有一个等待期，然后是一次突然的反应；又一次等待，又一次反应。这些事件的发生时机从根本上是随机的。为了捕捉这一现实，我们需要一个离散的随机模型，它能计算单个分子并模拟单个反应事件。这种选择不是品味问题，而是物理现实的问题。当分子数量很低时，内在波动——其相对大小与 $1/\sqrt{N}$ （其中 $N$ 为分子数）成比例——主导了动力学，此时随机性描述不仅更好，而且是必不可少的。

这种“正确处理随机性”的原则从分子数量延伸到它们所携带的信息。编码在DNA和RNA中的基因是生命的蓝图，但它们不是静态的文本。它们在演化。要理解这种演化，我们必须比较不同物种的基因，这需要将它们对齐以观察哪些部分是对应的。一种简单的方法可能只是寻找逐个字母的相似性。但这忽略了故事的一个关键部分，特别是对于像核糖体RNA（rRNA）这样折叠成复杂功能形状的分子。在这些结构中，一个位置的核苷酸与序列下游很远的另一个核苷酸配对。如果一个发生突变，另一个通常会随之发生“补偿性”突变，以保持碱基对和结构。

一个将序列中每个位置视为独立的简单随机模型将对这种长程相关性视而不见。这就像试图通过孤立地看每个字母来理解一个句子。一种更复杂的方法，使用协方差模型，建立在一个更丰富的数学对象——随机上下文无关文法——之上。该模型“知道”碱基配对。它明白两个遥远位置的相关变化是共同祖先的强烈信号，比一个在柔性环中的偶然匹配要强得多。通过捕捉演化过程中真实的统计依赖性，这些结构感知模型产生了远为准确的对齐，进而产生了更可靠的生命之树。

我们可以将视角进一步拉远，从单个基因的演化到可见性状的演化，比如动物的体型。这些性状是如何在数百万年间演化的？我们可以提出不同的故事，并将它们嵌入不同的随机模型中。一个故事是“中性漂变”：性状漫无目的地随机游走。这可以用一个名为布朗运动（BM）的数学过程完美描述，其中相关物种间的方差或离散度随着时间的推移无限增长。但如果环境存在一个最佳体型呢？那么，另一种力量就发挥作用了：“稳定性选择”，它不断将性状拉回到那个最佳值。这个故事则由另一种随机过程——Ornstein-Uhlenbeck（OU）模型——来捕捉。在OU模型中，随机漂变被一种恢复力所抵消。因此，方差不会永远增长，而是会趋向于一个有限的、稳定的平衡。通过将这些相互竞争的模型与系统发育数据进行拟合，生物学家可以提出深刻的问题：这个性状是在简单地漂变，还是正在被选择积极地塑造？一个性状在时间中走过的随机路径的特性本身，就告诉了我们关于演化中无形力量的故事。

集体：流行病、交通与市场

从微观世界，我们现在转向相互作用的智能体系统。当我们有许多个体——无论是人、汽车还是交易员——其集体行为创造出一种宏观现象时，会发生什么？人们可能希望随着数量的增多，随机性会被平均掉。有时确实如此。但通常并非如此。

考虑一场流行病的传播。一个简单的确定性模型可能会假设每个感染者每天平均感染一定数量的其他人。这种“平均场”方法想象每个人都混合在一个巨大的、同质化的汤里。但我们知道社会不是那样的。我们生活在接触网络中。有些人接触很少；另一些人，即“超级传播者”，则接触非常多。在一个异质性如此高的网络中，平均场模型会灾难性地失败。流行病的命运可能取决于这些超级传播者中是否有一个在早期被随机感染。将这个关键的结构细节平均掉会得出错误的答案。为了做出准确的预测，我们需要离散的随机模拟，这些模拟尊重网络结构，追踪从一个个体到另一个个体的传播链。网络的结构塑造了随机性的路径。

同样的原则——即变异性和结构可能比平均值更重要——出现在最平凡的地方：交通路口。某一天，汽车可能以稳定、可预测的流线到达。一个基于平均流量的简单确定性模型工作得很好。但在另一天，平均流量相同，但车辆到达是“突发性”和不可预测的，一辆公交车的故障就可能造成随机的、持久的堵塞。系统的行为完全改变了。整齐的队列变成了混乱的堵塞，溢出效应阻塞了其他街道。为了设计能够应对现实世界条件的稳健交通系统，工程师们依赖于随机模拟，这些模拟明确地建模了到达的变异性和随机事件的概率。平均情况通常是我们最不担心的；破坏系统的是那些随机的、高影响的事件。

这一点在金融市场中表现得尤为真实。让我们看看政府债券的价格。其价值取决于未来利率的路径，而利率是随机波动的。量化分析师建立复杂的随机微分方程（SDE）模型来描述这种随机游走。但正如我们所知，随机性的细节决定一切。一个模型，Vasicek模型，允许利率变为负数。另一个模型，Cox-Ingersoll-Ross（CIR）模型，在其噪声结构中包含一个平方根项，这迫使利率保持非负——这是一个更现实的特性。这个看似微小的数学变化带来了深远的影响。CIR模型中负利率的不可能性为债券价格的上涨设定了硬性上限。这反过来又改变了基于这些债券的期权价值，在其市场价格中创造了一种可预测的模式，称为“波动率偏斜”。SDE的抽象数学结构在市场上留下了具体、可观察的印记。市场实际上在告诉我们它相信哪个随机故事。

在此基础上，我们可以使用随机模型来管理风险。想象一个巨灾（CAT）债券的投资组合，这是一种金融工具，除非发生特定的灾难（如一场大飓风），否则就会支付收益。为了评估风险，我们可以对潜在的物理事件进行建模。我们可以将一个地区大飓风的到来视为一个泊松过程——一种用于罕见、独立事件的模型。根据这个过程的速率，我们可以计算出一年内发生一次或多次飓风的概率，这正是债券的触发概率。通过结合整个投资组合中此类债券的独立概率，我们可以数值化地构建出我们潜在总损失的完整概率分布。从这个分布中，我们可以读出关键的风险指标，如风险价值（VaR），它告诉我们在给定的置信水平下我们预期的最大损失。我们已经从一个关于天气的物理随机过程，走向了一个具体的金融决策工具。

前沿：模拟现实与智能

在我们旅程的最后一站，我们来到了计算技术的前沿，在这里，随机模型不仅是分析工具，而且被编织进我们模拟世界和智能本身的最宏伟的蓝图中。

例如，现代气候科学面临着一个挑战，即如何对那些在截然不同尺度上运行的组件构成的系统进行建模。海洋的缓慢、宏伟的环流可以用连续的、确定性的偏微分方程（PDEs）来描述。但对于从冰川上突然、不可预测地崩解下来的巨大冰山呢？这是一个离散的、随机的事件。最先进的气候模型是混合模型：它们将这些不同的数学世界耦合在一起。一个描述海洋温度的确定性PDE平滑地演化，直到它被一个来自随机崩解事件的淡水脉冲突然“踢”了一脚。整个系统是随机的，是确定性定律和纯粹偶然性的融合，反映了我们星球的多面性。

有时，随机性不是外部的冲击，而是我们试图描述的系统的一个内部特征。考虑流体的湍流——咖啡中奶油的漩涡，飞机后混乱的尾流。完整的运动方程，即Navier-Stokes方程，是确定性的。但湍流会产生一连串各种大小的涡流，小到无法直接模拟的微观尺度。在大涡模拟中，我们计算大涡流的运动，并试图建模未解析的小涡流的影响。而这种影响是什么呢？它是一种混沌的、随机的冲击。因此，建模者开始将明确的随机噪声项添加到流体动力学的基础PDE中。在这里，随机性不是替代我们对外部因素知识的缺乏；它是物理系统本身内在的、未解析的混沌的直接表示。对这个随机项的需求是流体复杂性的函数，由雷诺数表征：在平滑、粘稠的低雷诺数流体中，这个项是不必要的；在剧烈的、高雷诺数湍流中，它成为物理学的一部分。

我们可以更进一步。如果我们模拟中材料的属性本身就是不确定的呢？想象一下，试图预测水流通过地下岩石的情况，而岩石的渗透率在不同地方随机变化。控制压力的PDE现在有一个系数，它不是一个固定的数字，而是一个随机场。随机有限元法（SFEM）是一套出色的技术，用于求解此类方程。通过将输入随机性（材料属性）和未知解都表示为一组底层随机变量的展开式，SFEM可以计算出解的完整统计分布。它使我们能够回答诸如“该点压力超过临界阈值的概率是多少？”这样的问题。这是从解决单个问题到描述整个可能结果宇宙的深刻转变。

最后，我们转向智能的创造。一个机器人或AI智能体通过与环境互动来学习，这个过程被形式化为马尔可夫决策过程（MDPs）。对于智能体来说，一个关键问题是：我的世界是可预测的吗？如果智能体处于一个“确定性MDP”中——比如一盘国际象棋或一个简单的网格世界——在给定状态下的一个动作总是导致相同的下一个状态。挑战在于探索和发现这些固定的规则。但如果世界是一个“随机性MDP”——比如一个动作可能失败的湿滑网格，或者一个带有噪声电机的机器人——相同的动作可能会有不同的结果。智能体的任务现在要困难得多：它必须多次尝试相同的动作，以学习其后果的概率。一个真正智能的智能体必须认识到其环境随机性的性质，并相应地调整其探索策略。在确定性世界中，它寻求新奇；在随机世界中，它寻求减少其统计不确定性。通往人工智能的道路，在许多方面，是通往掌握在不确定世界中行动艺术的道路。

从生命最小的组成部分到我们星球最大的模拟，再到我们技术最高的追求，我们发现了同样的故事。世界不是一台简单的、确定性的机器。它是一场机会游戏，但也是一场有规则的游戏。现代科学的伟大胜利不是消除了随机性，而是学会了它的语言。通过建立尊重每个领域中不确定性的独特性、结构和规模的模型，我们能够理解这个世界，不是尽管它有随机性，而是通过它的随机性。