try ai
科普
编辑
分享
反馈
  • 随机参数化

随机参数化

SciencePedia玻尔百科
核心要点
  • 传统气候模式存在局限性,因为它们将关键的小尺度过程平均化,导致了系统性误差。
  • 随机参数化通过将这些缺失的次网格效应表示为结构化的随机扰动,而非单一的平均值,从而改进了模式。
  • 引入“智能”随机性可以通过一种称为随机订正或噪声诱导漂移的现象,系统地校正模式偏差。
  • 这种方法通过对模式不确定性提供更真实且基于物理的表述,生成了更可靠的集合预报。
  • 现代应用将随机原理与机器学习相结合,创建了既快速又能解释自身不确定性的概率性人工智能模拟器。

引言

预测天气和预估未来气候是充满不确定性的任务,这一挑战植根于我们模式的根本结构。气候模式将地球简化为一个网格,直接计算大尺度现象,但无法解析发生在“网格线之间”的精细尺度过程,如单个云朵或湍流涡旋。这个“闭合问题”——如何解释这个不可见的次网格世界所产生的反馈——传统上是通过确定性参数化方案来解决的,这些方案依赖于捕捉平均效应,但这种方法常常导致系统性误差和过度自信的预测。本文探讨了一种更深层次的解决方案:随机参数化。它超越了简单的平均值,拥抱了气候系统固有的随机性。我们将首先深入探讨该方法的基本“原理与机制”,解释添加结构化噪声如何以及为何能系统地改善模式行为。随后,在“应用与跨学科联系”部分,我们将看到这些原理的实际应用,从改进日常天气预报到塑造我们对长期气候变率的理解,再到为下一代人工智能驱动的气候科学提供动力。

原理与机制

为了理解为什么我们预测天气或预估未来气候的最佳努力仍然充满不确定性,我们必须深入气候模式的核心。我们发现的并非我们世界完美、晶莹剔透的复制品,而是一个建立在网格之上的世界。想象一下通过纱门看地球:你可以清楚地看到大的形状,但网格中单个方块内发生的一切都模糊成单一、均匀的颜色。这是气候建模的根本挑战。我们可以写下物理定律——宏伟的流体运动方程,即 Navier–Stokes 方程——它们控制着每一缕风和每一滴雨。但我们根本无法承担为全球每一个空气分子求解这些方程所需的计算能力。我们被迫简化。

网格框中的世界:一种必要的缺陷

气候模式的世界分为​​可解析尺度​​和​​不可解析尺度​​。可解析尺度是比模式网格框更大的大尺度天气型,例如横跨大陆的巨大气旋和反气旋。模式直接根据物理定律计算它们的演变。不可解析尺度,或称​​次网格​​尺度,则涵盖了其他一切:冲击飞机的单个湍流涡旋、单个雷暴云的生命周期、小尺度洋流对热量和盐分的混合。这些过程完全在单个网格框内生灭,模式无法直接“看见”它们。

然而,这些微小、不可见的过程却具有一股集体力量,塑造着整个气候系统。例如,云的形成极大地改变了反射回太空的太阳光量。湍流的不断搅动在整个大气中混合能量和水汽。大尺度与小尺度紧密地交织在一起。我们无法直接观测小尺度过程,这导致了所谓的​​闭合问题​​:我们如何解释次网格世界对我们试图预测的可解析世界的关键反馈?

旧方法:一个平均值的世界

对这个问题的传统答案是创造一套规则,即​​确定性参数化方案​​。“参数化”只是一个花哨的术语,指的是一个将未知的次网格效应用已知的、可解析的大气状态联系起来的过程。其理念很简单:让我们尝试捕捉所有次网格混沌的平均效应。

想象一下,试图预测一根大木头在湍急河流中漂流的路径。确定性参数化方案就像是计算河流的平均速度和方向,并假设木头会简单地沿着该路径移动。这是一个合理的第一猜测,它捕捉了木头向下游漂移的主要趋势。在数学上,这种方法试图找到​​条件均值​​:在模式可见的大尺度流场状态下,它将从次网格世界接收到的最可能的一个推动力是什么?。

几十年来,这个“平均值的世界”一直是气候建模的主力。但它有一个深刻的内在缺陷。通过用一个单一、平滑的平均值取代次网格世界丰富、波动的现实,我们的模式变得过于简单、过于可预测,并且常常出现系统性错误。它们就像一个以完美单调的语调说话的人,传达了大致信息,却丢失了真实言语的所有质感和情感。

拥抱混沌:随机思想

这引出了一个更新颖,且在许多方面更深刻的思想:​​随机参数化​​。其核心见解是:当我们也可以尝试表示平均值周围的波动时,为什么只满足于平均效应呢?。

让我们回到河里的那根木头。河流不只是一股平滑的平均水流。它充满了涡旋、漩涡和突然加速的水流,这些都在随机地推挤着木头。随机方法不仅计算平均水流,它还给木头一系列随机的“踢动”,以模拟这些涡旋的影响。

这并非为了增加随机性而增加随机性。这是对现实更真实、物理上更完整的描述。次网格世界本身就是混沌的。对于任何给定的​​大尺度状态——比如一个具有特定平均温度和湿度的网格框——其内部可能存在无数种小尺度湍流和对流的构型。这些构型中的每一种都会对大尺度产生略微不同的反馈。确定性方案只选择一种,即平均值。而随机方案则承认这种不确定性,在每一步中,从所有可能性的完整分布中抽取一个可能的结果。它承认我们不知道确切的次网格反馈,但我们可以对其统计性质做出有根据的猜测。

不只是抖动:随机性如何改变气候

此时,你可能会有一个非常合理的反对意见。你可能会说:‘好吧,所以你在增加一些随机的踢动。如果这些踢动是真正随机且平均值为零,它们难道不应该只是给解增加一些‘模糊’或‘抖动’,而保持长期平均值——也就是气候——不变吗?’

这正是事情变得真正有趣的地方。答案出人意料,是一个响亮的​​“不”​​。在适当的条件下,添加均值为零的随机性可以系统地改变一个系统的长期平均状态。这一非凡的现象被称为​​随机订正​​或​​噪声诱导漂移​​,是随机参数化最重要的结果之一。

为了理解其原理,我们需要看一个简单的数学玩具模型,但它揭示的原理是深刻的。想象一个简单的量,我们称之为 XXX,其演变受两种效应控制:一个常数源 FFF 将其推高,以及一个线性阻尼项 −aX-aX−aX 试图将其拉回。在没有其他干扰的情况下,XXX 会稳定在一个源和汇平衡的稳态:Xsteady=F/aX_{steady} = F/aXsteady​=F/a。

现在,让我们引入一个随机元素。但我们不只是简单地添加一个随机数,而是让随机性是​​乘性​​的——也就是说,其强度取决于 XXX 本身的状态。我们可以通过添加一个形如 σX∘dWt\sigma X \circ dW_tσX∘dWt​ 的项来模拟这一点,其中 σ\sigmaσ 是噪声强度,而 dWtdW_tdWt​ 代表来自随机过程的无穷小“踢动”。这就像是说,阻尼过程并非完全平滑,而是本身就“抖动”,且抖动程度与 XXX 的大小成正比。

当我们推导这个新的随机方程的数学过程时(具体来说,通过将其从所谓的 Stratonovich 形式转换为 Itō 形式),一件神奇的事情发生了。在 XXX 的演变方程中出现了一个新的、纯粹的确定性项:一个等于 +12σ2X+\frac{1}{2}\sigma^2 X+21​σ2X 的项。这就是噪声诱导漂移。它不是一个凑数因子或错误;它是系统状态与随机波动相互作用的根本结果。

其结果是,我们的阻尼项被有效地改变了。新的有效阻尼率为 aeff=a−12σ2a_{\text{eff}} = a - \frac{1}{2}\sigma^2aeff​=a−21​σ2。因此,系统的新稳态是 Xsteady=F/(a−12σ2)X_{\text{steady}} = F / (a - \frac{1}{2}\sigma^2)Xsteady​=F/(a−21​σ2)。请注意,这个值系统地大于确定性值!通过添加均值为零的乘性噪声,我们从根本上改变了我们简单系统的长期气候。这是一个极其强大的工具。如果一个真实的气候模式存在持续的偏差——例如,某个区域持续过冷,因为其物理方案实际上是过度阻尼的——引入精心设计的乘性噪声可以提供一种“订正”效应,将平均状态推向更接近现实的情况。

构造随机性的艺术:游戏规则

这引出了设计这些参数化方案的工艺。我们不能只是向模式中扔进随机数就指望一切顺利。随机性必须是“智能的”;它必须受到基本物理定律的约束。

规则 1:守恒必须守恒的量

质量、能量和动量守恒定律是神圣不可侵犯的。参数化方案绝不能凭空创造或消灭这些量。一种幼稚的方法是为每个网格框添加一个随机源项,但这恰恰会导致模式中的总质量或总能量以随机游走的方式漂移。

一个远为优雅的解决方案是将随机性表述为​​随机通量​​,而非源项。我们不是在网格框内部随机增减示踪物质量,而是在相邻网格框之间引入随机的质量传输。一个网格框失去的,其邻居会得到。当我们在全球范围内对变化求和时,这些传输会形成一个伸缩求和,恰好抵消为零。全球质量在任何时刻都完美守恒,而不仅仅是平均守恒。这是优秀物理建模中内在数学美的一个例子。

同样,正如我们看到的乘性噪声可以注入能量一样,一个精心设计的方案必须考虑到这一点。如果目标是能量中性方案,可以添加一个确定性校正项(一个负漂移项),旨在平均上完美抵消噪声诱导的能量源。甚至可以设计出更复杂的方案,其中随机波动在数学上被约束在模式状态空间中不改变总能量的方向上,就像在一个有轮廓的表面上滚动一个球而不改变其高度一样。

规则 2:尊重边界

物理量通常有硬性限制。空气中的水汽含量不能为负。一个网格框被云覆盖的比例必须在 0 和 1 之间。一个简单的加性随机踢动很容易将变量推出这些物理边界之外。

一个更智能的设计,同样是让噪声依赖于状态。我们可以设计噪声振幅 σ(X)\sigma(X)σ(X),使其在状态 XXX 接近物理边界时收缩至零。例如,当水汽浓度接近零时,随机踢动变得极小,从而防止模式产生负值。随机性尊重了系统的物理现实。

规则 3:结构合理

我们试图模拟的次网格过程并非独立事件的泡沫状混沌。一个对流风暴系统是一个连贯的物体,可以跨越数个模式网格框并持续数小时。海洋中的湍流涡旋具有特征尺寸和生命周期。

因此,我们引入的随机强迫应该反映这一现实。它不应是“白噪声”模式,像电视雪花那样,每个时空点都相互独立。相反,它应该具有​​时空相关性​​;它看起来应该更像沸水的形态,具有以物理上合理的方式演变和移动的连贯结构。这可以通过先进技术实现,例如,使用具有有限“记忆”时间的随机过程,并扩充模式状态以追踪噪声的演变。

工具箱一瞥:两种主要风格

那么,建模者实际上是如何将这些原则付诸实践的呢?随机参数化主要有两种方法,或称“风格”。

第一种是​​扰动倾向项​​。在这种方法中,确定性物理方案首先计算出对次网格倾向项的最佳猜测。然后,将这个最终输出乘以一个精心构建的、具有所需统计特性(相关性、守恒性等)的随机场。这是一种灵活且流行的方法。

第二种风格是​​扰动参数化方案的内部机制​​。我们不是扰动最终输出,而是在物理方案本身的内部运作中引入随机性。例如,一个边界层方案可能使用一组上升的“羽流”来模拟湍流。随机版本不是固定这些羽流的数量和强度,而是在每个时间步从一个概率分布中随机抽样。一个对流方案可能有一个参数,控制着多少周围空气被夹卷到上升的云中;我们可以让这个参数本身成为一个随机变量。这种方法感觉上更具物理直接性,并且通常具有自动继承底层确定性方案守恒性质的优点。

回报:更好的预报,更诚实的预估

为什么要费这么多功夫?其好处是实实在在且深远的。

首先,随机方案提供了对不确定性更好的估计。确定性预报模式只给出一个答案,并且常常对其预测过度自信。​​集合预报​​通过多次运行模式,每次使用略微不同的初始条件,来创造一系列可能的未来。通过添加随机物理过程,我们正在表示另一个关键的不确定性来源:模式本身的不完美性和次网格世界固有的随机性。这会导致更宽、更真实的集合离散度,为预报员提供对可能发生情况的更诚实的评估。一个包含随机物理过程的集合预报能更好地认识到自身的“无知”。

其次,正如我们所见,随机参数化可以系统地减少长期存在的模式偏差,将模式模拟的气候推向更接近观测的结果。通过表示缺失的物理过程,它们可以校正模式世界中平均温度、降水和环流型的误差。

最终,随机参数化代表了一种范式转变。它标志着我们从构建单纯的确定性预测机器,转向创建能够更忠实地模拟我们这个复杂、美丽且本质上混沌的气候系统的统计模拟器。

应用与跨学科联系

在深入了解了随机参数化的原理之后,我们可能会感到一种抽象的满足感。但科学在其最佳状态下并非一项观赏性运动。它是我们理解和预测世界的工具。那么,这个优雅的数学机制究竟在何处落地?它在哪些方面帮助我们解决实际问题?答案是,无处不在,从单一雷暴云的核心,到地球气候宏大而缓慢的节奏,再到人工智能的最前沿。

引擎内部:大气的随机心跳

想象一下,你正在构建一个地球大气模型。你的计算机网格将世界划分为一个个方框,边长可能为一百公里。在其中一个方框内,成千上万的积云可能正在像锅里的爆米花一样冒泡、生长和消亡。你不可能模拟这些云中每一滴水滴的运动。那么,你该怎么办?

纯粹的确定性参数化方案可能会说:“当方框内的平均温度和湿度超过某个精确阈值时,对流就会开启。”这过于简单化了。这就像说爆米花只有在锅内平均温度正好达到 180∘C180^\circ \text{C}180∘C 时才会爆开。实际上,由于结构和位置的微小差异,有些玉米粒会早一点爆开,有些则晚一点。

随机参数化方案拥抱了这种次网格的多样性。我们可以想象阈值本身带有一些随机性,而不是一个固定的对流起始阈值,这代表了网格框中某些部分比其他部分更适合发生对流。我们还可以将对流羽流与其环境混合的速率——即“夹卷”率——等属性视为一个随机变量。通过扰动这些我们对流定律的物理输入,模式的每一次实现都会计算出一个物理上一致的结果。这种方法比仅仅向最终的加热率添加随机噪声要强大得多,因为它尊重了能量和质量守恒等基本定律。

其美妙的结果是,一个行为更像真实世界的模式。它对大尺度天气型产生了更平滑、更真实的响应。也许最重要的是,它允许“自发”对流的发生,即使网格框平均来看还不够不稳定——这捕捉到了那些决定提早爆开并可能组织成更大风暴系统的“特立独行”的云。

同样的原理不仅适用于空气的运动,也适用于能量的流动。考虑照射在一个有云网格框上的阳光。一个简单的模型可能会计算平均云量,并用它来确定有多少光线能够穿过。但这是错误的!一个一半被厚而不透明的云覆盖、一半晴朗的方框,与一个完全被半透明薄雾覆盖的方框是不同的。支配光衰减的定律,即 Beer-Lambert 定律 T=exp⁡(−τ/μ)T = \exp(-\tau/\mu)T=exp(−τ/μ),是非线性的。由于其凸函数形状,平均透射率总是大于平均光学深度的透射率。这是被称为 Jensen 不等式的一个普遍数学规则的体现。使用平均云属性总是会使模式世界看起来比实际更暗、更多云。

我们如何修正这种偏差?通过随机思考!我们可以不使用单一的平均云,而是使用一个盒子内可能云状态的概率分布——有些部分晴朗,有些部分有不同厚度的云。通过为每种可能性计算辐射,然后对结果进行平均,我们就能得到正确的答案。像蒙特卡洛独立列近似这样的复杂方法正是这样做的,它们在单个网格框内创建一个云结构的统计集合,以计算出真实、无偏的辐射通量。

从天气到气候:编排地球的节律

这些小尺度随机踢动的影响并不仅限于单个网格框或单日。它们可以累积起来,引导整个气候系统。以厄尔尼诺-南方涛动(ENSO)为例,这是热带太平洋地区变暖和变冷的宏大景象,影响着全球的天气模式。很长一段时间里,我们认为它是一个缓慢的、确定性的振荡,就像一个来回摆动的钟摆。

但这个钟摆不断受到颠簸。西太平洋是零星、高频“西风爆发”——本质上是天气噪声事件——的发生地。使用简化的气候模型,我们可以证明这些随机爆发不仅仅是麻烦;它们是故事的关键部分。它们就像随机的踢动,可以将气候状态推过一个临界点,从而引发一场全面的厄尔尼诺事件。要恰当地表示这一点,需要将西风爆发建模为一个带有“记忆”的随机过程,比如 Ornstein-Uhlenbeck 过程,它捕捉到了一旦爆发开始,往往会持续一段时间的事实。

这揭示了关于我们气候的一个深刻真理。我们在年和十年时间尺度上看到的缓慢、宏伟的变化,并非与日常天气快速、混沌的舞蹈无关。正如物理学家 Klaus Hasselmann 首次提出的那样,气候系统的慢分量,如具有巨大热容量的海洋,充当了这种快速天气噪声的积分器。一个简单的能量平衡模型完美地展示了这一点:用高频随机能量脉冲驱动一个缓慢散热的系统,该系统的温度将表现出巨大、缓慢的随机波动——一个“红化”的变率谱。本质上,气候系统记住了随机天气踢动的累积历史,而这种记忆表现为长期气候变率。随机性不仅是气候的一个特征;它也是气候的一个来源。

预测的艺术:数据、集合和不确定性

所以,随机参数化使我们的模式在物理上更真实。但它们如何改善我们的实际预报呢?答案在于集合预报的概念。我们不再只运行一个天气预报;我们运行一个庞大的集合,每个成员的初始条件略有不同,以捕捉预报中的不确定性。

该领域一个持续的难题是,模式集合通常“离散度不足”——它们过于自信,预测的结果范围比我们在现实中看到的要窄。这是因为模式方程中缺少不确定性的来源。随机参数化正是解药。通过表示极地冰盖上表面热通量等过程中未解析的变率,它们向每个集合成员注入了基于物理的随机量。这增加了集合离散度,从而对预报不确定性进行了更可靠、更诚实的评估。我们甚至可以校准我们随机方案的强度,以确保最终的集合离散度与观测到的真实世界天气的离散度相匹配。

这与资料同化领域密切相关,即融合模式预报与真实世界观测的科学。集合资料同化中一个常见的技巧是“协方差膨胀”,即通过一个简单的乘法因子 λ\lambdaλ 人为增加预报不确定性,以防止滤波器变得过于自信而忽略新的观测。这为什么有效?问题 4094936 提供了一个惊人清晰的答案:这个膨胀因子本质上是对一个显式模式误差项 QQQ 的粗略替代。像随机动能背散(SKEB)和随机对流这样的随机方案所引入的方差,为这种膨胀提供了物理基础。随机参数化用物理过程取代了一个统计上的“凑数因子”。

更好的是,资料同化的过程可以教会我们关于模式缺陷的知识。预报与其旨在预测的观测之间的差异——即“新息”——是模式误差的直接度量。通过分析这些新息随时间的统计特性,我们可以诊断出我们模式不确定性的结构。这使我们能够调整随机误差模型的参数,本质上是利用数据来教我们关于我们自身“无知”的性质和程度。

新前沿:随机性与人工智能的相遇

这个故事的最新篇章正在气候科学与人工智能的交汇处书写。科学家们现在正在构建机器学习模型——深度神经网络——来模拟复杂且缓慢的物理参数化方案的行为。但一个确定性的人工智能模拟器并不比一个确定性的物理方案好;它提供一个单一的“最佳猜测”,而没有对自己不确定性的感知。

要构建一个值得信赖的人工智能,我们必须使其具有概率性。在这里,我们必须区分两种不确定性。*偶然不确定性*是物理过程本身固有的随机性——对流那种爆米花般的性质,任何模型都无法完全解析。认知不确定性是模型自身因使用有限数据进行训练而产生的不确定性。一个稳健的概率性模拟器必须同时捕捉这两种不确定性。

这促进了复杂神经网络的发展,它们不仅预测一个单一值,例如每个垂直层级的温度倾向,而是预测一个完整的概率分布。它们可以学会不仅预测一个平均廓线,还预测一个描述不确定性以及至关重要的、大气中不同层级之间物理相关性的完整协方差矩阵。此外,这些概率性输出可以在数学上被约束,以遵守基本的物理定律,如大气柱中的能量守恒。

拥抱无知之美

随机参数化的历程是科学进步的一个绝佳范例。我们从完美、确定性定律的理想开始。然后,我们谦虚地承认了这些定律与我们试图模拟的复杂、多尺度世界之间的差距。但我们没有将这个差距视为失败,而是将我们的“无知”转变为一种预测工具。

通过用严谨的概率语言来表示我们所不知道的,我们构建出的模型不仅更准确,而且对自身的局限性也更诚实。随机参数化将确定性的方程世界与概率性的观测世界联系起来,揭示了对我们星球及其未来预测能力的更深刻、更统一的理解。归根结底,这是将不确定性转化为洞察力的科学。