天气预测模型：原理与应用

玻尔百科

核心要点

天气预测模型建立在流体动力学的原始方程组之上，通过数值离散化和物理近似（如静力平衡）使其变得可解。
建模者采用半隐式方案等巧妙技术来克服CFL条件施加的计算限制，并使用算子分裂法来处理发生在截然不同时间尺度上的过程。
诸如云形成等次网格尺度现象通过参数化来表示，其中尺度感知方案对于在分辨率“灰色地带”运行的模型至关重要。
除了日常预报，这些模型还是地球系统科学中的关键工具，用于气候预测、冰盖建模，并实现“地球数字孪生”的愿景。

引言

从本质上讲，天气预测是人类最具挑战性的计算任务之一：预测一个覆盖全球的混沌、湍流流体的未来状态。天气预测模型是我们完成这项任务的主要工具，它将基本的物理定律转化为可操作的预报，以保障生命、驱动经济并影响我们的日常决策。然而，从物理原理到可靠预报的实现过程充满了复杂性，需要将物理学、数学和计算机科学融会贯通，才能驾驭大气错综复杂的行为。本文将层层剖析这些卓越的科学仪器。首先，我们将探讨“原理与机制”，深入研究构成现代天气模型引擎的核心方程、巧妙的近似和数值方法。随后，在“应用与跨学科联系”部分，我们将考察这些模型如何被使用、改进和扩展——从精进恶劣天气警报到应对地球系统科学的宏大挑战。

原理与机制

大气本质上是一种流体，一片广阔、翻腾的空气海洋，其运动遵循着永恒的物理定律。预测天气，就是预测这种流体的未来状态。如果我们能写下并解出描述每一个碰撞分子的方程，我们的任务就完成了。虽然我们无法追踪每一个分子，但我们可以退而求其次：我们可以使用一套著名的规则，即原始方程组，来描述流体的宏观属性——其压力、温度、密度和速度。这些方程仅仅是经典物理学中宏大的守恒定律在大气语言中的转译：牛顿第二定律成为动量守恒，再加上质量守恒和支配能量守恒的热力学定律。

这些方程代表了我们对大气大尺度行为最完整的描述。它们错综复杂、优美，但不幸的是，求解起来异常困难。构建天气模型的过程是一段人类智慧的旅程，充满了一系列巧妙的近似和绝妙的技巧，旨在驯服这种复杂性，使问题能为机器所解。

静力平衡的取舍

我们可以做的第一个也是最有效的简化之一，是注意到大气层极其薄。就像篮球表面的一层油漆，其垂直范围与其水平广度相比微不足道。对于主导全球环流的广阔的、横跨大陆的天气系统而言，空气主要进行侧向运动。气块的垂直加速度与持续向下的重力相比，完全可以忽略不计。

这导向了一个意义深远的简化，即静力近似。我们假设任何一点的压力仅由其正上方空气的重量决定，就像一叠薄饼底部的压力由其上方所有薄饼的重量决定一样。剧烈的上下颠簸被忽略，取而代之的是一种宁静、稳定的平衡。这种近似是大多数全球天气和气候模型的基石，因为它滤除了垂直传播的声波，否则这些声波将要求计算时间步长小到不切实际。

但每一种近似都有其适用极限，而正是在这些极限点上，物理学变得最为有趣。我们所造成的误差有多大？想象一个强雷暴，一个“深对流上升气流”，其中空气在约 $1.5 \ \mathrm{km}$ 的垂直距离上以 $25 \ \mathrm{m/s}$ 的速度向上飞窜。一个简单的尺度分析表明，被忽略的垂直加速度项约为重力的4%。这听起来可能不多，但它却是雷暴猛烈动态的引擎。对于这些现象，静力平衡被打破了。

其后果不仅是定量的，也是定性的。考虑风流过山脉时在大气中产生的波。一个完整的、非静力模型——即包含所有加速度项的模型——能正确预测这些波的传播方式。然而，对于水平波长较短的波，静力模型会犯下显著的错误。静力方程的数学原理预测，这些短波的能量将以不符合物理规律的高速垂直传播，基本上是将能量直接射向太空。而更精确的非静力模型显示，这些波实际上是被困住的，其能量传播得慢得多。正是这一差异，使得旨在预测雷暴、山地湍流和其他小尺度天气的现代高分辨率模型必须采用非静力模式。选择静力模型还是非静力模型，并不仅仅是偏好问题，而是关于你希望解析哪些物理过程的根本性选择。

测地线网格上的数字大气

流体运动的连续方程，无论是否为静力平衡，都描述了一个无限细节的世界。然而，计算机是有限的产物。为了使问题易于处理，我们必须进行离散化：我们将连续的大气切割成有限数量的网格单元（或盒子），并求解每个盒子内的平均属性。平滑场的流体世界被网格上数字的数字世界所取代。

你可能会认为，如何布置这个网格仅仅是编程便利的问题。但最深刻、最成功的数值方法，是那些教会离散网格尊重连续方程优美对称性的方法。流体动力学中最重要的量之一是涡度——流体的局部“旋转”。物理学中的一个基本结果，即Kelvin-Stokes定理，将围绕闭合回路的环流（总旋转量）与该回路所包围区域内的涡度总和联系起来。

现代天气模型通常建立在测地线网格上，这种网格用六边形和五边形的网络覆盖球面，很像一个足球。事实证明，通过巧妙地安排或交错我们存储变量的位置——例如，在网格单元的边缘定义风速，在其中心定义压力（这种设置被称为Arakawa C-网格）——我们可以创建一个离散版本的环流-涡度关系。对于某些简单的流动，如刚体旋转，这种离散计算给出的结果与连续物理学的完全相同。这是数值设计的巨大成功。它确保了模型即使在其离散化形式下，也能以与真实大气相同的方式守恒涡度等基本量，防止不符合物理规律的误差累积并破坏预报。

Courant条件：模拟的速度限制

一旦我们有了网格，就必须一步一步地在时间上推进预报。一个关键问题随之而来：每个时间步长 $\Delta t$ 可以设多大？答案由数值模拟中最基本的原则之一——Courant-Friedrichs-Lewy (CFL) 条件所决定。

想象一阵风吹过我们的网格。CFL条件是一个简单的因果关系陈述：在单个时间步长内，信息（那阵风）的传播距离不能超过单个网格单元的宽度 $\Delta x$ 。如果超过了，数值方案将无法“看到”网格点上变化的原因，从而导致灾难性的不稳定性，使误差呈指数级爆炸。该条件可以写成一个不等式：

\frac{u_{\max} \Delta t}{\Delta x} \le 1

其中 $u_{\max}$ 是模型中任何信号能够传播的最快速度。这个简单的规则对建模者施加了一种“暴政”。要将预报的分辨率提高一倍（将 $\Delta x$ 减半），你必须同时将时间步长 $\Delta t$ 减半。因为现在你的网格点数量（在二维情况下）是原来的四倍，并且需要两倍的步数来覆盖相同的预报时段，总计算成本增加了八倍。这种尺度关系是为什么仅仅通过提高分辨率来捕捉更多细节在计算上如此昂贵的主要原因。对于一个具有嵌套域的模型——一个粗糙的全球网格内嵌有更精细的区域网格——整个系统的单一、统一时间步长由最精细网格上的CFL条件决定，这使得那个小的高分辨率区域成为整个模拟的瓶颈。

情况实际上甚至更严格，因为限制速度 $u_{\max}$ 不是风速，而是传播最快的波的速度——快速移动的重力波，其传播速度类似于声速（ $c \sim 300 \ \mathrm{m/s}$ ）。为了保持稳定，一个显式模型必须采用极小的时间步长，通常只有几秒钟，即使“天气”（我们关心的风暴和锋面）演变得慢得多。

规避速度限制

我们如何摆脱CFL条件的“暴政”？答案在于另一个区分“快”物理和“慢”物理的巧妙技巧。天气系统的平流发生在慢时间尺度上，而重力波的传播则非常快。半隐式方案利用了这种分离。

其思想是区别对待这两类过程。慢的平流项被显式处理，基于模型在当前时间步的状态进行计算，这需要遵守基于风速的CFL条件。而快的重力波项则被隐式处理。模型不是逐步计算它们的影响，而是求解一个方程来确定它们在整个更长时间步长内的平均影响。这需要在整个网格上求解一个大型的耦合方程组（一个椭圆型或 Helmholtz 型问题），但它完全消除了快波施加的严格稳定性限制。

这使得模型能够采用大的时间步长（几分钟而不是几秒钟），这些步长仅受较慢的、具有气象意义的过程的精度要求限制。半隐式方法是一种完美的折衷，是物理学家和数学家如何根据问题的自然时间尺度调整其工具，从而使计算密集型的全球预报成为可能的一个典型例子。

未被解析的世界：参数化与灰色地带

到目前为止，我们只讨论了那些大到足以被我们的网格“看到”的现象。但是，那些比一个网格框更小、却至关重要的过程，比如单个云的形成、大气最底层混合空气的湍流涡旋，或者雨滴的产生，又该如何处理呢？这些过程是次网格的，但它们的集体效应对于天气至关重要。

我们不能忽视它们。相反，我们必须通过一套被称为参数化的规则和方法来表示它们对已解析尺度的统计效应。这通常被称为闭合问题，因为我们试图通过用已知的、已解析的变量来指定未知的、未解析的运动的影响，从而“闭合”我们的方程组。

参数化方案通常分两部分工作。首先，一个触发函数决定一个次网格过程是否应该发生。例如，一个深对流方案会持续检查已解析的温度和湿度场，看大气是否不稳定并且有足够的抬升能量（如对流有效位能，CAPE）。如果条件满足，触发器就被启动。其次，一个速率定律或闭合假设决定该过程做了多少——即参数化的雷暴垂直输送了多少热量和水分。

当尺度分离明显时——即网格单元远大于被参数化的现象时，这种方法效果很好。但是，当网格间距缩小到与次网格过程的大小相当时会发生什么？当你的模型网格尺寸为 $2 \ \mathrm{km}$ ，而你试图参数化的湍流涡旋或对流羽流的宽度也大约是 $1$ - $2 \ \mathrm{km}$ 时，会发生什么？

这就是令人畏惧的湍流和对流的“灰色地带”。在这种情况下，模型的已解析动力学开始“看到”并明确地产生参数化方案正试图代表的那些运动。结果往往是对效应的“双重计算”，导致显著的预报误差。对模型分辨率“视而不见”的经典参数化方案在这种灰色地带会失效。

解决方案是构建尺度感知的参数化方案。这些是更复杂的方案，明确依赖于模型的网格间距 $\Delta$ 。利用湍流理论的原理，如 Kolmogorov 能量谱，尺度感知方案可以估计一个过程（如对流或湍流混合）中有多大比例被网格解析，有多大比例是次网格的。然后，它只对未解析的部分施加其参数化效应。随着模型分辨率变得更精细（ $\Delta \to 0$ ），解析的比例接近100%，参数化方案便会平滑地淡出，将完全控制权交给模型的显式动力学。随着分辨率变得更粗糙（ $\Delta \to \infty$ ），该方案平滑地过渡到传统的、全强度的参数化。这种优雅的方法允许一套统一的物理方案在从粗糙的气候模型到风暴尺度的预报系统的整个模型分辨率谱系中无缝工作。

建模的艺术：同化与调优

最后，即使拥有最复杂的物理学和数值方法，模型也不是一台预言机器。它是一个必须被巧妙运用的工具。还有两个实际挑战依然存在：从哪里开始预报，以及如何设置我们参数化方案中出现的几十个不确定的数字——那些旋钮和刻度盘。

这些挑战催生了两种截然不同但至关重要的活动：资料同化和模式调优。

资料同化是确定预报最佳初始状态的科学。这是一个巨大的侦探问题。给定一个由卫星、探空气球、飞机和地面站提供的数百万个近期观测数据组成的网络，以及来自前一个周期的预报，资料同化旨在寻找整个全球大气的唯一三维状态，该状态与所有可用信息最为一致。这个最优的“临近预报”成为下一次预报的起点 $x_0$ 。
模式调优与校准解决了模型内部参数 $p$ 的不确定性。其中一些参数在称为调优的过程中被调整，以确保模型遵守基本的、全球积分的约束。例如，辐射方案中的参数被调整，以使模型星球平均而言与太空保持稳定的能量平衡，防止其随时间不切实际地升温或降温。校准是一个更广泛的过程，它调整参数，使得模型的长期统计数据——其“气候”——与观测到的气候学相匹配，例如平均温度分布或降雨模式。

因此，一个现代天气预测模型是一个宏大的综合体。它不仅证明了基本物理定律的力量，也证明了使其可解的数值方法的巧妙、代表了不可见世界的参数化的独创性，以及不断微调模型以使其数字世界与我们真实世界保持一致的实践艺术。

应用与跨学科联系

在了解了赋予天气预测模型生命的那些基本原理之后，我们可能会认为故事就此结束。但在科学中，理解“如何做”仅仅是通往一个更激动人心问题——“为了什么”——的前奏。我们所探讨的复杂的方程之舞本身并非目的；它是一个庞大且不断增长的应用生态系统的引擎，一个不仅能预测明日降雨，还能帮助我们应对我们时代一些最深刻挑战的工具。它是一座连接物理学与政策、数学与救灾、计算机科学与我们星球未来的桥梁。现在，让我们来探索这个应用世界，看看这些模型如何超越屏幕，重塑我们与世界的关系。

精进预报：从原始数据到高风险预警

天气模型的核心是一个预报员。但如果预报从错误的起点开始，或者我们无法判断是否应该信任它，那么这个预报就毫无价值。因此，我们模型最直接的应用，都围绕着让它们变得更敏锐、更可靠、更具相关性，尤其是在高风险情况下。

一个由数学构成的纯净世界——模型，如何知道此时此刻近海正在酝酿的风暴？它无法知道，除非有帮助。模型必须通过持续不断地注入观测数据来与现实相连。这个过程被称为资料同化，就像飞行员根据地标不断修正航向一样。卫星、探空气球、地面站，甚至商用飞机，都是模型的眼睛和耳朵。雷达等专门观测提供了发展中风暴的详细图像。先进的技术允许模型吸收这海量数据，例如雷达反射率，并用它来调整其内部状态，从而显著改善对雷暴和龙卷风等恶劣天气的预报。这不是一个静态过程；它是一个动态的、维持生命的反馈循环，模型在此过程中不断被“推”向更接近真实大气，尤其是在对流的湍流核心，那里的物理过程本身可能最不确定。

但如果我们有不止一个模型呢？事实证明，就像征求意见一样，听取一个专家委员会的意见通常比相信一个人的声音要好。这就是集合与多模式预报背后的原理。业务中心不是只运行一个预报，而是运行许多个，方法可以是稍微调整单个模型的初始条件（一个集合），也可以是汇集世界各地开发的不同模型的结果。将这些预报结合起来本身就是一门科学。它不是简单的平均，而是一种复杂的统计综合，根据每个模型过去表现来赋予其权重，甚至考虑到它在不同的大尺度天气型（或称“环流型”）下的表现如何。通过了解每个模型的优缺点，我们可以构建一个比任何单个组成部分都更具技巧和可靠性的共识预报。

当然，这提出了一个关键问题：我们如何衡量“技巧”？我们如何知道一个预报是好是坏？这就把我们带到了预报检验领域。当一个模型预测有30%的降雨概率时，这到底意味着什么？事后我们又该如何评分？为此，科学家们转向了一个在医学或机器学习领域更为常见的统计学分支。使用诸如受试者工作特征（ROC）曲线之类的工具，我们可以在整个概率阈值范围内，严格地衡量模型区分事件发生与不发生的能力。这使我们能够量化预报的真实判别能力，从简单的“对”或“错”转向对其可靠性的细致理解——这是发布可信的公众预警的关键一步。然而，最终的考验在于预测那些最关键的事件：极端事件。预测一个平常的日子是一回事，而捕捉到百年一遇的洪水则是另一回事。这需要一种特殊的统计学——极值理论——来窥探概率分布的“长尾”，并探究模型的现实是否能够产生与我们所见的同类罕见灾难。

建模者的艺术：在球形画布上驾驭复杂性

我们到目前为止讨论的应用都涉及将模型作为一个成品工具来使用。但一个同样引人入胜的跨学科故事存在于其构建过程本身。构建一个虚拟地球是一项史诗般的工程，它推动了物理学、应用数学和计算机科学的边界。

想想我们脚下的土地。一个模型网格单元，宽度可达数公里，并非一块均匀的“土地”。它是一个复杂的马赛克。山谷中的一个单元格可能包含森林、岩石山峰、冰川、城镇和河流。这些地表中的每一个行为都不同。城市沥青吸收和辐射热量的方式与森林冠层不同；冰川引入了独特的融化物理过程；湿地则完全改变了水平衡。为了捕捉这一点，模型不将一个网格单元视为单一事物，而是看作“瓦片”的集合。模型为每个瓦片——城市瓦片、植被瓦片、水体瓦片——计算能量和水平衡，然后将它们组合起来得到平均效应。这种“瓦片”方法是一个绝佳的例子，展示了建模者如何跨越尺度，在模型的结构化网格内表征我们世界精细的复杂性。

这种复杂性延伸到空中。一个雨滴的形成涉及一系列令人眼花缭乱的微物理过程——凝结、碰撞、冻结——这些过程发生在秒级或更短的时间尺度上。然而，它们所处的大尺度天气系统却以天为单位演变。风的缓慢华尔兹和云粒子的狂热吉格舞必须在同一个模型中共存。将这些过程整合在一起是一个深刻的数值挑战。微物理方程是“刚性”的；它们变化如此之快，以至于正常的时步会导致解爆炸成无意义的结果。优雅的解决方案是一种称为算子分裂的技术，模型在此暂停慢动力学过程，让快的微物理过程通过许多微小的“子步”来跟上，然后再将控制权交还给大尺度流。这是一种计算上的巧妙手法，是模拟我们大气多尺度特性的必要之举 [@problem-id:4089325]。

即使是我们生活在一个球体上这个简单的事实，也带来了深奥的数学难题。大多数模型使用经纬度网格，我们都从世界地图上熟悉它。但看看地球仪：经线在两极汇合。在赤道处宽一公里的网格单元，在北极附近缩小到只有几米。数值稳定性的基本规则，即Courant-Friedrichs-Lewy（CFL）条件，规定模型的时步必须足够短，以使信息不会在一步之内跳过整个网格单元。随着靠近两极的网格单元变得无限小，所需的时步将不得不缩小到几乎为零，从而使整个全球模拟陷入停顿。这个“极点问题”催生了数十年的数学创造力，导致了巧妙的数值方案和替代的网格结构，所有这些都是为了将我们的球形世界准确地映射到计算机的有限逻辑上。

超越明日天气：地球系统科学与数字未来

尽管天气模型如此复杂，但它们只是一个更宏大科学谜题的一部分：将地球理解为一个单一的、相互关联的系统。用于预测天气的相同工具和物理原理现在正被扩展到模拟海洋、冰盖和生物圈，从而打造一门全新的、整体的“地球系统科学”。

例如，格陵兰和南极的巨大冰盖并非静止的冰块。它们是运动极其缓慢的粘性流体。控制空气中风的动量和应力平衡方程，经过调整可以用来描述冰在基岩上的流动。当然，物理过程必须量身定制——冰比空气粘稠得多——但基本方法是相同的。通过将冰盖模型与气候模型耦合，科学家可以研究变暖的大气和海洋将如何影响冰的流动并导致海平面上升，这是一个在气候尺度问题上具有天气尺度紧迫性的问题。

这种联系突显了一个关键区别：天气预报与气候预测之间的区别。一个向平流层注入气溶胶的地球工程提案提供了一个完美的例证。这将如何影响地球？一个天气模型可以告诉你未来一周大气环流可能如何变化。对于如此短的时间段，广阔的深海反应如此之慢，以至于其温度可以被视为一个固定的边界条件。但在一个运行100年的气候模型中，海洋是主角。辐射的持续变化将缓慢地加热或冷却海洋表层，这反过来又会反馈到大气上，从而产生一个根本不同的问题。天气预报是一个初值问题：给定系统现在的状态，下周它会处于什么位置？气候预测是一个边界强迫问题：系统在持续推动下，其长期统计特征将如何改变？相同的模型核心可以用于两者，但科学问题和必要的组成部分却截然不同，这种差异纯粹源于时间尺度的分离。

这把我们带到了最终的应用：不仅用这些模型来理解世界，而且用它们来帮助管理世界。正在兴起的一个愿景是地球数字孪生——一个在超级计算机中持续更新、完全互动的地球复制品。这样的孪生体将不仅仅是一个天气模型；它将是一个完整的信息系统，同化来自全球各地的实时数据，并能按需运行“假设”情景。部署可再生能源的最佳策略是什么？一场干旱将如何影响全球粮食供应链？数字孪生可以为决策者提供有科学依据的答案。但要使这样一个系统值得信赖，它必须是透明和可复现的。用于生成预报的每一个输入、每一个参数、每一行代码以及每一个硬件都必须被一丝不苟地记录下来。这条溯源链确保任何结果都可以被审计、验证和复现，从而构筑起科学与社会之间信任的基石。

从云的微观物理到覆盖全球的数字孪生愿景，天气预测模型已经从简单的预报工具演变为现代科学与社会不可或缺的仪器。它们是我们持久探索理解世界的证明，并且日益成为我们驾驭其未来的能力的体现。