
为了理解和预测地球气候的未来,科学家们依赖于有史以来最复杂的软件之一:地球系统模式。这些我们世界的数字孪生体模拟了大气、海洋、陆地和冰层之间错综复杂的相互作用。在这套机制的核心,是一个由纯粹物理和数学构成的强大引擎,即动力核心。虽然它的名字看似抽象,但其功能却很具体:在行星尺度上求解流体运动的基本定律。理解这一核心组件对于认识现代气候预测的强大能力及其内在局限性至关重要。
本文将深入探讨动力核心的精妙世界,揭示其工作原理及其重要性。我们将通过两大章节来探索其内部运作。第一章“原理与机制”将解构这个引擎,探讨它所求解的物理定律以及用于在计算机上驾驭这些定律的巧妙数值方法。接下来的“应用与跨学科联系”将把这个引擎投入实际应用,审视它如何在超级计算机上实现,如何与其他地球系统相互作用,以及它如何帮助科学家回答气候科学中一些最紧迫的问题。
想象一下,气候模式就像一个巨大而复杂的钟表装置,是我们星球的数字孪生体,旨在模拟从微风的低语到深海的缓慢搅动等一切现象。在这台机器的核心,是一个由纯粹的物理和数学构成的引擎:动力核心。它不是模式中了解云滴的复杂舞蹈、森林的绿化或空气化学的那部分。相反,动力核心是一个专家。它唯一而宏伟的目标是为一个旋转球体行星上的流体求解基本的运动定律。
它所求解的定律是物理学中最优美、最强大的定律之一,通常被称为原始方程。它们其实就是你在物理入门课程中学到的宏大守恒原理,只是被放大到了行星尺度。一个方程阐明了质量守恒:空气不能无中生有,也不能凭空消失。另一个是牛顿第二定律 ,但为气块重新构建,考虑了地球的引力、推动空气运动的气压差,以及由地球自转产生的、幽灵般但至关重要的科里奥利力。最后,一条热力学定律掌管着能量守恒,追踪空气在膨胀和压缩时如何升温和降温。
动力核心的工作就是将这些连续、优美的偏微分方程转换成计算机能够理解的语言——数字和网格的语言。它精细地计算大尺度的大气运动:急流、庞大的天气系统,以及主导我们地图的高压和低压。
那么其他一切呢?云、雨、近地面的湍流?这些过程太小或太复杂,无法在全球网格上进行显式计算。它们的影响由一组称为物理参数化的独立模块来表示。你可以把动力核心想象成根据流体动力学定律计算一个巨大河流系统的路径。然后,参数化方案会加入成千上万条微小、未在地图上标出的溪流(地表蒸发)、降雨(湿过程)和河床摩擦(湍流)的影响,这些因素都会汇入并影响主流。 动力核心整合了这些物理倾向,但它的主要身份是一个流体动力学求解器。
求解完整的原始方程是一项艰巨的任务,不仅因为它们复杂,还因为它们包含的现象跨越了巨大的速度范围。任何显式数值模拟的稳定性都受到著名的 Courant-Friedrichs-Lewy (CFL) 条件的制约。直观地说,该条件指出,在单个时间步内,信息(波)的传播距离不能超过一个网格单元。如果超过了,模拟就会变得数值不稳定,就像电影中演员在一帧内就跳过了整个屏幕。
问题在于,可压缩大气支持多种波。对于天气和气候,我们关心的是大尺度风(速度可能为 )和重力波。然而,大气也支持声波——声音——其传播速度约为 。对于典型的 模式网格间距,这些声波将迫使模式采用极小的时间步长,大约在分钟量级。模拟一个世纪的气候将需要永恒的时间。
在这里,物理学家采用了一种巧妙而强大的数学手术,称为非弹性近似。其理由很简单:声波对于听到雷暴至关重要,但对于该风暴的大尺度动力学而言,它们携带的能量非常少,基本上无关紧要。非弹性近似将它们滤除。它通过略微修改质量守恒方程来实现这一点。它不再允许密度随时间自由变化(声波传播的机制),而是施加一个约束,即由背景参考密度 加权的质量通量的散度必须为零:。
这样做的美妙结果是,大气压方程的性质发生了根本改变。它从一个双曲波方程转变为一个椭圆方程。这意味着压力不再随时间传播,而是由整个大气在该时刻的状态“瞬时”确定。声波传播的机制被从系统中彻底移除了。通过牺牲声学上“正确”但对气候无关的物理过程,模式的时间步长现在受到风和重力波这些慢得多的速度的限制,从而使计算效率提高百倍。
将自然的连续定律转化为计算机的离散计算,是构建动力核心的大部分“艺术”所在。这是一个充满精妙权衡和深刻物理直觉的世界。
全球动力核心面临一个独特的挑战:大气的物理特性并非处处相同。理解这一点的关键在于罗斯贝数 ,这是一个无量纲量,衡量惯性力(如平流)与科里奥利力的比值。这里, 和 是流动的特征速度和长度尺度, 是科里奥利参数,它取决于行星的自转速率 和纬度 。
在中高纬度地区(比如 ), 很大,使得 也很大。对于大尺度天气系统,罗斯贝数很小()。这是一个旋转主导的世界,流动处于近乎地转平衡的状态——气压梯度力与科里奥利力之间的精妙平衡。这是我们熟悉的旋转气旋和反气旋的领域。
但在赤道附近(比如 ), 很小。对于相同的天气系统,罗斯贝数会大得多。在赤道本身,,罗斯贝数为无穷大。这是一个惯性主导的世界,旋转的影响减弱。一个简单的计算表明,对于相同的天气系统,在纬度 的罗斯贝数比在纬度 大2.5倍以上。 这意味着一个全球动力核心必须精通两种截然不同的动力机制,在旋转主导的中纬度地区和惯性主导的热带地区都能准确运行。
中纬度地区地转平衡的重要性对数值方案提出了严格要求。它必须是良好平衡的。这意味着气压梯度力和科里奥利力的离散数值算子必须以完全兼容的方式构建。如果不是这样,即使一个完美平衡的初始状态也会在模式中产生虚假的、非物理的波,从而污染模拟。这就像造一辆车,左右轮的设计图纸略有不同;它永远无法直线行驶。一个良好平衡的方案确保了地转风上的科里奥利力的数值表示与数值气压梯度力是精确的离散对应物,从而维持了自然界中存在的完美平衡。
为完成这些壮举,模式开发者主要使用两大类数值方法,每种方法都有其独特的理念和精妙之处。
谱变换方法: 这些方法不是用网格上的值来表示温度和气压等大气场,而是将其表示为平滑全球波的总和,就像一个和弦是单个音符(谐波)的总和一样。对于主导大气的平滑、大尺度流动,这种方法非常准确。然而,它在处理非线性项时面临挑战,例如计算风对动量的平流。在谱空间中,这种简单的乘法变成了一个复杂的卷积。如果在离散网格上天真地处理,可能会导致混淆(aliasing),即来自未解析高频波相互作用的能量错误地“折回”并污染已解析的尺度,造成数值混乱。解决方法是去混淆(dealiasing),即在一个临时更高分辨率的网格(“变换网格”)上执行计算,然后再截断回原始谱分辨率,从而确保非线性乘积被精确计算。
有限体积方法: 这种方法将地球划分为大量的小盒子或“控制体积”,并精确追踪穿过每个盒子表面的质量、动量和能量流。其巨大优势在于其内在的完美守恒这些量的能力,这对于长期气候模拟至关重要。然而,在试图实现高阶精度时,这些方案可能会在像大气锋面这样的急剧梯度附近产生非物理的振荡或“摆动”。为了解决这个问题,它们采用了通量限制器。这些是聪明的非线性开关,可以检测到急剧梯度的区域,并在局部将高精度方案与更稳定的低精度方案混合,如同智能减震器一样,只在需要的地方抑制振荡,同时在平滑区域保持精度。[@problem_-id:4031511]
无论使用何种方法,所有动力核心都必须对抗数值噪声在其网格能解析的最小尺度上的累积。一个强大的工具是超扩散。与阻尼所有尺度的常规扩散不同,超扩散是一个像 (其中 或更高)这样的算子,具有极强的尺度选择性。通过设计,它可以在几小时的时间尺度上阻尼最小、最嘈杂的波(波长为两个网格间距),从而有效控制像吉布斯现象这样的数值伪影。然而,对于仅大四倍或八倍的波,阻尼时间尺度可能激增至数月甚至数十年,使得具有物理重要性的天气模式几乎不受影响。它是一个极其精确的数值海绵。
动力核心的原理是优雅的,但它们在真实地球系统模式中的实现,涉及到在理想化物理与我们星球和计算机的复杂性之间进行艰难的协调。
在山区会出现一个有趣的挑战。一个网格为 的模式可以“看到”像落基山脉这样的大型山脉,但无法解析单个山峰和山谷。流经山脉已解析部分的气流会在动力核心中产生重力波,这些波向上传播并对大气施加拖曳力。然而,模式还有一个物理参数化方案来考虑未解析的、次网格尺度山脉产生的拖曳力。这可能导致双重计算,即模式同时施加了来自已解析波和参数化波的拖曳力,导致对大气流动的过度、不切实际的制动。现代的解决方案是让参数化方案“感知”动力过程。这些方案会计算已解析气流已经产生的波致拖曳,并按比例减少参数化拖曳,从而防止重复做同样的工作。
算法的选择也受到现代高性能计算的实际情况的驱动。例如,在 GPU 上,瓶颈可能是内存带宽(数据移动的速度)而不是原始计算能力(flops)。这影响了时间步进方案的选择。像 Adams-Bashforth 这样的多步法方案在计算上非常快,但需要从内存中读取前几个时间步的历史记录,如果内存带宽有限,这可能会很慢。相比之下,像 Runge-Kutta 这样的多阶段方法是自包含的,需要的历史数据内存流量较少,但在每一步内执行更多的计算。最优选择涉及仔细分析算法的运算强度(每字节数据移动的浮点运算次数)与硬件能力的对比,这种权衡是为地球“数字孪生体”设计下一代动力核心的核心。
在所有这些复杂性之后,科学家们如何相信动力核心是有效的?这是通过一个严格的、分为两部分的过程来实现的。
首先是验证(verification):确保代码正确求解预期方程的数学任务。这就像数学家检查一个证明。模式组件在隔离状态下,针对具有已知、精确解析解的问题进行测试。例如,检查一个简单的平流算子是否可以在不失真的情况下传输一个形状,并测量误差以确认它随着网格变细而以理论预测的速率减小。这是“正确地求解方程”。
其次是确认(validation):评估模式是否能很好地代表现实的科学任务。在这里,模式的输出与真实世界的观测数据进行比较。模拟的急流看起来像观测到的吗?风暴路径在正确的位置吗?这是“求解正确的方程”。
科学家们使用一个层次化的测试体系,从单个算子的简单验证案例开始,发展到整个动力核心的理想化基准测试(如模拟干燥、简化的大气),最后进展到整个地球系统的完整、复杂的模拟。这个从纯数学到纷繁现实的艰苦测试阶梯,正是我们对动力核心——这个位于我们探索、理解和预测气候未来核心的不倦、优雅的引擎——建立信心的基石。
现在我们已经探索了动力核心美丽而复杂的机制,我们可能会倾向于将其视为一件自成一体的数学艺术品来欣赏。但它真正的美,就像任何伟大的引擎一样,只有在投入工作时才会显现。动力核心本身不是目的;它是一个更大事业的核心,一个用于探索我们世界过去、现在和未来的计算容器。在本章中,我们将看到这个抽象的引擎如何与计算的严酷现实、地球各相互作用系统的复杂交响乐以及预测我们气候未来的宏大挑战相连接。
从本质上讲,动力核心是在球体上求解一组极其困难的偏微分方程的工具。要模拟一个世纪的历程,不仅仅是写下方程然后按“运行”那么简单。这是一项巨大的计算工程壮举,需要在物理保真度和计算可行性之间不断进行协商。
首要的障碍之一是大气中事件发生的速度范围极广。例如,声波以每秒数百米的速度传播,而我们关心的天气系统移动得要慢得多。如果我们使用单一、简单的时间步进方案,最快波(声学模态)的速度将迫使我们采取极其微小的时间步长,使得任何长期模拟都变得不可能。解决方法是一种叫做时间分裂的巧妙技巧。我们识别出方程中快速移动的部分,用许多小的、快速的步骤单独求解它们,而缓慢移动的“有趣”部分则用一个更大、更经济的时间步长来推进。这种分裂-显式方法,即快速的声学模态在一个“慢”的动力学步骤内可能被子循环多次,使得现代天气和气候模式在计算上变得可行。这是一个绝佳的例子,说明了理解物理学如何让我们设计出更智能的算法,从而显著降低模拟成本。
但即使有这些技巧,计算量仍然是惊人的。一个单一的全球模式可能有数十亿个网格点。没有任何一台计算机能单独处理。唯一的出路是并行化——将世界分成小块,并将它们分配给超级计算机上成千上万甚至数百万个处理器。这就是区域分解的艺术。想象一下,把一张地球地图切成一个由方块组成的网格,就像一个巨大的拼图,然后把每个方块交给一个不同的处理器。每个处理器都负责自己那一小块世界的天气。
当然,一个区域的天气取决于相邻区域的天气。风会吹,云会飘过这些人为的边界。为了解决这个问题,处理器之间必须不断地通信。在每个时间步之前,它们会进行“晕(halo)交换”,即每个处理器将其数据的一个薄边界——一个鬼点(ghost cells)晕区——发送给其邻居。这确保了当一个处理器计算其区域边缘的导数时,它拥有来自隔壁的必要信息[@problem_-id:4032221]。
这种通信是并行计算的阿喀琉斯之踵。通过网络发送消息需要时间。仅仅为了启动通信就有一个固定的启动成本,即延迟(),然后是每发送一个字节数据的成本,这与网络带宽()的倒数有关。如果一个模式需要交换几十个不同的变量(温度、风、湿度等),为每个变量发送单独的消息可能会被延迟成本拖垮。一个更聪明的策略是消息聚合:在发送之前,将所有不同的场打包成一个单一的、大的消息。这样,高昂的延迟成本只需支付一次,大大提高了效率。
即使有这些优化,也存在根本性的限制。当我们为固定大小的问题添加越来越多的处理器(强扩展)时,我们最终会达到收益递减的点。模式代码的一部分可能是固有的串行部分,无法并行化。更重要的是,随着处理器数量的增加,通信成本,特别是要求所有处理器都签到的全局同步的成本,可能会开始超过分割工作带来的节省。这种通信开销,可能随着处理器数量的对数而增长,最终为我们能以多快的速度运行模式设定了一个实际限制,这是阿姆达尔定律和我们计算网络物理约束的直接后果。
一个高效的动力核心是一件强大的工具,但它本身只是一个空荡荡的舞台。它描述了大气的流体运动,但它在移动什么?还有哪些其他过程在起作用?核心只是庞大交响乐团中的一个声部,它的演奏只有与其他声部协奏时才有意义。这就是耦合的领域。
考虑一下大气运动(动力学)和化学之间的相互作用。在寒冷、黑暗的南极冬季,一个稳定的风旋涡——极地涡旋——在平流层形成。在这个涡旋内部,极地平流层云表面的独特化学反应可以迅速破坏臭氧。为了模拟这一点,我们必须将模拟化学物质随风输送的动力核心与模拟其反应的化学模式耦合起来。
在这里,我们再次遇到时间尺度的问题。空气围绕涡旋的输送可能需要几天或几周,但破坏臭氧的化学反应可能在数小时或数分钟内发生。输送时间尺度与化学时间尺度的比率是一个优雅的无量纲数,称为丹姆科勒数()。当化学反应远快于输送时,,方程组会变得数值刚性。如果我们使用一个简单的算子分裂格式,即交替进行一个动力学步骤和一个化学步骤,快速的化学变化可能会引入巨大的误差。解决方法是对化学部分使用更复杂的数值方法,例如隐式求解器。这使我们能够采用由动力学决定的长时间步,而模拟不会因为快速的化学反应而变得不稳定。
耦合甚至可以更加错综复杂。动力核心不仅移动空气;它还移动水汽、污染物和尘埃。这些气溶胶不是被动示踪物。它们是云滴形成的种子——云凝结核。气溶胶污染的增加可能导致云中含有更多、更小的云滴。对于相同数量的液态水,这些云更亮,反射性更强,这种现象被称为气溶胶间接效应或 Twomey 效应。这反过来又改变了到达地球表面的太阳光量,从而改变了温度,进而改变了由动力核心模拟的风。
为了捕捉这个反馈循环,地球系统模式的不同组成部分——气溶胶模式、云微物理模式、辐射模式和动力核心——必须通过一个称为通量耦合器的复杂软件进行无缝通信。这个耦合器必须在组件之间传递像气溶胶浓度和云滴数量这样的信息,通常需要将它们从一个网格重新映射到另一个网格,同时确保像质量和能量这样的基本量是守恒的。正确处理这一点对于准确预测人类活动如何影响气候系统至关重要。
手握一个复杂的耦合模式,一系列新的问题随之而来。它是正确的吗?它与真实世界有何关联?我们能让它变得更好吗?
物理学家的第一直觉通常是简化。我们可以通过在一个理想化的环境中运行动力核心来测试其基本行为,例如在一个水行星(aquaplanet)上——一个完全被水覆盖,没有大陆或冰盖来使事情复杂化的地球。在这个简化的世界里,我们可以研究系统的纯流体动力学。我们可以验证我们的代码是否正确处理了球坐标系的数学问题,从将角度距离与物理距离关联起来的度量因子,到计算纬向平均(围绕一个纬度圈的平均值)的正确方法。最美妙的是,我们看到像急流和制造天气涡旋这样的复杂、混沌现象如何从基本的物理定律中自发涌现,即使在完全对称的太阳强迫下也是如此。
一旦我们在一个理想化的世界里信任了我们的模式,我们就可以将它应用于真实世界。考虑模拟21000年前的末次冰盛期的气候。那时的世界大不相同,北美和欧洲覆盖着巨大的冰盖。这些冰盖边缘的陡峭斜坡产生了猛烈的、寒冷的下坡风,称为下坡风(katabatic winds)。为了捕捉这些风,动力核心的分辨率——其网格单元的大小——变得至关重要。一个粗糙的模式只会平滑掉陡峭的地形。然而,一个高分辨率的模式可以显式地解析这些特征。这突显了模式的数值计算与其所能代表的物理过程之间的深层联系。随着我们提高分辨率,那些曾经太小而无法看到、不得不被参数化(近似)的过程,现在可以被动力学显式解析。这就需要尺度感知参数化方案,即随着分辨率的变化智能地调整其行为的方案,以确保参数化和解析的内容之间实现无缝过渡。
为了进一步将我们的模式植根于现实,我们可以使用数据同化(DA)。这涉及在模式运行时将真实世界的观测数据——来自卫星、气象气球和地面站——融入模式。在区域气候模拟中,这有助于确保模拟不会偏离现实太远。然而,这是一把双刃剑。如果处理不当,数据同化可能会破坏我们试图模拟的气候本身。例如,观测系统在过去几十年中发生了巨大变化;同化来自这个不断演变的网络的数据可能会给模式的气候带来人为的趋势和变率。此外,同化过程本身可能无意中向系统添加或移除质量和能量,违反了基本的守恒定律并导致长期的气候漂移。一个真正稳健的同化方案必须是偏差感知的,强制执行守恒约束,并且足够温和,不会抑制模式自身自然的、内部产生的变率。
展望未来,基于物理的参数化这一范式正受到机器学习(ML)崛起的挑战。用于云和辐射的复杂方程在计算上非常昂贵。为什么不训练一个深度神经网络来模拟它们呢?这就引出了混合ML-PDE模型的概念,其中传统的动力核心与用于物理过程的ML模拟器耦合。第一步,离线训练,是直接的:我们运行旧的、昂贵的模式来生成一个庞大的输入和输出数据集,并训练ML模型来复制这种映射。真正的挑战是在线集成,即把ML模拟器放入运行中的模式。现在,它的预测被反馈回动力核心,任何微小的误差都可能随着时间的推移而被放大,可能导致整个模拟变得不稳定并崩溃。开发稳定、稳健且物理上一致的ML模拟器是当今气候模拟领域最激动人心和最具挑战性的前沿之一。
我们已经到达了一个非凡的境地。世界各地的研究中心都开发了自己独特的气候模式,每个模式都有不同的动力核心、不同的参数化方案和不同的耦合策略。为什么会有这么多?我们从这种多样性中学到了什么?
这就引出了模式比较计划(MIPs)的概念,例如耦合模式比较计划(CMIP)。这些项目组织了世界气候模拟社区的集体努力,以回答基本的科学问题。一个关键的见解来自于理解气候预测中不确定性的不同来源。我们可以使用全方差定律来优雅地划分预测中的总不确定性。
单模式集合(SME)探讨了源于一个模式内部的不确定性。通过用稍微不同的初始条件多次运行同一个模式,我们可以量化气候系统的内部变率——天气中固有的混沌。通过用不同的内部参数值(例如,雨滴形成的速度)来运行它,我们可以探索参数不确定性。
但最大且最顽固的不确定性来源是结构不确定性:如果我们使用一个根本不同的模式,预测结果会有多大差异?一个多模式集合(MME),即从一个MIP中的许多不同模式收集结果,是我们探索这一点的工具。当我们问一个气候预测是否稳健时,我们是在问同样的基本结果是否在这个多样化的模式集合中都成立。如果几十个不同的模式,都建立在独立的科学原理和不同的数值结构之上,都预测,例如,北极将在夏季变得无冰,我们对该预测的信心就会大大增加。它告诉我们,这个结果不仅仅是某一套特定假设的产物。这个宏大的集合是动力核心的终极应用:一个全球性的合作,将一系列复杂的计算机代码转变为形成科学共识的强大工具,以及为人类未来指明方向的指南。