气候数据同化

玻尔百科

定义

气候数据同化是指利用贝叶斯统计方法，将基于物理的模型预报与实际观测数据进行最优结合，以产生改进后的地球气候状态估计。该方法在气候科学领域常通过集合卡尔曼滤波来实现，是生成综合性历史再分析数据集的核心手段。除了天气预报，气候数据同化还用于监测地球系统和重建过去的气候，并为政策制定提供严谨的不确定性评估。

核心要点

气候数据同化利用贝叶斯统计学，将基于物理的模型预测（先验）与真实世界的观测（似然）进行最优组合，从而产生一个改进的估计（后验）。
集合卡尔曼滤波（EnKF）通过使用一组并行运行的模型来表征预测不确定性及其物理结构，使得这一过程对于大型系统在计算上变得可行。
一个关键输出是再分析，它综合了历史观测和模型物理，创建了关于过去气候的完整、网格化的数据集，但这些数据集会受到来自模型和不断变化的观测系统的双重偏差影响。
其应用远超天气预报，还包括监测整个地球系统、利用自然代用资料重建古代气候，以及为政策决策提供严谨的不确定性估计。

引言

当我们的模型不完美、观测数据零散且充满噪声时，我们如何才能描绘出一幅关于地球气候的完整、连贯的图景？这个根本性挑战是现代气候科学的核心。解决方案是一种被称为数据同化的强大综合方法，它集物理学、统计学和计算机科学于一体，用于将理论模型与真实世界的数据进行最优融合。本文旨在为这一重要学科提供一份指南。首先，在“原理与机制”部分，我们将探讨其基础思想，从构成其核心的贝叶斯逻辑，到赋予其生命力的卡尔曼滤波和集合方法的实用机制。接着，“应用与跨学科联系”部分将揭示数据同化的深远影响，展示它如何促成我们星球“数字孪生”的创建，帮助我们重建遥远过去的古气候，并为制定合理的政策提供至关重要的不确定性量化。

原理与机制

想象你是一位正在试图破案的侦探。基于你的经验和初步证据，你有一个理论——一个关于案发经过的心理模型。这是你的“先验”。然后，一条新证据出现了——一份目击者陈述，一个法医鉴定结果。这条新证据就是你的“观测”。它很有价值，但可能并非完全可靠；目击者可能会记错，实验室测试也可能有误差。你会怎么做？你既不会抛弃你的理论，也不会不加批判地接受新证据。你会进行一个微妙的推理过程，权衡你初始理论的说服力与新证据的可信度，从而得出一个更新、更精炼的案件理解。这就是你的“后验”。

气候数据同化的核心正是这样一个过程，只不过它以数学和物理学的严谨方式来执行。这是我们对气候系统的理论理解（体现在复杂模型中）与我们从真实世界收集的零散、不完美的观测数据之间的一场宏大对话。

贝叶斯心跳：模型与现实的对话

这场对话的数学语言是18世纪一项优美的洞见，即贝叶斯定理。在数据同化的背景下，它为我们提供了一种精确更新知识的方法。如果我们将气候系统的状态（全球所有的温度、风、气压等）表示为一个巨大的向量 $x$ ，将我们的观测表示为一个向量 $y$ ，该定理可以表述为：

p(x | y) \propto p(y | x) p(x)

这个优雅的表达式告诉我们，在给定观测的情况下我们对状态的更新后知识，即后验 $p(x|y)$ ，与两项的乘积成正比：我们的先验知识，即先验 $p(x)$ ，以及在某一特定状态下看到该观测的概率，即似然 $p(y|x)$ 。我们不必被这些符号吓倒，让我们来思考它们的含义。

先验：我们自认为知道什么

先验， $p(x)$ ，代表了我们在查看最新一批观测数据之前的知识。在现代气候科学中，这通常是来自数值模型的预报。但它不仅仅是一个单一的预测，而是一个概率分布——它不仅说明了最可能的状态，还说明了我们对此的不确定性。这种不确定性被一个庞大的数学对象所捕捉，即背景误差协方差矩阵，或称 $B$ 。 $B$ 的对角线元素告诉我们对每个变量预报的方差（例如，“我认为这里的温度是 $25^{\circ}\text{C}$ ，但我不确定度大约是 $1^{\circ}\text{C}$ ”）。

然而，真正的精妙之处在于非对角线元素。这些元素描述了不同变量或不同位置之间误差的关系，即相关性。在这里，物理学以一种深刻的方式登场。大气和海洋不仅仅是随机数字的集合，它们受物理定律支配。例如，在中纬度地区，风场和气压场通过一种称为地转平衡的原理紧密相连。这意味着我们对气压场的预报误差与风场的误差并非相互独立；它们被物理学“绑”在了一起。这些物理约束直接烙印在 $B$ 矩阵的结构上，创造出复杂、非均匀的相关性模式。一个地方的温度误差可能意味着其周围存在一个非常特定的、涡旋状的风场误差模式。因此， $B$ 不仅仅是一个统计量，它是物理定律的统计体现。

似然：观测如何向我们传达信息

似然， $p(y|x)$ ，是连接我们模型世界与真实测量世界的桥梁。它提问：如果世界的真实状态是 $x$ ，我们的仪器产生观测值 $y$ 的概率是多少？要搭建这座桥梁，我们需要两样东西：一个“翻译器”和一个“品性证明”。

“翻译器”是观测算子 $H$ 。我们的模型可能以网格单元的平均温度和湿度来思考，但卫星看到的并非如此。卫星看到的是辐射率——从大气层顶部发出的电磁能量辉光。算子 $H$ 是一个“正演模型”，它接收模型状态 $x$ 并计算卫星应该看到什么。对于卫星来说，这涉及求解复杂的辐射传输方程，计算能量如何由地表发射，并被大气每一层吸收和再发射。对于一个简单的温度计， $H$ 可能只是一个从模型网格到温度计位置的插值。

“品性证明”是观测误差协方差矩阵 $R$ 。这个矩阵量化了我们对观测的信任程度。误差不仅仅是简单的仪器噪声，它还包括我们所说的代表性误差：一个温度计测量的是单点的温度，但我们模型的“温度”是一个可能宽达100公里的网格单元的平均值。该点值与网格平均值之间的差异是必须在 $R$ 中考虑的误差来源。对于像卫星这样的复杂仪器，不同的通道可能有相关的误差，例如，如果它们共享一个不完美的校准源，或者它们对大气的敏感度重叠。建立一个准确的 $R$ 是一项极其困难但至关重要的任务。

达成一致的机制：卡尔曼滤波

那么，这场“对话”实际上是如何进行的呢？在许多系统中，后验分布——即结合先验和似然的结果——可以通过一组非凡的方程来计算，这组方程被称为卡尔曼滤波。让我们想象一个这个问题的简化一维版本：我们想估计一个单一的气候指数，比如北大西洋涛动（NAO）指数，我们称之为 $x$ 。

我们的模型给出一个预报（先验均值） $x^b$ ，其不确定性为（背景误差方差） $B$ 。然后我们收到一个单一的观测值 $y$ ，它有自己的不确定性 $R$ 。卡尔曼滤波提供了获得最佳新估计值，即分析场 $x^a$ 的方法：

x^a = x^b + K(y - Hx^b)

$(y - Hx^b)$ 这一项是新息，或称“意外”。它是我们观测到的值与我们预报预测会观测到的值之间的差异。神奇之处在于卡尔曼增益 $K$ 。这个单一的数字在预报和观测之间的拉锯战中扮演裁判的角色。它的公式非常直观：

K = \frac{B H}{H^2 B + R}

如果我们的预报非常不确定（ $B$ 很大），增益 $K$ 会变大，分析场 $x^a$ 会更强烈地被拉向新的观测值。相反，如果我们的观测噪声很大（ $R$ 很大）， $K$ 会变小，我们就会更紧密地坚持我们的预报。分析场是先验知识和新证据的精度加权平均。

这场拉锯战会产生深远的影响。想象一下，我们正试图估计海洋中的一个长期变暖趋势。观测值 $y$ 包含了这个趋势。如果我们对模型过于自信（例如，通过低估模型自身的内在误差），或者对观测值过于怀疑（通过将其误差方差 $R$ 设置得过高），我们的增益 $K$ 就会很小。我们的分析场将很大程度上忽略观测值，从而无法捕捉到真实的变暖趋势。如果我们在另一个方向上搞错了平衡，我们的分析场可能会盲目地跟随充满噪声的数据，捏造出不真实的波动和趋势。数据同化的艺术在于仔细地调整 $B$ 和 $R$ 。物理学再次提供了最终的检验：一个调整良好的系统，平均而言，必须能量守恒。任何导致同化过程在长期内系统性地产生或消耗能量的调整，在物理上都是错误的，这为我们指导选择提供了一个强大的“涌现约束”。

全球交响乐：集合方法

卡尔曼滤波方程很优美，但对于一个全球气候模型来说，状态向量 $x$ 有数百万甚至数十亿个分量。协方差矩阵 $B$ 将是一个拥有数十亿行和数十亿列的矩阵——这是一个如此庞大，以至于任何计算机都无法存储，更不用说操作了。

这时，一个极其聪明的想法应运而生：集合卡尔曼滤波（EnKF）。我们不试图计算庞大矩阵 $B$ 的演变，而是使用一种蒙特卡洛方法。我们不是运行一次气候模型，而是并行运行几十次甚至几百次。每一次运行，或称“集合成员”，都从略有不同的初始条件开始。这些预报的集合形成了一个集合。

EnKF 的天才之处在于，这个集合的统计离散度就是我们的背景误差协方差 $B$ 。温度误差和风场误差之间的相关性不是从抽象方程计算出来的；它们随着集合的演变从模型的物理过程中自然地涌现出来。

然后，对每个集合成员单独进行分析。每个成员都根据观测数据进行更新，但带有一个巧妙的转折（比如为每个成员的观测数据添加一个小的随机扰动），以确保更新后的集合具有正确的、减小了的离散度。

这种集合方法并非没有其自身的挑战。由于成员数量有限（例如100个），我们可能会遇到采样问题。模型中两个遥远的、物理上不相关的变量，可能仅仅因为巧合，在我们的小集合中显得相关。这是一种虚假相关。为了解决这个问题，从业者应用一种称为协方差局地化的技术，这就像进行统计手术：他们强制遥远点之间的任何相关性为零，尊重“巴西一只蝴蝶扇动翅膀不会立即影响芝加哥一场雷暴”的物理现实。这种将原始统计学与物理直觉相融合的方式是现代数据同化的一个标志。

重建气候：再分析的力量与风险

在运行了这个庞大的系统——将基于物理的模型与数百万个日常观测数据在一个持续的预报和分析循环中结合起来——之后，我们得到了什么？最有价值的产品之一是再分析。再分析是对过去大气、海洋和陆地状态的完整、网格化、动态一致的估计，通常可追溯数十年。它填补了我们稀疏的历史观测数据之间的巨大空白，创造了一部气候系统历史的电影，而不是一系列脱节的快照。

再分析数据集是理解气候变率和变化的宝贵工具。但我们必须记住它们是什么。再分析不是“真相”，它是一种综合。最终的分析状态始终是模型和数据的混合。如果模型有系统性偏差（例如，它倾向于在北极地区过于寒冷），而观测数据也有偏差（例如，一个卫星传感器随时间漂移），那么最终的再分析将继承两者偏差的加权组合。

此外，对于长期气候研究，我们面临一个重大挑战：观测系统本身随时间发生了巨大变化。卫星时代始于20世纪70年代末，新的仪器不断被发射。一个吸收不断变化的观测数据的同化系统，可能会在最终的再分析中产生人为的跳跃或趋势。20世纪80年代一次突然的“变暖”可能不是真实的气候信号，而是引入了一个新的、更精确的卫星所致。因此，创建和使用再分析产品的科学家必须是细致的侦探，时刻警惕这些人为产物。

因此，数据同化是一段发现之旅，是理论与测量之间一场强大而复杂的对话。它使我们能够从不完整的信息中拼凑出我们星球气候的连贯图景，并始终以物理学基本定律和统计学严谨逻辑为指导。它是人类智慧的证明，是一种不仅帮助我们预测明天的天气，也帮助我们重建昨天气候的工具。

应用与跨学科联系

在了解了数据同化的原理和机制之后，我们可能会觉得我们已经组装了一台相当奇妙而复杂的引擎。我们已经看到贝叶斯逻辑如何提供蓝图，变分和序列方法如何提供活动部件，以及误差协方差如何充当我们模型与现实啮合的齿轮。现在，真正的乐趣开始了。我们能用这台引擎做什么？它能带我们去哪里？

事实证明，答案是几乎无处不在。数据同化不仅仅是气象学家的一个专门技术；它是一个通用翻译器，一种在惊人广泛的科学学科中提出和回答问题的方式。它是一个框架，使我们能够构建我们星球的“数字孪生”，进行行星尺度的健康检查，穿越时空重建失落的世界，甚至窥探未来以做出更明智的决定。让我们来探索这片新的应用大陆。

现代奇迹：运行中的数字孪生

数据同化最显著的成就是每日天气预报。我们在晚间新闻上看到的是大气物理模型与数百万观测数据之间令人难以置信、永不停歇的舞蹈的最终产物。这就是地球的“数字孪生”：一个存在于超级计算机内部的、我们世界的活生生的复制品，不断被真实世界的数据更新和校正。

这项任务远非简单。观测数据形式繁多，令人眼花缭乱。考虑一个来自全球定位系统（GPS）卫星的信号。当它穿过大气层时，无线电波会弯曲，弯曲的程度告诉我们一些关于其整个路径上的温度和压力的信息——这条路径可以延伸数百公里。挑战在于，我们如何将这个单一的、路径积分的测量值与我们模型中数千个网格点的特定温度和压力值联系起来？

早期的方法会首先将弯曲角转换为单一的温度垂直廓线，假设大气像洋葱一样完美分层。但这引入了“代表性误差”，因为我们强迫一个空间平均的信息假装它来自一个单点。一个更为优雅、现已普遍采用的解决方案是直接同化弯曲角。数据同化系统使用其完整的三维大气模型，计算出沿着卫星信号传播的确切路径，弯曲角应该是多少。模型预测与实际观测之间的差异随后为更新提供信息。这种方法更忠实于测量的本质，并避免了诸如“重复计算”可能在中间反演步骤中使用的背景信息等微妙但危险的问题。

这种融合模型与数据的过程不仅仅是一种统计技巧；它具有深刻的数学结构。当我们指定背景预报中的误差具有一定的空间平滑性时——这是一个非常物理的假设，因为我们不期望一个地方的天气与一英里外的天气完全无关——我们实际上是在定义模型状态的一种“刚度”。其数学结果是惊人的：寻找最佳新初始状态的核心优化问题，等同于求解一个大规模的椭圆型偏微分方程。这与描述稳态热流或拉伸鼓面形状的方程属于同一类。在一场美丽的跨学科统一中，空间相关的统计要求转化为一个确定性的“平滑”问题，以物理上连贯的方式将稀疏观测的信息传播到整个模型网格。

更值得注意的是，这些数字孪生不是静态的。它们会学习和适应。系统的性能通过检查“新息”——即观测值与模型初步猜测之间的差异——来持续监控。如果这些新息持续显示出某种模式，这告诉我们我们对背景误差的模型（ $B$ 矩阵）可能出错了。现代系统采用一种“混合”方法，将静态的、长期的平均协方差与一个动态的、由一组预报生成的“流依赖”协方差相融合。通过分析新息统计数据，系统可以自动调整融合权重，实时决定是信任其长期气候学还是今天天气模式的特定结构。“数字孪生”在某种意义上是具有自我意识的。

行星健康检查

数据同化的力量远不止于预测明天的天气。它为监测整个地球系统的健康和行为提供了一个全面的工具。

想想两极巨大的冰盖。在夏季，明亮的蓝色融池在海冰表面形成。这些融池很小，远小于典型的气候模型网格单元，但它们却有着巨大的影响。通过用深色的吸水替代明亮的反光冰，它们急剧降低了地表反照率，在一个强大的反馈循环中加速了融化。我们如何才能在全球模型中捕捉到这一点？数据同化提供了一条途径。一颗飞越上空的卫星测量了一个大面积的平均反照率。与此同时，我们的模型有一个参数，代表融池覆盖的网格单元比例 $f_p$ 。我们可以使用数据同化来更新模型对 $f_p$ 的猜测，使其计算出的反照率与卫星看到的一致。卡尔曼滤波方程的一个简单应用展示了背景估计值 $f_p^b$ 如何根据反照率不匹配被推向新的分析值 $f_p^a$ ，并由模型和观测的不确定性完美加权。我们正在使用大尺度观测来约束关键的小尺度物理过程。

同样的原理使我们能够监测生物圈——即地球的“呼吸”。卫星随时间追踪植被的绿度（例如，归一化植被指数，或NDVI）。这些数据的原始时间序列充满噪声；一片飘过的云可以使地面看起来不那么绿，这与森林的健康状况无关。状态空间模型，即序列数据同化的引擎，可以出色地解决这个问题。它维持一个对生态系统“真实”潜在绿度的估计，该绿度根据生态动力学模型演变。该模型有一个“过程噪声”项，它解释了真实但不可预测的变化，如突发的病虫害或反常的霜冻。卫星测量被视为对这个真实状态的带噪观测，其“观测噪声”项解释了传感器误差和大气干扰。通过分离这两个不确定性来源，系统可以完成一项令人难以置信的推断壮举：它可以区分一个多云天（观测噪声）和春天的真正开始（状态的真实变化），从而提供一个平滑的、具有物理意义的生长季重建。

这种从遥感测量中“反演”以推断底层属性的方法是地球科学的基石。当我们从太空看地球时，我们不能直接看到气溶胶污染；我们看到的是被它散射和吸收的光。从测量的辐射率推断气溶胶的数量和类型是一个经典的反演问题。数据同化的数学机制，通过贝叶斯推断的视角，使我们能够将卫星测量的信息与我们关于气溶胶属性的先验知识相结合，以找到最可能的解决方案，并且同样重要的是，量化其不确定性。

气候的时间机器

数据同化最令人费解的应用可能是在古气候学中。这个框架是如此通用，以至于它不仅可以用来预测未来，还可以用来重建过去。“古气候数据同化”的目标是创建几百或几千年前地球气候的完整、网格化、物理上一致的重建——一个“上一千年的再分析”。

但是观测数据在哪里呢？在1200年没有卫星或气象站。这里的“观测”是代用资料：气候的间接记录器。树木年轮的宽度可以告诉我们其生长季节的温度和降雨量。珊瑚骨骼或冰芯中氧同位素的比率（ $\delta^{18}\mathrm{O}$ ）告诉我们其形成时的水温或气温。

在这里，“观测算子”（ $H$ ）变得非同寻常。它不再是一个简单的插值，而是一个完整的代用系统模型（PSM）。PSM可能是一个树木生长的生物模型，或是一个同位素分馏的地球化学模型。然后，数据同化将来自这些代用资料的稀疏、不规则和充满噪声的信息与最先进的气候模型相融合。气候模型提供了物理上的一致性并填补了代用资料之间的巨大空白，而代用资料则将模型“拉”向一个与自然界记录的证据相一致的状态。这种物理学、生物学、化学和统计学的卓越融合，使我们能够以前所未有的细节创建过去气候的地图。

政策的水晶球

归根结底，我们构建这些复杂的数字孪生和时间机器的原因是为了对我们的未来做出更好的决策。数据同化不仅提供了一个估计，还提供了对不确定性的严谨量化，这是现代风险评估和决策制定的基本要素。

考虑一个前瞻性问题，例如地球工程方案的潜在影响。我们如何建模这在很大程度上取决于时间尺度。对于几天内的短期预报，问题是一个初值问题。我们用今天的天气初始化模型，看一个扰动（比如向平流层注入气溶胶）如何影响天气的演变。在这个短时间尺度上，广阔、缓慢移动的海洋实际上是一个固定的边界条件。对于超过100年的长期气候预测，问题是一个边界强迫问题。第一天的具体天气无关紧要；重要的是地球能量平衡的持续变化以及来自完全耦合的海洋、冰和生物圈的缓慢反馈。理解这种区别——这是我们建模系统架构的基础——对于提出关于我们未来气候的正确问题至关重要。

这把我们带到了最后一个，也许是最重要的应用。在运行了我们复杂的模型并同化了无数数据源之后，我们通常会得到一个关键参数的后验概率分布，比如地球的气候敏感度。这个分布告诉我们 plausible 值的范围以及哪些值更可能。现在，想象你是一位面临决策的政策制定者：我们应该现在投入大笔资金来减缓气候变化，还是应该等待观望？

一种常见但幼稚的方法是从分布中取“最可能”的值——即最大后验（MAP）估计——并基于这个单一数字做决策。但如果分布不是一个简单的对称钟形曲线呢？如果它有一个长尾，表明发生真正灾难性后果的可能性虽小但非零呢？气候变化的损害是高度非线性的；4度的升温远不止是2度升温的两倍糟糕。因此，一个真正理性的决策必须基于在整个后验分布上平均的预期损害。

完全有可能，MAP估计建议等待是最佳选择，而完整的贝叶斯计算——它考虑了分布尾部的风险——则压倒性地得出结论，我们必须立即采取行动。在这种情况下，依赖单点估计将是危险的误导。行动的选择发生了逆转。数据同化通过提供完整的后验分布，为我们提供了超越简单点估计、做出对我们无法消除的不确定性具有鲁棒性的决策的工具。这就是这个伟大科学引擎的最终目的：不仅是为了认识世界，而且是为了以我们所能集聚的全部智慧来指引我们穿越世界的道路。