
对我们环境未来的预测通常在两个我们熟悉的尺度上进行:每日天气预报和长期气候预测。但介于两者之间的关键时期又如何呢?次季节到季节 (S2S) 的时间尺度,跨度从两周到数月,长期以来被认为是一个“可预报性鸿沟”,在这个区间内,大气初始状态的记忆已经消退,而长期气候驱动因子的影响尚未占据主导。本文深入探讨了 S2S 预测的科学,这是一个迅速发展的前沿领域,旨在在这一充满挑战的时间范围内提供有用的指导。它解决了在这些时间尺度上可预报性从何而来,以及我们如何利用它造福社会的基本问题。
本次探索分为两个主要部分。在第一章“原理与机制”中,我们将揭示 S2S 可预报性的物理基础,审视由 Edward Lorenz 定义的两种可预报性,并识别储存在海洋、陆地、冰和平流层中的“记忆”。随后的“应用与跨学科联系”一章将把理论与实践联系起来。我们将探讨构建可信预报所需的复杂建模和统计技术,并探索这类新型预测如何被用于在公共卫生、能源、农业等领域做出关键的现实决策。
进入次季节到季节 (S2S) 预测的世界,就如同航行在一个引人入胜的中间地带,一个时间上的“暮光之城”,在这里,天气预报的规则开始失效,而气候预测的规则尚未完全确立。要理解在这个充满挑战的领域中使预测成为可能的原理,我们必须首先领会可预报性本身的根本性质。
想象一下,你正试图预测一片被湍急河流裹挟的树叶的路径。在最初的几秒钟内,它的轨迹主要取决于你将它放入水中的位置和方式——即它的初始条件。这就是天气预报的本质。我们尽可能精确地测量大气的当前状态,并利用物理定律来推演其未来的演变。但大气和河流一样,是混沌的。我们初始测量中的微小误差,无论多么小,都会不断增长。
这不仅仅是一个哲学概念;我们可以用数字来量化它。在一个混沌系统中,误差(我们称之为 )在短预报时效内呈指数增长,受所谓的李雅普诺夫指数 控制。我们可以将此关系写为 ,其中 是我们的初始测量误差。对于地球大气而言,主要误差的倍增时间典型值约为两天。这意味着,例如,0.1度的初始温度误差在两天后变为0.2度,四天后变为0.4度,依此类推。
这种指数级爆炸不会永远持续下去。当误差增长到与大气自身的自然变率(例如,一年中特定时间的典型逐日或逐周温度波动)一样大时,它就会停止增长。此时,预报效果不比随机猜测好,我们称之为误差已经“饱和”。如果我们从一个相当小的初始误差开始,比如饱和尺度的1%,我们可以计算出何时达到这个极限。结果表明,这大约发生在13到16天之后 [@problem_id:4096609, 4096528]。这就是天气预报的根本壁垒。大约两周之后,大气实际上已经“忘记”了它的初始状态。
现在,考虑一个不同的问题:预测冬天会比夏天冷。这与某一天具体的天气无关。它是由地球自转轴的倾斜及其绕太阳的轨道决定的——这是一个边界条件。这是一种气候预测。我们不是在预测状态,而是在预测状态的统计特征,这种统计特征受到缓慢的外部驱动力的强迫。
鸿沟就在于此。天气预报,一个初值问题,在大约两周后失效。季节到气候的预测,一个边值问题,在三个月及更长的时间尺度上效果最佳。那么介于两者之间的时间呢?在第2周到第8周的“可预报性鸿沟”中,还有希望获得有用的预报吗?答案是肯定的,而且相当引人注目。但要找到答案,我们必须寻找不同类型的可预报性。
伟大的气象学家、混沌理论之父 Edward Lorenz 识别出了两种基本的可预报性,为理解 S2S 的挑战提供了框架。
第一类可预报性是初始条件的持续性。虽然像雷暴这样的小尺度天气系统的记忆是短暂的,但一些更大、更慢的大气现象可以将其结构维持数周。最显著的例子是马登-朱利安振荡 (MJO)。MJO 是一股巨大的、缓慢移动的云和降水脉冲,它环绕热带向东传播,环绕地球一周需要30到60天。它不是一场风暴,而是一个行星尺度的天气模态波。由于其尺度巨大且移动缓慢,其演变比日常天气受到更多约束,混沌性也更低。提前几周预测 MJO 的位置和强度是一个经典的初值问题,但其“保质期”比典型的天气预报要长得多。
第二类可预报性并非源于大气对自身的记忆,而是源于其对地球系统中其他更慢部分持续影响的响应。大气可能健忘,但它不断地与海洋、陆地、冰,甚至高空的平流层进行“对话”,而这些分量都拥有更长的记忆。这些分量作为缓慢变化的边界条件,不断地“轻推”着混沌的大气,将天气的统计特征推向某个方向。
我们可以用一个简单而有力的概念模型来说明这一点。想象一下,总的预报误差由两部分组成:一部分来自快速、混沌的大气初始状态的不确定性,另一部分来自缓慢的边界强迫(如海洋表面温度)的不确定性。正如我们之前所见,大气部分的误差会爆炸性增长。而边界部分的误差增长则缓慢得多。总误差是这两者的结合。在最初的两周内,总误差完全由大气初始误差的失控增长所主导。但一旦这部分误差饱和并失去所有预报能力,来自边界条件的缓慢增长的信号便从噪声中显现出来。S2S 预报员试图探测的正是这种微弱但持续的信号。它不能告诉我们特定日期的确切天气,但它可以告诉我们未来几周是否可能比平均状况更暖、更冷、更湿或更干。
要进行 S2S 预测,我们必须成为侦探,在整个地球系统中搜寻这些缓慢记忆的来源。这种记忆可以储存在许多地方。
气候系统中最显著的记忆库是海洋。原因很简单,源于物理学:水具有巨大的热容量。将一立方米的水加热一度所需的能量远多于一立方米的空气。这种热惯性意味着海洋温度距平一旦形成,可以持续很长时间。一个简单的海洋表面混合层模型表明,海表温度(SST)距平的自然衰减时间尺度可达一个月或更长,为 S2S 预报提供了直接的记忆来源。
海洋记忆的最终体现是厄尔尼诺-南方涛动 (ENSO)。ENSO 不仅仅是太平洋上的一片暖水区;它是一种美妙的、自我维持的振荡,是海洋与大气之间耦合的舞蹈。海洋温度的变化会改变风,而风的变化会改变洋流和温跃层深度,这反过来又反馈到海洋温度上。这个具有内在延迟的反馈回路,创造了一个周期为数年的缓慢节奏。虽然 ENSO 的主要影响在季节时间尺度上,但其当前状态——无论是正在发展、衰减还是处于中性状态——都提供了一个强大的、缓慢演变的背景,塑造着全球天气格局,是 S2S 预报的重要信息来源。
我们脚下的陆地表面和地球的冰冻部分——冰冻圈——也拥有显著的记忆。
在我们天气发生的湍流对流层之上,是平流层。这是一个更平静、更稳定的领域,那里的现象演变得缓慢得多。其中最引人注目的现象之一是准两年周期振荡 (QBO)。QBO 是热带平流层纬向风的壮观、缓慢的逆转,这里的“急流”在大约28个月的周期内从西风转为东风,然后再转回来。
这种由从对流层向上传播的波驱动的振荡,扮演着一个重要的守门人角色。根据其位相——西风或东风——它既可以允许大尺度行星波向上传播到极地平流层,也可以阻挡它们。这对平流层极地涡旋的稳定性有深远的影响。一个受到扰动的极涡可能导致剧烈的“平流层突然增温”事件,其影响可以向下传播到地表,并影响我们的天气格局达数周至数月之久。因此,QBO 的可预报状态为我们提供了这些高影响事件发生概率的线索,构成了 S2S 可预报性的另一个重要支柱。
利用这些原理需要强大的整个地球系统的计算机模式。一个关键的现代见解是无缝预测的概念。从明天的天气到下个世纪的气候,所有时间尺度都受同样的基本物理定律支配。因此,目标是建立一个单一、统一的建模系统,能够处理所有这些预测问题,主要区别在于如何为特定任务初始化和配置模式。
然而,这些模式并不完美。每个模式都有其独特的系统性误差或偏差。一个模式偏好的平均气候,即其“吸引子”,不可避免地会与真实世界的气候略有不同。当我们使用来自真实世界的数据来初始化一个预报时,从模式的角度来看,模式状态是不平衡的。随着预报的运行,模式将倾向于从观测到的气候“放松”或漂移到其自身的有偏气候态 [@problem_id:4096551, 4051750]。
这种漂移是一种系统性的、依赖于预报时效的误差。我们可以用一个简单的数学模型来形象化它。如果真实世界的平均状态是 ,而模式的平均状态是 ,那么预报的平均状态将从第零天的 演变到 ,其特征时间尺度为 。在预报时效 时的系统误差或偏差由 给出。
这就是为什么 S2S 预报几乎总是以距平——即与气候平均值的偏差——来表示。我们不是要预测三周后的绝对温度,这个任务被模式漂移严重污染以至无望。相反,我们是在预测距平:未来会比模式自身漂移后的气候更暖还是更冷?
我们武器库中最后也是最关键的工具是再预报,或称后报。为了校正漂移,我们需要知道漂移是什么。预报中心通过将其当前的预报模式在过去的时间里运行,为过去20-40年生成预报来实现这一点。通过平均所有针对例如4月15日、预报时效为3周的预报,我们可以计算出模式在该年该时段的平均3周预报。将此与同期实际观测到的气候进行比较,就揭示了模式在该特定预报时效和季节的系统性偏差。
在实时预报中,我们随后可以执行一个简单而意义深远的校正:取原始预报,减去从再预报中得知的偏差,从而产生一个统计上可靠的校正后预报。这最后一步,即校正我们模式的已知缺陷,正是将地球记忆的微弱信号转化为在充满挑战的次季节到季节前沿领域中具体、有用预测的关键。
在上一章中,我们深入地球气候系统的核心,揭示了海洋和陆地上微弱但持续的记忆低语,这些记忆让我们在充满挑战的数周到数月的时间尺度上获得了一丝可预报性。我们看到了物理原理。但对于物理学家,乃至任何科学家来说,理解一个原理的真正乐趣在于看到你能用它来做什么。知道一个月后天气可能会怎样有什么用呢?
答案是,它让我们从自然变幻莫测的被动观察者,转变为积极、智慧的决策者。次季节到季节 (S2S) 预测的目标不仅仅是满足我们对未来的好奇心;它是为了打造一类新工具,帮助我们为农场管理水资源,为城市预测能源需求,并在变化的气候中保护人类健康。
本章讲述的正是那段宏大而实际的旅程:将物理原理转化为可操作的情报。这是一个揭示大气物理、海洋学、统计学和计算机科学之间深刻而美丽联系的故事。这是一个关于我们如何构建并学会信任一种新型“水晶球”的故事。
要制作未来数周或数月的预报,并非简单地将一个更大的天气模式运行更长时间。这是一个根本不同类型的问题,需要一种不同的思维方式,以迷人的方式融合物理学和统计学。
首先,我们必须承认,地球不仅仅是一个大气层;它是一曲由大气、海洋、陆地和冰共同交织、共舞的复杂交响乐。S2S 可预报性正诞生于这种耦合。大气的记忆很短,就像长笛转瞬即逝的音符。海洋凭借其巨大的热惯性,拥有长久的记忆,如同大提琴深沉而共鸣的嗡鸣。远程预测的秘诀在于,在演奏开始时,恰当地捕捉整个交响乐团的状态。
但是,你怎么能知道观测稀疏的深海状态呢?在这里,我们看到了一个美妙思想的运用:强耦合资料同化。由于交响乐的各个部分在物理上是相连的,对一部分的观测——比如,卫星测量空气温度——可以通过我们对物理联系的数学理解,用来微调另一未被观测部分的状态,比如海洋的次表层温度。这些物理联系被编码在我们称之为跨分量误差协方差的东西中。这就像听到一个小提琴音符,然后利用你对和声的知识来调校整个弦乐部分。这对 S2S 来说至关重要,因为一个良好初始化的海洋正是使预报在数周内保持稳定的可预报性之锚。
即使有一个完美初始化的地球系统,大气的混沌本性——著名的“蝴蝶效应”——也意味着任何单一的预报都注定会与现实偏离。为了克服这一点,我们不只做一个预报,而是做几十个。这就是集合预报方法。我们创建一大群预报,每个都从略有不同的初始状态开始,以代表我们对当前精确状况的不确定性。此外,我们甚至可以在每次运行中对模式的物理方程进行一些微调,这是对我们模式本身只是现实不完美表征的谦逊承认。
结果不是一个单一、确定的答案,而是一个概率分布——一个表示“本月比平均温度偏高的可能性为60%”的预报。这是一个深刻的哲学转变。我们从单一、确定性预测的傲慢中走出,转向量化我们不确定性的实践智慧。一个概率预报是一个诚实的预报。
这些庞大计算机模式的原始输出仍然不是最终定论。像任何复杂仪器一样,它可能有系统性偏差——倾向于过冷、过暖、过干——或者它可能在概率预测中持续地过分自信或信心不足。我们必须对其进行校准。
但是你如何训练一个模式来更好地预测未来呢?绝妙的答案是:你让它预测过去。业务中心投入巨大的计算资源来创建庞大的再预报(也称后报)库。他们采用当今最先进的模式,对过去20或30年的天气进行回顾性运行。这就创建了一个统计上一致的数据集,记录了这个精确模式本会预测什么与实际发生了什么。这个丰富的数据集成为统计后处理方法的训练场,这些方法就像是原始预报的“精修学校”。这些方法学习模式独特的偏差和怪癖并加以修正,最终产生更可靠、技巧更高的最终预报产品。
如果一个预报系统是好的,那么几个系统会更好吗?是的,但并非人们可能想象的那么简单。在一个多模式集合中,我们结合来自世界各地不同建模中心的预报。最优的组合不是简单的平均。它是一个加权平均,其中权重由模式的完整误差结构决定,包括它们的误差相关性。
这里有一个非常反直觉的观点。想象你有两个预报模式。一个是明星选手,自身准确率很高。另一个则表现平平。你可能会倾向于将所有权重都给予那个明星。但假设那个平庸的模式有一个奇特的习惯:它在明星模式也表现不佳的日子里犯下最大的错误,但它的错误方向却相反。在这种情况下,那个平庸的模式,尽管整体准确性较低,却为修正明星模式提供了一条宝贵的信息!最优化数学表明,这个“较差”的模式在最终的、更优的组合预报中可以获得相当大的权重。这就是真正的“群体的智慧”,其中意见的多样性(或者在这种情况下,模式误差的多样性)是一种强大的资产。
经过所有这些工作,一个根本问题仍然存在:最终的预报有多好?对概率预报进行评分是一门微妙的艺术。你不能简单地说它是“对”还是“错”。如果我们预报有70%的降雨概率而没有下雨,这个预报就差吗?不一定。
为了解决这个问题,统计学的一个美妙分支发展了适当评分规则的概念。这些是巧妙设计的度量标准,旨在奖励诚实——从长远来看,预报员只有在陈述其真实信念时才能获得最高分。对于二元事件(例如,“本月会比平均温度更暖吗?”),最著名的是布莱尔分数 (Brier score)。它可以被优雅地分解为三个分量,讲述一个关于预报性能的丰富故事:
这种分解就像一份详细的诊断报告,让我们不仅能理解一个预报是否好,还能理解为什么它好或坏。这些严谨的工具使我们能够比较不同的预报系统,跟踪随时间推移的进展,并为用户提供关于预报预期性能的透明说明。
有了这些复杂且经过充分检验的工具,我们终于可以把注意力转向现实世界的问题。S2S 预报的价值通常不在于其绝对的精确性,而在于其能够在足够早的时间提供有用的指导以产生影响。
设想一个热带地区的公共卫生部门正在规划针对某种蚊媒疾病的干预措施。当“媒介适生性指数”(衡量对蚊子有利的环境条件的指标)预报将超过一个关键阈值时,疫情爆发的风险就会飙升。该部门可以发起一场预防运动,但这成本高昂,所以他们只希望在有相当把握阈值会被跨越时才采取行动。
他们有两个预报系统。一个是标准的、高度准确的天气预报,其技巧在几天后迅速下降。另一个是 S2S 系统,它对明天的预报不那么准确,但其技巧下降得慢得多。哪个更有用?通过应用贝叶斯定理,我们可以计算预报的阳性预测值 (PPV)——即在给出阳性预报的情况下事件发生的概率。该部门决定在 PPV 达到50%时采取行动。美妙的结果是,虽然天气预报在短期内更好,但其技巧下降得如此之快,以至于它只能提前几天达到50%的 PPV 标准。而 S2S 预报,凭借其平缓的技巧下降,可以提前数周达到同样的置信度阈值,为行动提供了更长的提前期增益。这正是 S2S 价值的精髓所在:用一点短期的清晰度换取更长的有用指导视野。
这一原则延伸到许多其他领域。一个决定种植哪种作物品种的农民,更关心未来两个月是否可能比正常情况更热更干,而不是6月15日的具体温度。S2S 预报恰好提供了这类指导。一个大型流域的水资源管理者可以利用未来一季降水量低于平均水平的预报,主动实施节水措施,从而避免日后的危机。一个电网运营商,看到两周后将出现持续热浪的预报,可以重新安排发电厂的维护并确保能源储备,帮助防止代价高昂且危险的停电。
最后,S2S 预测处于一个更大的环境模式层级中,智慧在于为特定任务选择合适的工具。这就是决策相关保真度的原则。如果政策问题是关于数十年来的全球碳预算,一个相对简单的全球能量平衡模型可能就足够了。你不需要预测芝加哥的雷暴来理解地球的整体变暖趋势。但如果你需要预测下个月特定珊瑚礁发生白化事件的风险——这是一个由极端海洋热浪驱动的现象,恰好处于 S2S 时间范围内——你就需要一个能够捕捉可能触发此类事件的区域海洋动力学的高分辨率模式。服务于政策的科学艺术并不总是使用最大的锤子,而是巧妙地将工具与手头的决策相匹配。
次季节到季节预测的发展是我们时代伟大的科学事业之一。它弥合了由初始条件驱动的混沌天气预报世界与由边界强迫、缓慢演变的气候预测世界之间的鸿沟。这是一个真正的跨学科大熔炉,流体动力学定律与统计推断理论在此相遇,其产出不是以学术论文来衡量,而是以社会复原力来衡量。
这个领域的终极之美不仅在于其物理学的优雅或数学的巧妙,更在于其在不确定的世界中提供指路明灯的深远潜力。通过耐心地解码地球复杂的舞蹈,我们获得了多一点远见,多一点智慧,以帮助我们应对气候变化的挑战。