距平相关系数 (ACC)

玻尔百科

定义

距平相关系数 (ACC) 指一种用于评估气象预报技能的指标，通过计算预测天气距平与实测距平之间的空间相关性来衡量预报准确度。该系数对预报的相位和型相误差高度敏感，但对均值偏倚或预报振幅的系统性偏差并不敏感。在气象学领域，由距平相关系数所衡量的预报技能极限取决于气候系统中可预报信号与混沌噪声的固有比例。

核心要点

ACC 通过将预测的天气距平模式与观测到的距平进行相关分析来衡量预报技巧，并刻意忽略长期气候平均值。
在设计上，ACC 对模式和位相误差高度敏感，但对平均值或整体预报振幅的系统性偏差不敏感。
由 ACC 衡量的预报技巧的最终极限，并非由模式的完美程度决定，而是由气候固有的可预报信号与混沌噪声的比率决定。

引言

天气预报的质量如何？这个简单问题的答案却出奇地复杂。评判一个预报不仅仅是简单的“对”或“错”，它需要能够区分预测众所周知的季节平均值与捕捉天气本身混乱、千变万化的动态的工具。一个正确预测撒哈拉沙漠七月炎热的预报并没有告诉我们任何新信息，但一个简单的误差指标却可能给它打出高分。这突显了预报评估中的一个关键缺陷：需要衡量模式预测距平（即与正常状态的偏差）的能力。

距平相关系数 (ACC) 是为填补这一空白而设计的最优雅、最强大的工具之一。它通过纯粹关注预测模式的逼真度，提供对预报技巧的细致评估。本文分两部分探讨 ACC。第一章原理与机制将剖析 ACC 的数学和概念基础，揭示其几何解释如何使其能够洞察预报的位相和模式准确性，同时忽略系统性误差。接下来的章节应用与跨学科联系将展示该指标的实际威力，说明它如何用于超越简单的基准，评估数十年的模式后报，甚至探索我们气候系统中可预报性的基本物理极限。

原理与机制

要真正理解天气预报告诉我们什么，我们必须首先学会提出正确的问题。它好吗？它有用吗？这些简单的问题将我们引向一条引人入胜的发现之路。距平相关系数（ACC）是我们进行这种探究最强大的工具之一，但其力量在于其精妙之处。它不仅仅是给预报一个“分数”，它讲述了一个关于预报做对了什么，以及同样重要的，它甚至没有尝试去“看”到什么的故事。

关注天气，而非气候

想象一下查看 7 月 15 日的天气图。撒哈拉沙漠炎热，南极洲寒冷。一个天气模式如果只是简单地预测 7 月 15 日“撒哈拉炎热，南极洲寒冷”，看起来会非常准确，但它并没有告诉我们任何我们从基本地理知识中不知道的东西。它预测的是气候。而我们真正关心的是天气：高压和低压系统的特殊舞动，那些使这个 7 月 15 日与众不同的瞬态波和涡旋。

要看到天气，我们必须首先移除气候。我们通过计算距平来做到这一点。对于任何给定的日期和地点，我们都有一个长期平均值，即我们的气候态，它代表了预期的状况。距平就是与这个平均值的偏离：

\text{距平} = \text{实际值} - \text{气候平均值}

通过从预报和真实世界观测中都减去气候态，我们得到了两个距平场：一个“比平均温度更高”和“比平均温度更冷”区域的预报模式，以及一个观测到的模式。ACC 的工作就是衡量这两个模式的匹配程度。减去气候态这个简单的行为意义深远。它滤除了占主导地位、易于预测的季节周期，迫使我们评估模式预测天气本身这个具有挑战性、混沌且千变万化的织锦的能力。

相似性的几何学

那么，我们如何比较两个模式呢？这正是数学内在美感的闪耀之处。让我们想象一张距平图——拥有数百万个格点，每个点都有一个值——根本不是一张图，而是一个位于数百万维空间中的单点，一个向量。观测到的距平场是一个向量，我们可以称之为 $\mathbf{o'}$ 。预报的距平场是另一个向量， $\mathbf{f'}$ 。

“这两个模式有多相似？”的问题现在变成了“这两个向量之间是什么关系？”距平相关系数提供了一个惊人优雅的答案：ACC 是预报向量与观测向量之间夹角的余弦值。

\mathrm{ACC} = \cos(\theta) = \frac{\mathbf{f'} \cdot \mathbf{o'}}{\|\mathbf{f'}\| \|\mathbf{o'}\|}

想想这意味着什么。

如果预报模式是完美的，向量 $\mathbf{f'}$ 的指向与 $\mathbf{o'}$ 完全相同。夹角 $\theta$ 是 $0^\circ$ ，而 $\cos(0^\circ) = 1$ 。完美的模式匹配得到 ACC 为 $1$ 。
如果预报模式完全相反——在冷的地方预测暖，在暖的地方预测冷——向量 $\mathbf{f'}$ 指向完全相反的方向。夹角是 $180^\circ$ ，而 $\cos(180^\circ) = -1$ 。
如果预报模式与观测模式没有任何关系，那么这两个向量在几何上是不相关的，或称正交的。夹角是 $90^\circ$ ，而 $\cos(90^\circ) = 0$ 。ACC 为 $0$ 表示没有技巧。这是“气候态预报”——即预测处处距平为零的预报——会得到的分数。一个没有变化的预报不可能与任何东西协变，所以它的相关性被正确地定义为零。

这种几何视角立即揭示了关于 ACC 的一个深刻真理。夹角的余弦值只取决于向量的方向，而不取决于它们的长度。

ACC 能“看到”什么——以及它忽略了什么

让我们来玩玩我们的向量。假设我们的预报完美地捕捉了模式（ $\mathrm{ACC}=1$ ），但其强度有偏差。也许预报的距平始终只有观测到的一半大小。在几何上，这意味着我们的预报向量 $\mathbf{f'}$ 指向正确的方向，但长度只有观测向量 $\mathbf{o'}$ 的一半。这会改变它们之间的夹角吗？不会！夹角仍然是 $0^\circ$ ，ACC 仍然是完美的 $1$ 。

这告诉我们 ACC 完全不受乘性偏差或振幅误差的影响。它只关心模式，不关心其整体强度。这是一个极其重要的特性。它分离出预报质量的一个特定方面：特征的空间和时间位置。然而，这也意味着完美的 ACC 分数并不意味着完美的预报。一个 ACC=1 的预报如果其振幅错得离谱，仍然可能有非常大的均方根误差 (RMSE)。

现在，如果我们的预报在所有地方都系统性地偏暖一个恒定的量，比如说 $1^\circ\text{C}$ ，会怎么样？这是一种加性偏差。在我们的向量类比中，这对应于将整个预报向量 $\mathbf{f'}$ 平移一个常数向量。ACC 的计算，根据其定义，涉及到对数据进行中心化处理——即在计算相关性之前从每个距平场中减去空间平均值。这种中心化处理使得 ACC 在数学上对任何均匀的加性偏差免疫。一个位相完美但存在巨大“模式漂移”或系统性偏差的预报，其偏差将完全从 ACC 计算中移除，尽管这个偏差会主导 RMSE。

ACC 是一个纯粹主义者。它被设计用来忽略平均场中的误差（加性偏差）和模式整体振幅的误差（乘性偏差）。它唯一关注的是模式的逼真度。

不完美的物理意义

一个比如说 $0.8$ 的 ACC 分数在物理上意味着什么？一个不完美的分数可能源于多种原因。其中之一是预报中简单的随机、非结构化误差——我们称之为噪声。但一个更有趣的来源是位相误差，或位置误差。

想象一个预报完美地预测了一场飓风——它的形状、强度、结构——但将其位置放在了实际位置以西 100 英里处。模式是正确的，但位置错了。预报向量和观测向量不再对齐；它们之间有了一个夹角，ACC 将小于 1。在一个理想化的情景中，ACC 恰好等于该场在对应于位置误差的距离上的空间自相关。位置偏差越远，场与其移动后的自身的去相关性就越大，ACC 就越低。这提供了一个极好且具体的解释：一个低于 1 的 ACC 值可以代表一个与现实“异相”的预报。

现实世界中的复杂性

当我们把这个优雅的图像应用到全球预报的混乱现实中时，它变得更加复杂。两个实际问题至关重要。

首先，我们的“标尺”——气候态——并不完美。它是从有限的历史记录（通常是 30 年）中估算出来的。这意味着气候态本身包含了那 30 年特定天气带来的抽样噪声。当我们从预报和观测中减去这个有噪声的标尺时，我们无意中将这种噪声注入了两个场中。这种额外的、不相关的噪声会人为地降低它们之间的相关性。结果是，我们计算出的 ACC 存在系统性的低估偏差；它总是会略低于我们用一个完美的、无限长的气候态所能得到的“真实”相关性。我们的气候周期越短，我们的标尺噪声就越大，这种低估就越严重。

其次，地球是一个球体。当我们在标准的经纬度网格上计算“全球”ACC 时，网格单元的面积并非都相等；它们在接近两极时会急剧变小。如果在计算中我们平等地对待每个格点，我们就会给微小的高纬度区域过多的影响。这就像只通过看耳朵来评判一幅肖像画。为了得到一个有物理意义的全球分数，我们必须进行面积加权，通常是通过将每个格点的贡献乘以其纬度的余弦值。没有这个关键步骤，一个在两极表现不佳但在赤道表现良好的预报可能会受到不公平的惩罚，给我们一个关于其全球技巧的扭曲看法。

因此，距平相关系数不仅仅是一个数字。它是一个透镜，被精心制作以聚焦于现实的一个特定方面——模式的逼真度。理解它的原理、它的几何学以及它的局限性，使我们能够透过这个透镜，看到一个预报技巧的真实本质。

应用与跨学科联系

在我们经历了距平相关系数 (ACC) 的数学机制之旅后，你可能会留有一种抽象而简洁的感觉。但一个工具真正的美不在于其设计，而在于它让我们能够构建什么——或者在我们的例子中，它让我们能够理解什么。ACC 不仅仅是验证脚本吐出的一个数字；它是一个强大的透镜，通过它我们可以观察我们对世界的模型与世界本身之间错综复杂的互动。它帮助我们提出比简单的“对”或“错”更深层次的问题，并将数值模拟的深奥世界与关于可预报性、记忆以及我们认知极限的基本问题联系起来。

第一个障碍：战胜天气的“幽灵”

在我们声称一个预报有任何技巧之前，我们必须证明它能比一些非常简单，几乎是微不足道的竞争者做得更好。第一个是气候态：简单地断言明天的天气将是那一天的长期平均值。第二个是持续性预报：更简单的想法，即明天将和今天完全一样。这些是过去预报的幽灵；任何现代系统都必须首先驱除它们。

我们如何知道自己成功了？想象一个简单、缓慢变化的气候变量，比如一片海洋的温度。它从一天到下一天的波动通常可以用一个简单的“记忆”模型来描述：今天的距平只是昨天距平的一小部分， $\phi$ ，再加上一些新的随机扰动。这是一个经典的 AR(1) 过程。如果我们使用持续性预报——预测今天的值作为明天的值——它的技巧如何？ACC 给出了一个惊人优雅的答案：相关性就是 $\phi$ 。

这个小小的方程充满了直觉。如果系统有很强的记忆（ $\phi$ 接近 $1$ ），持续性预报就是一个很好的预报，并且有很高的 ACC。如果系统没有记忆（ $\phi=0$ ），持续性预报就毫无用处，ACC 为零。此外，通过比较持续性预报与气候态预报的误差，我们可以找到一个精确的阈值。对于一个 AR(1) 过程，只有当这个记忆因子 $\phi$ 大于 $\frac{1}{2}$ 时，持续性预报才比气候态预报更好。因此，ACC 提供了预报技巧阶梯上的第一级，为我们提供了一个量化指标，判断我们的模型是否已经越过了最低的门槛：拥有比金鱼更好的记忆力。

距平的力量：将形态与偏差分离

在“距平相关系数”中，最重要的词或许是“距平”。气候模型是物理学和计算的奇迹，但它们并不完美。它们常常有系统性偏差——比如，与现实相比，总是倾向于稍微偏暖或偏干一点。像均方根误差 (RMSE) 这样的指标会无情地惩罚这样的模型，在某些应用中，这样做是正确的。

但如果我们更关心的是模型是否预测了变化呢？它是否预见到了即将来临的热浪，即使它搞错了基线温度？它是否捕捉到了干旱的模式，即使它低估了其绝对严重性？这就是 ACC 的闪光之处。通过其构造——将与平均值的偏差进行相关——它完全专注于模式。一个预报可能有偏差（糟糕的偏差）或错误的振幅（例如，预测了 2 度的升温而实际上是 4 度），导致绝对值上的巨大误差，但如果其预测在时间和空间上的“形状”与现实匹配，它仍然可以获得非常高的 ACC。

这个特性不仅仅是一个数学上的奇特之处；它是关于我们在预报中看重什么的一个深刻声明。在气候变化的背景下，它也是一种超能力。“平均”天气是什么？1980-2010 年的气候不同于 1990-2020 年。像 RMSE 这样的指标对你选择哪个基线来定义你的距平是极其敏感的。但 ACC，因为它在数学上对这种常数平移是不变的，所以是稳健的。它不关心你把什么叫做“正常”；它只关心你是否正确预测了围绕那个“正常”的波动和摆动。它将信号与偏差分离开来。

可预报性之窗：记忆与技巧的必然衰减

每个人都知道，对明天的预报比对下个月的预报更可靠。但我们能 quantifying 这种技巧的衰减吗？ACC 再次通过将技巧与记忆这一物理概念联系起来，提供了深刻的见解。

考虑气候系统中一个缓慢移动的部分，比如上层海洋的热含量。它有巨大的热惯性；它不会一夜之间忘记昨天的温度。我们可以再次用一个简单的记忆参数 $\phi$ 来模拟它的行为。如果我们对未来 $L$ 天的预报时效进行持续性预报（即，我们用今天的值来预测 $L$ 天后的值），技巧是如何衰减的？ACC 给出了答案：它就是 $\phi^{L}$ 。

预报的技巧随预报时效呈几何级数衰减。衰减的速率由系统自身的内在记忆 $\phi$ 决定。一个具有长记忆（大 $\phi$ ）的系统，如海洋，可预报性丧失得很慢。一个记忆短的系统，如一个小小的湍流涡旋，几乎瞬间就失去可预报性。因此，ACC 不仅仅是一个检验分数；它成为了探索系统本身物理学的探针，为我们描绘出“可预报性视界”的精确图像。

后报的艺术：从模式代码到可信赖的数字

有了这些概念，我们现在可以转向气候模拟的真实世界。在全球各地的中心，科学家们运行着大规模的后报（或称回溯预报）实验，他们将现代预报模型在过去的时间里运行，例如，从 1990 年到 2020 年的每一年。然后他们将这几十年的预报与观测到的现实进行比较。ACC 是这项评估的主力指标。

为什么他们需要这么多年？仅仅从几个数据点计算出的相关性是出了名的不可靠。想象一下为一个 5 年的后报计算 ACC；一个幸运或不幸的年份就可能极大地改变分数。为了得到一个稳定、可信的关于模型真实技巧的估计，我们需要一个长期的记录。Fisher 变换的数学精确地告诉我们，随着我们向后报中增加更多的年份，我们 ACC 估计的不确定性是如何缩小的——（变换后的）分数的方差与 $1/(N-3)$ 成比例，其中 $N$ 是年份数。这为为什么这些昂贵的、跨越几十年的后报实验不仅有帮助，而且是必不可少的提供了统计学上的理由。

在实践中，ACC 被用来评估对关键现象的预报，比如带来生命之源的印度季风降雨。它也是模型改进循环中的一个关键诊断工具。例如，如果科学家们实施一种新技术将卫星降雨数据同化到他们的模型中，他们的第一个问题是：这有帮助吗？通过比较改变前后的 ACC，他们可以直接衡量新数据和方法所增加的价值。

深入探究：预报何时以及为何具有技巧？

一个模型的单一 ACC 分数，在 30 年和全球范围内取平均，是一个有用但粗略的总结。真正的科学侦探工作始于我们开始切分数据。我们模型的技巧是均匀的，还是取决于气候系统本身的状态？

这是条件检验的领域。例如，众所周知，平流层极涡——冬季在极地上空盘旋的气流之河——的状态可以影响整个北半球数周的天气模式。我们可以问：我们对欧洲的次季节预报技巧在“强极涡”状态下与“弱极涡”状态下是否不同？我们可以通过根据极涡状态将后报数据分成两堆，并分别为每堆计算 ACC 来回答这个问题。我们常常会发现显著的差异：模型可能在一个状态下有显著的技巧，而在另一个状态下则完全没有。这告诉我们，可预报性本身不是静态的。ACC 变成了一把手术刀，让我们能够剖析模型的表现，并将其成功与失败追溯到大气和海洋的潜在物理学。

终极极限：一个预报究竟能有多好？

这引出了一个最终的、深刻的问题。极限是什么？一个“完美”的分数是多少？是 ACC 为 1 吗？答案美妙地是，不是。

想想气候。它的变化是由两种因素驱动的。有一个可预报分量，一个由缓慢变化的边界条件（如海面温度或土壤湿度）驱动的信号。这是我们希望能够预报的部分。但还有一个不可预报分量，一个源于天气本身混沌、内部动态的“噪声”分量。一只蝴蝶在巴西扇动翅膀，故事就这样继续下去。气候的总方差是可预报信号的方差与不可预报噪声的方差之和。

现在，考虑一个可以想象的最好的预报——一个“完美模型”，它确切地知道边界强迫，并能将其转化为气候状态的精确条件期望。它的 ACC 是多少？事实证明，这个完美预测器与实际观测到的气候之间的相关性不是 1。相反，可实现的最大 ACC 是 $\sqrt{R^2}$ ，其中 $R^2$ 是总气候方差中可归因于可预报信号的部分。

这是一个深刻而令人谦卑的结果。它告诉我们，预报技巧的上限不是由我们模型的质量决定的，而是由气候系统本身的根本性质决定的。一个“完美”的预报不是一个与现实达到完美相关的预报，而是一个完美捕捉现实中所有可预报部分的预报，仅此而已。因此，距平相关系数，这个源于为业务预报打分需求的实用工具，将我们引向了可预报性的最前沿，为我们衡量我们距离实现可能达到的最佳水平有多近提供了一个量化标准。它是一座从务实通往深刻的桥梁。