谐波回归

玻尔百科

定义

谐波回归是一种通过将复杂的周期性模式分解为正弦和余弦波（谐波）之和来进行建模的统计方法。该方法利用三角函数的固有周期性，在疾病季节性分析、环境监测和人工智能模式识别中用于模拟及预测周期性数据。该技术通常结合周期图工具来识别数据中显著的循环频率，从而构建精简的回归模型。

核心要点

谐波回归通过将复杂的周期性模式分解为一系列简单的正弦和余弦波（谐波）之和来进行建模。
与多项式不同，三角函数具有内在的周期性，这使其特别适合用于建模和预测周期性数据。
周期图是识别数据中显著周期性频率的关键工具，它指导谐波的选择，以建立一个简约的模型。
该方法被广泛用于分析疾病的季节性、通过卫星数据监测环境变化以及增强人工智能中的模式识别。

引言

从潮汐的日夜涨落到季节的年度更替，我们的世界由各种节律所主宰。虽然这些模式无处不在，但它们很少是简单、完美的波形。来自医学、金融和环境科学的真实世界数据呈现出复杂、含噪声且常常不规则的周期。这就提出了一个根本性的挑战：我们如何才能创建一个数学模型，不仅能描述这些错综复杂的周期性，还能让我们理解其结构并预测其未来行为？

谐波回归提供了一个优雅而强大的答案。该技术利用傅里叶分析的基本思想，以简单的正弦和余弦波为基础，构建出复杂的模式。本文将作为理解和应用谐波回归的综合指南。首先，我们将深入探讨其原理与机制，探索从正弦和余弦波这些基本构件到用于模型拟合和显著性检验的统计方法等核心概念，同时也将讨论实际应用中的挑战。之后，我们将开启一段应用与跨学科联系之旅，见证这种方法在流行病学、生态学乃至人工智能等不同领域的实际应用中，如何揭示深刻的见解。

原理与机制

宇宙充满了节律。太阳升起又落下，四季轮转，我们的心脏跳动不息。这些周期，无论是行星的轨道还是股票市场的波动，都不仅仅是随机噪声；它们是时间中结构化的模式。为了理解它们、建模它们、预测它们，我们需要一种能够以自然本身的韵律进行表达的语言。这种语言由最简单、最优雅的周期函数构建而成：正弦和余弦。

振荡的基本元素：正弦与余弦

想象一个孩子在荡秋千。这个运动是平滑、重复且可预测的。在任何时刻，秋千的位置都可以通过它离中心点的距离以及是向前还是向后摆动来描述。一个简单的余弦波 $A \cos(\omega t)$ 优美地捕捉了这一过程。振幅 $A$ 告诉我们秋千达到的最大高度。角频率 $\omega$ 告诉我们秋千摆动的速度——频率越高，意味着每分钟摆动的次数越多。

但如果我们从秋千位于最低点、速度最快的那一刻开始观察呢？一个从峰值开始的余弦波就不适用了。我们需要对它进行平移。这个平移被称为相位 $\phi$ 。通过引入一个相位移，我们可以将运动写成 $A \cos(\omega t - \phi)$ 。这一个优雅的表达式可以描述任何简单、平滑的振荡。

然而，自然界很少呈现给我们单一的纯音。在数学上，一种更方便且等效的处理方式是，将任何简单的波都看作是一个“纯”余弦波和一个同频率的“纯”正弦波的组合。任何经过平移的余弦波都可以通过一个简单的三角恒等式重写：

$A \cos(\omega t - \phi) = (A \cos \phi) \cos(\omega t) + (A \sin \phi) \sin(\omega t)$

如果我们把系数记为 $\beta = A \cos \phi$ 和 $\gamma = A \sin \phi$ ，那么我们的波就简化为 $\beta \cos(\omega t) + \gamma \sin(\omega t)$ 。这就是我们将要构建模型的基础形式。它允许我们使用两个简单的、未平移的波，并且如果我们愿意，随时可以恢复到更直观的振幅和相位。振幅表示该频率下波的总强度，可以通过勾股定理求得： $A = \sqrt{\beta^2 + \gamma^2}$ 。相位告诉我们波在其周期中的起始位置，由 $\phi = \operatorname{atan2}(\gamma, \beta)$ 给出。这对正弦和余弦函数构成了描述任何节律的基本元素。

傅里叶的交响乐：从简单到复杂的构建

至此，我们接触到了一个由Joseph Fourier首次提出的深刻而优美的见解。他声称，任何周期性模式，无论多么复杂和不规则，都可以通过将一组简单的正弦和余弦波相加来构建。这些波的频率并非任意；它们是谐波，意味着它们的频率是基频的整数倍。

想象一种乐器。一把小提琴演奏中央C时，会产生一个基频约为261.6赫兹的声音。但这并不是你听到的全部。你还会听到更微弱的音符，其频率是基频的两倍（523.2赫兹）、三倍（784.8赫兹）等等。这些就是谐波或泛音，它们特定的混合比例赋予了小提琴独特的音色，使其区别于弹奏同一音符的钢琴。

同样，一个地区降雨的季节性模式也并非一个完美的、简单的正弦波。它可能在春季有一个陡峭的峰值，夏季干旱，秋季则有一个较小且更宽的峰值。谐波回归将这种复杂模式建模为一首由简单波形构成的“交响乐”。我们有一个以基本周期（例如一年）为主的波，然后加入谐波——一个半年度的波、一个季度的波等等——每个波都有其自身的振幅和相位，以捕捉季节性形状的更精细细节。

这个思想的数学表示就是谐波回归模型：

$y_t = \alpha + \sum_{k=1}^{K} \left[ \beta_k \cos\left( \frac{2\pi k t}{T} \right) + \gamma_k \sin\left( \frac{2\pi k t}{T} \right) \right] + \varepsilon_t$

这里， $y_t$ 是我们在时间 $t$ 的观测值。 $\alpha$ 项是总体的平均水平，在工程术语中称为“直流偏置”。 $T$ 是基本周期（例如365天或12个月）。求和项加总了 $K$ 个谐波。索引 $k$ 代表第 $k$ 次谐波，其频率是基频的 $k$ 倍。系数 $\beta_k$ 和 $\gamma_k$ 决定了每个谐波分量的振幅和相位。最后， $\varepsilon_t$ 是剩余的噪声，即模型无法解释的数据部分。

但为什么要费这么大功夫呢？为什么不使用像多项式回归这样熟悉的工具呢？如果我们试图用多项式拟合一个周期信号，比如 $y = \sin(2\pi x)$ ，就会遇到一个根本性的不匹配问题。一个多项式或许可以在单个周期内被勉强调整得与正弦波非常接近，特别是当我们使用高阶多项式时。然而，在该区间之外，多项式将不可避免地趋向正无穷或负无穷。它没有内在的周期性概念。周期函数是有界的；而非恒定的多项式是无界的。用多项式来为全局性的、重复的模式建模，就像雇一个短跑运动员去跑马拉松；他们可能在最初的100米表现出色，但从根本上说，他们不适合这项任务。而三角函数基底，则是为此而生的。

确定音符：正交性与最小二乘法

好了，我们脑海中已经有了这首交响乐，但我们如何确定每个音符的“音量”——也就是系数 $\alpha$ 、 $\beta_k$ 和 $\gamma_k$ 的值呢？我们通过寻找使模型预测值与我们的实际数据尽可能接近的系数值来实现这一点。“尽可能接近”通常由最小二乘法原理定义，即我们最小化数据与模型预测值之间差异的平方和。

这听起来可能是一个复杂的优化问题，但对于谐波回归，由于一个名为正交性的属性，问题得到了极大的简化。如果我们的数据点是在基频的一个或多个完整周期内均匀采样的，那么我们的正弦和余弦基函数就是正交的。简单来说，这意味着它们彼此之间完全独立。任何两个不同基函数的内积（它们逐元素乘积的和）都恰好为零。例如，对于一年中12个点的月度数据，基准年度周期的正弦和余弦列是正交的：

$\sum_{t=1}^{12} \cos\left( \frac{2\pi t}{12} \right) \sin\left( \frac{2\pi t}{12} \right) = 0$

这种正交性非常强大。它意味着我们可以独立地找到每个谐波的最佳系数，而无需担心其他谐波。为了找到，比如说， $\cos(2\pi t / T)$ 的系数，我们只需将我们的数据“投影”到那个余弦波上。计算过程解耦了，每个系数 $\beta_k$ 或 $\gamma_k$ 的估计值仅取决于数据及其对应的基函数。这就像拥有一套完美的音叉。要想知道一个复杂声音中含有多少“升C”音，你只需敲响升C音叉，看看它共鸣的程度。你无需担心D音或升F音的干扰。

信号还是噪声？显著性检验

在拟合模型之后，我们面临一个关键问题：我们发现的模式是真实的，还是我们只是在拟合随机噪声？在统计学中，我们从不轻信任何模式，必须对其进行显著性检验。

F检验提供了一种正式的方法来做到这一点。其逻辑类似于一场辩论。“零假设”持怀疑态度：它认为根本不存在周期性模式，数据最好用一条简单的平线，即其平均值来描述。我们的谐波模型是“备择假设”，声称它所包含的正弦和余弦组合提供了一个显著更好的解释。

F检验量化了这场辩论的结果。它计算的是我们的谐波模型相对于简单平均值所带来的拟合改进量与剩余未解释方差的比率。一个大的F统计量意味着我们的模型改进相对于噪声来说是显著的，这使我们有信心拒绝零假设，并得出结论：我们发现了一个统计上显著的季节性模式。这是统计学的“批准印章”，告诉我们所检测到的节律很可能是世界的真实特征，而不仅仅是数据中的幻影。

应对复杂世界：实际挑战与高级解决方案

正交性和最小二乘法的原理在其理想形式下是优美的。但真实世界的数据很少如此整洁。数据有缺失，并非完全规则，而且我们通常事先不知道信号的确切结构。正是在这里，谐波回归从一个优雅的理论演变为一个稳健、灵活的工具箱。

到底需要多少个谐波？周期图

一个关键的实践问题是模型中应包含多少个谐波（ $K$ ）。太少，我们会欠拟合，错过季节性形状的重要细节。太多，我们又会过拟合，将随机噪声当作真实模式来建模。周期图是我们的向导。它是一张图表，显示了数据在每个频率上的“能量”或方差。通过检查周期图，我们可以看到哪些频率包含显著的信号，这些信号表现为高出噪声基底的尖锐峰值。然后，我们可以对这些峰值进行显著性检验，只选择与统计上显著的频率相对应的谐波。这提供了一种数据驱动、有原则的方法来构建一个简约的模型——一个恰好足够复杂以捕捉信号，但又不过于复杂的模型。

混叠的风险

另一个根本性的挑战是采样。如果我们没有足够频繁地观察系统，我们可能会被欺骗。这种欺骗被称为混叠。考虑一个频率为每天1个周期的信号（例如，每日温度周期）。如果我们每天只采样一次，比如说每天中午，信号看起来将是完全平坦的——一个高频信号被“混叠”成了频率为零的信号。在这种情况下，日周期的余弦回归量变得与截距项（一列1）完全相同，使得我们设计矩阵的列线性相关。这个方程组变得无法求解唯一解。

这就引出了著名的奈奎斯特-香农采样定理：为了准确捕捉频率为 $f$ 的信号，你的采样率必须大于 $2f$ 。对于月度数据，我们能分辨的最高频率是每两个月一个周期（即每年6个周期的奈奎斯特频率）。底层过程中任何更快的节律都会被混叠，并伪装成一个较低的频率，从而混淆我们的分析。

处理缺失和不规则数据

如果我们的数据不是均匀间隔的，该怎么办？例如，由于云层遮挡了卫星对地面植被的观测，这种情况在环境和天文数据中很常见。不规则采样打破了我们正弦和余弦基函数的完美正交性。这带来了两个主要后果。

首先，对于我们不知道基频的探索性分析，标准的周期图（它假设数据是均匀间隔的）不再有效。我们必须转向一个更复杂的工具——Lomb-Scargle周期图，它是专门为从不规则间隔数据中计算频谱估计而设计的。

其次，当我们拟合谐波模型时，正交性的丧失可能导致系统病态，特别是当我们包含许多谐波或者数据中存在长段缺失时。病态意味着我们的回归量矩阵“接近”奇异。实际结果是我们的系数估计变得极不稳定；输入数据的微小变化可能导致解的剧烈波动。为了解决这个问题，我们可以使用正则化，一种源于现代机器学习的技术。通过在最小二乘准则中增加一个惩罚项来抑制过大的系数（这种方法称为岭回归），我们可以稳定估计过程。这会引入微量的偏差，但能极大地减少我们估计值的方差，从而得到一个更稳健、更可靠的模型。

因此，我们看到一个简单而优雅的想法——用波来描述节律——如何发展成为一个强大而复杂的框架。它不仅为自然的周期性模式提供了一种优美的语言，还为我们配备了统计和计算工具，以从真实世界的嘈杂、有缺失和复杂的数据中揭示这些模式。

应用与跨学科联系

我们已经花了一些时间来理解谐波回归的机制——这个优雅的思想，即复杂的波动可以由一系列简单的、纯粹的正弦和余弦波构建而成。但它究竟有什么用呢？它仅仅是一个数学上的奇趣吗？远非如此。这个思想是一把万能钥匙，能解开那些语言几乎不相通的各个领域的秘密。一旦你掌握了这个原理，你就会开始在各处看到它的身影，从沉睡森林的微妙脉搏到医院急诊室的繁忙喧嚣。让我们踏上一段旅程，穿越这些不同的世界，看看同一个基本思想如何以不同的面貌发挥作用。

解码生命与疾病的节律

要寻找周期，最直观的地方莫过于生命本身。我们生活在一个旋转的星球上，围绕着一颗恒星运行，昼夜的节律、冬夏的更替，早已融入我们的生物学之中。因此，疾病常常遵循同样的节拍也就不足为奇了。

以过敏性结膜炎为例——这种眼部瘙痒、流泪的常见病症在一年中的特定时间困扰着许多人。如果我们收集每日门诊就诊数据，会看到一个清晰的年度模式。谐波回归为我们提供了一种优美的方式来描述这种模式。通过拟合一个周期为一年的单一正弦/余弦对，我们能做的不仅仅是说“它是季节性的”。我们可以测量它的关键统计数据。拟合波的振幅告诉我们季节的强度——高峰期比低谷期严重多少。对于一个其计数在对数尺度上建模的疾病，比如振幅为 $A$ ，意味着高峰期的发病率可以比低谷期高出 $\exp(2A)$ 倍，这是一个巨大的波动！。相位则告诉我们关于时间点的信息：它能精确定位出一年中痛苦达到顶峰的确切日期。然后我们可以提出一个更深层次的问题：过敏性结膜炎的高峰是否与花粉计数的高峰一致？通过比较疾病周期的相位与花粉周期的相位，我们可以衡量环境诱因与生物反应之间的延迟。

当然，自然界很少像单一、完美的正弦波那样简单。想想一个城市的每周节律。人类行为在七天内创造了一种复杂的活动模式。如果我们观察一家医院急诊科的每日就诊量，我们看到的不仅仅是一个简单的每周起伏。周六晚上可能会有一个急剧的高峰，周日有一个较小的高峰，而周中则相对平缓。单个谐波无法捕捉这种不规则的形状，但多个谐波的组合可以。我们可以添加一个周期为3.5天（7/2）的二次谐波，或许还可以添加一个三次谐波。每个谐波都增加了一层细节，就像雕塑家在完善一个粗糙的形状。这个过程的艺术和科学在于知道何时停止。添加的谐波太少，你会错过真实的模式；添加的太多，你就会开始“拟合噪声”——将随机的波动误认为有意义的结构，这是统计学中被称为过拟合的一个大忌。我们使用像赤池信息准则（AIC）或交叉验证这样的严谨工具来找到“最佳点”，即那个既足够复杂以讲述故事，又足够简单以保持真实性的模型。

当我们不确定某个节律是否存在时，同样的逻辑也适用。对于像小儿莱姆病这样的疾病，它由活动具有强烈季节性的蜱虫传播，我们可能会从一个假设开始：每周的病例数遵循泊松过程——一个用于随机计数的模型——其平均率受到年度正弦波的调制。然后我们可以使用强大的似然比检验框架来询问数据：这个正弦波的振幅真的不为零吗？这使我们能够正式判断一个季节性模式是该疾病的真实特征，还是仅仅是数据中的一种错觉。

这种视角的威力如此之大，以至于我们甚至可以用它来回顾历史。在19世纪40年代，医生Ignaz Semmelweis正在与产褥热进行一场绝望的战斗，这种致命的感染夺去了无数产后母亲的生命。他的卓越洞见是，医生们正在将尸检中的“尸体颗粒”带到产科病房。他的解决方案——用氯溶液洗手——是革命性的。但如果我们分析他干预前维也ナ医院的死亡率记录，谐波回归揭示了另一个隐藏的故事。死亡率并非恒定不变；它们显示出明显的季节性周期，在二月下旬的寒冷天气中达到顶峰。这并不与Semmelweis的发现相矛盾，而是增加了一个新的层面。它表明，环境因素，比如人们在冬季因通风不良而挤在室内，调节了风险，使得致命颗粒的传播效率更高。在这里，谐波分析就像一台时间机器，让我们能够剖析一个历史上的医学谜团，并认识到多种力量在其中发挥作用。

聆听地球的心跳

让我们从人类的尺度放大到行星的尺度。我们的整个星球都随着季节的节奏呼吸。我们可以从太空中观察到这一点。卫星使用归一化植被指数（NDVI）等指标持续监测地表的“绿度”。一个温带森林的NDVI时间序列显示出清晰的年度脉动：春季变绿，夏季达到茂盛的顶峰，秋冬季则褪为棕色。

谐波回归是现代环境监测的主力军，被用于像BFAST（断点可加性季节和趋势）这样的算法中。在这里，最关键的第一步是正确地将我们的模型“调谐”到地球的节律上。来自卫星的数据可能每16天到达一次。为了捕捉365.25天的年度周期，我们的谐波模型的周期 $P$ 必须设置为一年内的观测次数，即 $P \approx 365.25 / 16 \approx 22.8$ 。正确设置这一点至关重要。如果我们设置了错误的周期，就像试图收听一个调错频率的广播电台。真实的季节信号没有被正确捕捉，其能量会“泄漏”到我们模型的其他部分。我们可能会将季节周期的一部分误认为长期趋势，从而错误地断定一片森林正在死亡或繁荣，而实际上我们所做的只是调错了我们的数学仪器。

但当节律本身受到干扰时会发生什么？一场森林大火、一次突发的虫害、一次干旱或一次砍伐事件都会突然改变土地的季节性心跳。绿度周期的振幅可能会骤降，或者其时间点（相位）可能会改变。我们的谐波模型可以被设计成充当这类事件的哨兵。通过拟合一个分段模型，我们可以检验谐波系数——振幅和相位——在一个潜在干扰事件前后是否相同。这些系数的统计显著变化就是一个生态系统被破坏的清晰指纹 [@problem-id:3799320]。同样的想法在其他领域也至关重要，比如可再生能源。一个沿海地点的风速时间序列具有很强的日循环（每日周期）。如果我们为风电场监测这个数据，我们需要区分风模式的真实变化与传感器故障。谐波回归使我们能够建立一个可以分别检验这两件事的模型：平均风速的突然跳变（“均值断点”，可能是传感器问题）与日循环振幅或相位的变化（天气模式的真实转变）。

即使没有突发干扰，地球的节律也并非总是静止的。气候变化可能导致生长季节变长，或者夏季绿度峰值在多年间变得更强。这意味着季节性振幅不是固定的，而是缓慢演变的。我们可以构建更复杂的状空间模型，其中振幅本身是一个动态变量，被允许随时间进行缓慢的随机游走。这使我们能够为一个逐渐变强或变弱的节律建模，捕捉长期环境变化的微妙印记。

最后，我们对世界的看法常常是多方面的。卫星不仅仅看到“绿色”；它在许多不同的光谱波段中进行观测——蓝色、绿色、红色、近红外等等。植物的季节性节律在每个通道中看起来都不同。一片健康的叶子吸收红光进行光合作用，并强烈反射红外光。因此，随着季节变化，红色信号会下降，而红外信号会上升。这些是不同的“旋律”，但它们都遵循同一个年度节拍。我们可以构建一个多变量谐波回归模型，同时对所有这些波段进行建模。它为所有波段使用一组共享的频率，但允许每个波段有其自己独特的振幅和相位。这就像听一场管弦乐：小提琴、大提琴和木管乐器都根据同一份乐谱（共享频率）演奏，但每种乐器都贡献其自己的音色和音量（特定波段的振幅和相位），共同创造出丰富、统一的声音。

教会机器合拍地歌唱

我们的旅程终点是现代科学最激动人心的前沿之一：人工智能。我们已经构建了像深度神经网络这样极其强大的学习机器，它们可以从海量数据中学习复杂的模式。这样的机器难道学不会一个简单的正弦波吗？

答案令人惊讶：“是的，但效率不高。”一个使用像修正线性单元（ReLU）这样常见激活函数的标准多层感知机（MLP），是通过拼接许多直线段来构建函数的。让它去近似一个平滑、弯曲的正弦波，就像让一个木匠只用短直木条来建造一个完美的圆。它可以做到接近，但这是一个笨拙且低效的过程。

在这里，一个来自19世纪的教训前来救场。如果我们不强迫网络从零开始构建正弦波，而是直接将正弦和余弦波作为其输入的一部分提供给它，会怎么样？这就是添加“谐波位置偏置”或“位置编码”背后的核心思想。我们为网络提供一个丰富的、预先构建好的、各种频率的正弦和余弦函数调色板。网络的任务不再是创造曲线，而仅仅是学习如何混合它们——选择正确的振幅和相位——来匹配目标函数。

这个简单而深刻的技巧极大地提高了网络对周期性数据建模的能力。它是傅里叶原始洞见的直接继承者：一个复杂的信号仅仅是简单正弦波的加权和。这个思想正是“Transformer”架构的基石，而后者是像ChatGPT这样革命性人工智能背后的引擎。为了理解一个词序列，Transformer需要知道每个词的位置。它通过为每个位置分配一个由——你猜对了——一组正弦和余弦函数构建的独特向量来实现这一点。

于是，我们发现自己身处一个奇妙的境地。那个帮助我们理解19世纪热病季节性和现代森林呼吸的相同原理，也在为21世纪的人工智能提供动力。这是一个惊人的证明，展示了一个优美的数学思想的统一性和持久力量。世界充满了节律，而谐波回归给了我们聆听它们的耳朵。