非平稳信号：流变世界分析指南

玻尔百科

定义

非平稳信号：流变世界分析指南是指在信号处理领域中，其均值和方差等统计特性随时间变化的信号。这类信号违反了经典分析方法的平稳性假设，通常需要使用小波变换或去趋势波动分析等现代技术来准确追踪其演化特征。分析非平稳性对于理解神经科学、生物学和地震学中的动态现象至关重要。

核心要点

非平稳信号的统计特性（如均值和方差）随时间变化，这违背了经典分析方法的假设。
将傅里叶变换等平稳分析工具应用于非平稳数据可能导致误导性结果，例如时间信息丢失和伪相关。
小波变换和去趋势波动分析等现代技术旨在追踪信号特征的演化，从而提供更准确的分析。
在神经科学、生物学和地震学等领域，分析非平稳性对于理解从大脑活动到地震等动态现象至关重要。
在研究复杂的非平稳信号时，使用替代数据进行统计验证对于区分真实模式和分析假象至关重要。

引言

在理想世界中，信号是恒定且可预测的，就像一台完美调校的引擎发出的稳定嗡嗡声。科学家将这种特性称为“平稳性”。对于这些表现良好的信号，一套基于傅里叶变换的强大工具箱足以提供完整的描述。然而，现实世界很少如此简单。从汽车引擎的 sputtering 声到活体大脑中的电脉冲爆发，我们遇到的大多数信号都是“非平稳”的，这意味着它们的基本特性在不同时刻是变化的。这种动态性构成了一个重大挑战，因为将传统分析工具应用于这些演化中的信号可能导致一系列假象，从信息丢失到完全虚构的关系。本文将直面这一关键问题。首先，在“原理与机制”部分，我们将探讨平稳信号与非平稳信号之间的根本差异，并详细说明忽略这一区别所带来的危险陷阱。然后，在“应用与跨学科联系”部分，我们将考察为驾驭这种复杂性而发展的现代技术，并了解它们如何在从神经科学到工程学的各个领域中开启新的洞见。

原理与机制

想象一下聆听一台精密设计的电动机发出的嗡嗡声。声音平稳，音高和音量保持不变。无论你现在听、五分钟后听，还是一小时后听，它的特性都是恒定的。在信号世界里，这是我们的理想状态，物理学家和工程师称之为平稳性 (stationarity)。如果一个过程的基本统计特性——它的平均值、整体波动强度（方差）及其内部“记忆”——不随时间改变，那么这个过程就是平稳的 (stationary)。这种稳定性是一个优美而强大的简化假设。它意味着信号的“规则”在昨天、今天和明天都是相同的。

物理学家的理想：平稳信号的不变世界

对于这些表现良好、平稳的信号，我们拥有一套极为优雅的工具。其核心工具是自协方差函数 (autocovariance function)，我们可以称之为 $R(\tau)$ 。它回答了一个简单而深刻的问题：如果我们知道信号在当前时刻的值，这能在多大程度上告诉我们它在 $\tau$ 时间之后的值？对于一个平稳过程，这种关系只取决于时间延迟 $\tau$ ，而不取决于我们开始观察的绝对时间 $t$ 。无论是我们电动机的嗡嗡声，还是电阻器中热噪声的嘶嘶声，两个时间点之间的相关性仅取决于它们相隔多远。

当我们通过 Jean-Baptiste Joseph Fourier 的视角来审视这个自协方差函数时，奇迹便发生了。作为信号处理基石的维纳-辛钦定理 (Wiener-Khinchin theorem)告诉我们，自协方差函数的傅里叶变换给出了功率谱密度 (Power Spectral Density, PSD)， $S(f)$ 。如果说自协方差函数描述了信号在时域中的记忆，那么功率谱密度则描述了它在频域中的特性。它将信号分解为其组成频率，并告诉我们每个频率中包含了多少功率或强度。对于我们完美的电动机，功率谱密度可能会在 60 Hz 处显示一个尖峰，并在其谐波处显示较小的尖峰。对于热噪声，它将是一条平坦的线，表示所有频率上的功率均等。这套方法之所以行之有效，是因为信号的“旋律”是恒定的，所以一个单一的、不随时间变化的频谱就能完美地描述它。

当世界不再静止：非平稳性简介

现在，让我们离开这个理想化的世界，回到现实中来。想象一下在寒冷的早晨，一辆汽车引擎启动的声音：它咳嗽、 sputter、高速空转，然后最终稳定在低怠速状态。它的特性在不断变化。这就是一个非平稳 (nonstationary) 信号。如果一个信号的统计特性——它的均值、方差或自协方差结构——本身是时间的函数，那么这个信号就是非平稳的。

世界充满了这样的信号。一个神经元的电活动可能安静数秒，然后突然爆发出短暂的高频发放脉冲。你坐着时心率很低，但站起来时会跃升，然后在房间里走动时又会缓慢变化。一支股票的价格在数天和数月内不可预测地波动。一台刚刚开启的精密科学仪器，其读数会随着其组件预热至稳定温度而缓慢漂移。即使是一个被放置在计算机虚拟盒子里的模拟分子，在安顿到其自然的低能“平衡”状态之前，也会花一些初始时间摆脱其不自然的起始位置。在所有这些情况中，游戏规则都在改变。过程在演化。

伪装的危险：为何旧工具会失效

如果我们固执地忽略这种变化，并将我们信赖的平稳工具包应用于非平稳信号，会发生什么？结果不仅仅是略有不准，它们可能是灾难性的误导。我们会陷入一系列微妙而危险的假象之中。

时间的迷雾

傅里叶变换，我们频谱分析的引擎，有一个决定性的特点：它的基函数，即正弦波 $e^{i 2 \pi f t}$ ，是永恒存在的。它们贯穿所有时间。当我们计算一个频谱时，我们是在问我们的信号与这些永恒的正弦波中的每一个有多相似。结果是我们整个测量期间的平均值。

想象你是一位神经科学家，正在研究一个大脑信号，该信号在上午 10:05 包含一个短暂的“伽马”振荡脉冲，在下午 3:30 又有另一个相同的脉冲。如果你对一整天的记录进行单一的傅里叶变换，你会在伽马频段看到一个功率凸起。但频谱本身并没有提供任何关于这些脉冲发生时间的线索。时间信息被涂抹、平均掉了，消失在迷雾中。变换告诉你发生了什么，但它忘记了何时发生。这是时频不确定性原理的直接后果：要完美地知道频率，你必须放弃所有关于时间的信息。

趋势的支配性影响

一种非常常见的非平稳形式是缓慢的漂移或趋势。这可能是你的实验设备逐渐变暖，或者病人一生理状态的缓慢变化。假设我们正在测量一个我们认为具有“1/f”噪声谱的信号，其中功率 $S(f)$ 与 $f^{-1}$ 成正比。这是一种迷人的信号类型，在自然界中很常见。然而，我们的测量被一个非常缓慢、游走的漂移所污染，就像一个随机游走，当在有限时间内分析时，它贡献的功率看起来大致像 $f^{-2}$ 。

测得的总频谱是两者之和： $S_x(f) \approx K f^{-1} + C f^{-2}$ 。在高频处， $f^{-1}$ 项占主导地位，我们看到的是真实的物理现象。但在极低频处，属于漂移的 $f^{-2}$ 项要大得多。它完全淹没了我们关心的信号。如果我们试图从这个组合信号中测量谱斜率，我们不会得到 $\alpha=1$ 的真实值。相反，我们会测量到一个向上偏置的斜率，在最低频率处接近 $\alpha=2$ 。缓慢而强大的漂移掩盖了更微妙、更快的动态。这就像在地震中试图聆听小提琴协奏曲。

因果关系的海市蜃楼

忽略非平稳性最令人震惊的后果之一，或许是它能创造出虚幻的关系。想象两个时间序列， $x_t$ 和 $y_t$ ，它们完全不相关。假设它们都是由一种称为“随机游走”的过程生成的，即在每一步，我们只是将一个小的随机数加到前一个值上。这些信号漫无目的地上下游荡，没有记忆或目标。

如果我们取这两个独立的随机游走序列，并进行标准的线性回归，探究 $x_t$ 是否能预测 $y_t$ ，我们很可能会发现一个“统计上显著”的相关性。我们可能会得到一个很高的 $R^2$ 值和一个极小的 p 值，所有这些通常会让科学家心跳加速的东西。但这完全是一个海市蜃楼。为什么会发生这种情况？因为两个序列都有漂移的趋势。仅仅是偶然，它们可能都向上漂移了一段时间，然后又都向下漂移。我们的统计检验将这种共同的、巧合的游走误认为是一种真正的关系。这就像看着两片叶子顺流而下；它们遵循相似的路径，不是因为一片引导另一片，而是因为它们都被同一股潜在的水流携带。

这种假象延伸到了更复杂的方法，如格兰杰因果关系 (Granger causality)，该方法常用于神经科学等领域，以推断大脑区域之间的方向性影响。如果两个 fMRI 信号 $x_t$ 和 $y_t$ 真正独立，但都共享一个共同的、未被观测到的非平稳漂移（也许是由于扫描仪的不稳定或受试者唤醒水平的变化），格兰杰因果检验就会被愚弄。它会发现 $x_t$ 的过去有助于预测 $y_t$ 的未来。原因微妙而精妙： $x_{t-1}$ 提供了对时间 $t-1$ 时隐藏漂移的一个带噪测量。通过将其与来自 $y_{t-1}$ 的信息结合，算法可以更好地估计漂移，从而提高对 $y_t$ 的预测。检验正确地发现预测得到了改善，但它错误地将其归因于从 $x$ 到 $y$ 的因果联系，而实际上这是由于一个共享的、隐藏的混杂因素所致。

被污染的平均值

最简单的统计量是平均值。这总该是安全的吧？完全不是。想象一个蛋白质折叠的计算机模拟。我们从一个随机的、高能的构象开始，让模拟运行，记录每一步的能量。系统会经历一个初始阶段，即“老化期 (burn-in time)”，在此期间它会迅速松弛并失去能量，直到达到其稳定的低能平衡状态。这个初始阶段是非平稳的。

假设我们想计算蛋白质在平衡状态下的平均能量。如果我们天真地对整个模拟过程（包括高能的老化期）进行平均，我们的结果将会被系统性地扭曲。我们计算出的平均值将高于真实的平衡平均值。这不是一个会随着模拟时间延长而消失的随机误差；它是一种偏差 (bias)，一种因包含了非平稳数据而植根于我们计算中的系统性误差。获得正确答案的唯一方法是首先识别并丢弃老化期，然后再计算平均值。

新的视角：驾驭与追踪变化

面对这一系列恐怖的景象，我们必须适应。我们需要新的工具和一种新的思维方式来应对一个流变的世界。幸运的是，物理学家和数学家已经发展出许多强大的策略。

假设局部恒定

最常见和实用的方法不是假设信号永远是平稳的，而是假设它在一段短时间内是近似平稳的。我们可以将我们长的、非平稳的信号切成许多短的、重叠的窗口。在每个微小的窗口内，我们可以假装信号的特性是恒定的，并计算一个功率谱密度。通过将这些频谱串联起来，我们创建了一个频谱图 (spectrogram)——一幅展示信号频率内容如何随时间演化的美丽地图。这就是短时傅里叶变换 (Short-Time Fourier Transform, STFT) 背后的原理，也是时频分析的主力，让我们能够看到瞬态的神经脉冲和引擎变化的嗡嗡声。

消除变化

当非平稳性是一种简单的、缓慢的趋势时，最直接的方法往往是最好的：摆脱它。我们可以用一个简单的函数（如一条直线或一个低阶多项式）来拟合数据并将其减去，这个过程称为去趋势 (detrending)。对于类似随机游走的过程，一个更简单的方法是取数据的一阶差分，分析其变化量 $x_t - x_{t-1}$ 而不是其水平值 $x_t$ 。这种差分通常可以将一个非平稳序列转化为一个平稳序列，从而使我们的经典工具能够安全地应用。当然，我们必须小心。如果两个序列共享一个有意义的长期关系（一种称为协整 cointegration 的属性），差分可能会把婴儿和洗澡水一起倒掉，破坏我们试图研究的那个联系。

重新定义工具

一种更深刻的方法是完全放弃单一、时不变频谱的概念。为什么不定义一个本身就是时间函数的频谱呢？这就引出了像 Priestley 的演化谱 (evolutionary spectrum)， $S_x(\omega, t)$ 这样的概念。这个对象代表了信号在频率 $\omega$ 和特定时间点 $t$ 的功率。这是一种更丰富的描述，是一份完整的乐谱而非单一的和弦，它明确地拥抱了信号不断变化的本质。

最终，对非平稳信号的研究迫使我们成为更好的科学家。它提醒我们，我们的工具是建立在假设之上的，我们必须始终质疑这些假设是否成立。现实世界很少是静止的。它是一个变化、演化、有始有终的世界。通过发展描述这种变化的方法，我们对周围的宇宙获得了更深刻、更真实的图景。我们学会了不仅聆听稳定的嗡嗡声，还要聆听现实中完整、演化的交响乐。

应用与跨学科联系

在我们之前的讨论中，我们探寻了那些让我们能够处理特性随时变化的信号的原理。从本质上讲，我们为观察世界打造了一副新眼镜，用高速、可变焦的相机取代了经典傅里叶分析那模糊的、长曝光的照片。但一个工具的好坏取决于它能让我们发现什么。现在，让我们戴上这副眼镜环顾四周。我们会发现非平稳信号并非科学的一个深奥角落；它们正是自然的语言，从我们大脑的内部运作到恒星的核心，无处不在。

自然的交响乐：聆听动态世界

许多最深刻的科学问题都涉及聆听和解读宇宙提供的复杂、演化的信号。我们的新工具不仅处理数据；它们让我们能听到交响乐。

大脑的低语

没有哪里比大脑中的世界更具动态性了。一个瓶中之脑的静态图像是一种怪诞的歪曲；活体大脑是活动的旋涡，是一个通信模式在瞬间形成和消解的网络。

想象一下窃听海马体（一个对记忆至关重要的区域）的电信号交流。你会听到缓慢滚动的波——即 theta 节律——和突发的、尖锐的高频“涟波”。经典的傅里叶变换会告诉你 theta 和涟波频率都存在，但它会把它们的出现时间混在一起，丢失了关于何时发生的关键信息。短时傅里叶变换 (STFT) 是一个进步，就像拍摄一系列快照。但它固定的窗口大小意味着我们面临一个令人沮丧的权衡：短窗口能捕捉涟波的时间，但模糊了其频率；而长窗口能精确测量 theta 频率，但丢失了其时间位置。

这正是小波变换 (wavelet transform) 的美妙之处。它是一个多分辨率的透镜，使用短而灵活的小波来获取高频事件的清晰时间快照，并使用长而宽的小波来获得低频节律的精确频率调谐。它使其分析适应信号自身的结构，让我们两全其美。

这种追踪变化中的大脑状态的能力超越了单个信号。神经科学家现在正在绘制大脑的“功能连接性”——不同区域之间的瞬时通信模式。使用 fMRI，他们观察到大脑网络并非静态。一个简单的方法是使用滑动窗口 (sliding window)，在短的、移动的时间段内计算两个大脑区域之间的相关性 [@problem_-id:4193705]。这揭示了一个动态的连接组 (connectome)，一个随着我们精神状态变化而重构的网络。当然，这引入了一种新的不确定性：偏差-方差权衡。短窗口能追踪快速变化但产生有噪声的估计；长窗口提供稳定的估计但可能模糊掉重要的快速动态。

对于像脑电图 (EEG) 这样更为复杂的信号——它是由重叠、调频的大脑节律组成的骚动——我们可以转向更具适应性的方法，如希尔伯特-黄变换 (Hilbert-Huang Transform, HHT)。HHT 不强加像正弦波或小波那样的固定基，而是首先让数据自行分解为一组“内在模态函数 (Intrinsic Mode Functions, IMFs)”——其基本振荡分量。然后，它对每个 IMF 应用希尔伯特变换来追踪其瞬时幅度和频率。这就像在分析乐谱之前，先让交响乐团自行分成各个乐器部分——一种截然不同、由数据驱动的哲学。

身体与地球的节律

这种使我们的工具与信号性质相匹配的原则，贯穿于整个生物和物理世界。

考虑一下你一天中活动节律，由一个简单的腕戴设备测量。这个信号被 24 小时昼夜节律的巨大非平稳性所主导。然而，其中隐藏着更微妙的模式。某一刻的活动会使你在下一刻或多或少地保持活跃吗？这种“记忆”或“惯性”由一个称为赫斯特指数 (Hurst exponent) $H$ 的分形度量来量化。 $H > 0.5$ 的值表示持续性——一种继续你正在做的事情的倾向——这通常是健康生理系统的标志。挑战在于，在压倒性的昼夜趋势存在的情况下测量这种微妙的相关性。这就是去趋势波动分析 (Detrended Fluctuation Analysis, DFA) 发挥作用的地方。通过在不同大小的窗口内计算波动，并且是在移除每个窗口的局部趋势之后，DFA 能够揭示潜在的分形标度，讲述一个关于我们行为组织的故事，否则这个故事将是不可见的。

让我们深入身体，进入内耳的耳蜗。当耳朵接收到一个咔哒声时，耳蜗会机械地将其分解为其组成频率，这个过程需要时间。高频在耳蜗底部被快速处理，而低频则传播到更远的顶端，到达得更晚。因此，耳朵产生的微弱回声，即瞬态诱发耳声发射 (Transient-Evoked Otoacoustic Emission, TEOAE)，具有“啁啾 (chirp)”结构：高频先出现，低频后出现。一个固定窗口的频谱图很难在时频平面上捕捉到这种弯曲的特征。但是，常数 Q 小波变换，其自适应分辨率单元在高频处短而宽，在低频处长而窄，自然地与这种物理现实相吻合。这是一个数学工具完美映射生物机制的华丽例子。

那么地球本身呢？地震的地震图是典型的非平稳信号：一段平静期，随后是能量在宽频率范围内的突然、剧烈爆发。通过建立一个由小波滤波器组成的滤波器组，每个滤波器调谐到不同的频带，地震学家可以创建地震的时频“指纹”。他们不仅能看到地震何时开始，还能看到能量如何随时间和频率演变，揭示了地球地壳深处断裂过程的细节。

从观察到干预：构建一个变化的世界

理解非平稳性不仅仅是关于被动观察；它关乎于构建能够在动态世界中运作和适应的系统。

也许最引人注目的例子来自对清洁聚变能的探索。在托卡马克（一种甜甜圈形状的磁约束装置）内部，等离子体被加热到比太阳核心还高的温度。但这种等离子体是极其不稳定的。有时，它会发展出闪烁的磁涨落——磁流体动力学 (MHD) 活动的模态——这些模态可以迅速增长并引发“破裂 (disruption)”，这是一种熄灭反应并可能损坏机器的灾难性事件。科学家发现，这些破裂之前常常有微弱的、瞬态的前兆信号，其频率通常会“啁啾 (chirping)”。使用小波分析持续监测磁场数据，使他们能够实时检测到这些转瞬即逝的警报信号，为采取纠正措施、防止破裂提供了关键的几秒钟。这是在构建一个新世界前沿的信号分析。

在更熟悉的尺度上，考虑你的降噪耳机。它们通过一个参考麦克风监听外部世界，并迅速生成一个“反噪声”信号，与不想要的声波产生相消干涉。但如果噪声是非平稳的——一辆车驶过，一段对话开始——怎么办？噪声的特性在变化。耳机必须适应。这是自适应滤波 (adaptive filtering) 的领域，其中像最小均方 (LMS) 这样的算法被用来不断调整滤波器的参数。该算法的目标是在一个不断变化的景观中追踪一个“漂移的最优解”。噪声的非平稳性决定了系统能够多好、多快地收敛，从而在追踪速度和稳定性之间创造了一种微妙的平衡。

有时，挑战不是追踪一个变化的信号，而是分离多个信号的混合体。想象一下，试图从被受试者咬紧牙关产生的强烈肌肉伪迹污染的 EEG 数据中分离出一个微弱的大脑信号。像独立分量分析 (ICA) 这样的标准工具可能会彻底失败。它假设潜在源具有静态、不变的统计特性。但肌肉伪迹是剧烈非平稳的——它要么是开，要么是关。由批处理 ICA 算法找到的单一、静态的“解混”矩阵是一个糟糕的折衷，无法干净地分离源。解决方案是使用更智能的工具，这些工具拥抱非平稳性。自适应 ICA (Adaptive ICA) 算法可以动态更新其解混矩阵。其他方法，例如基于不同时间块协方差矩阵联合对角化的方法，巧妙地将非平稳性从问题转化为解决方案，利用源的功率随时间变化的不同方式作为将它们分离开来的关键。

知识的基石：我们如何避免自欺欺人？

我们已经看到，我们强大的新眼镜如何能揭示我们周围隐藏的动态。但这种力量带来了一项深远的责任。当我们在非平稳信号的混乱中看到一个模式时，我们如何说服自己——以及科学界——它是真实的，而不是由信号自身复杂生命或我们分析的怪癖所创造的幻觉？

这是所有应用中最深层的应用：应用于知识本身的完整性。假设我们使用小波相干性发现两个大脑区域似乎在特定时间和频率上“同步”。这是否意味着一个真实的功能连接？或者这种表面的同步性可能只是偶然产生的，仅仅因为两个区域恰好在同一时间都有独立的活动爆发？

要回答这个问题，我们必须针对一个精心构建的原假设进行统计检验。一个天真的方法，比如简单地打乱一个信号中的时间点，会破坏其固有的时间结构，并创造一个完全不现实的虚假世界。这样的检验会对任何结构都变得敏感，而不仅仅是我们关心的连接，从而导致大量的假阳性。

稳健的方法是生成替代数据 (surrogate data)。我们必须创建新的、“假的”时间序列，它们保留每个单独信号确切的非平稳特性——它们漂移的均值、时变的功率、自相关性——同时明确地、外科手术般地破坏我们想要测试的那一件事：它们之间的耦合。对于小波相干性，这可能涉及将两个信号的小波系数之间的相对相位随机化。通过创建这些替代数据集的整个系综，我们可以建立一个经验零分布，并提问：“在一个这些信号拥有各自丰富生命但根本不相连的世界里，我们有多大几率会仅凭偶然看到如此强的相干性？”。

这是最后、关键的一步。它将我们美丽的时频图像从仅仅的观察转变为经过统计验证的证据。正是这种纪律确保了在我们热情探索动态、非平稳宇宙的过程中，我们仍然是诚实的科学家。