try ai
科普
编辑
分享
反馈
  • 非平稳性

非平稳性

SciencePedia玻尔百科
核心要点
  • 非平稳性描述了基本统计属性(如均值和方差)随时间变化的过程。
  • 像傅里叶变换这样的标准分析工具不适用于非平稳数据,因为它们对信息进行时间上的平均,从而掩盖了关键的动态变化。
  • 为了正确分析和解释非平稳信号,人们开发了差分、小波分析和希尔伯特-黄变换等专门技术。
  • 在工程学、神经科学和演化生物学等不同学科中,认识到非平稳性至关重要,以避免建立有缺陷的模型和得出错误的结论。

引言

在科学领域,我们许多最强大的分析工具都建立在一个假设之上:我们研究的系统虽然是随机的,但遵循固定不变的规则——这一特性被称为平稳性。然而,从经济市场到生物演化和气候模式,现实世界很少如此稳定。这种根本性的不匹配造成了一个关键的知识鸿沟:将平稳性假设应用于非平稳系统,可能导致严重误导或完全错误的结论。本文将直面这一挑战,作为理解非平稳性——即系统本身的规则随时间变化的状——的指南。

在接下来的章节中,我们将首先探讨非平稳性的“原理与机制”,识别其统计特征,并理解为何像傅里叶变换这样的基础方法会失效。随后,“应用与跨学科联系”一节将展示,在广阔的科学领域中,认识并适应非平稳性对于精确的分析、预测和控制是何等重要。

原理与机制

想象一下,你在一家赌场,看着朋友玩骰子游戏。你注意到他们掷出了一个六。然后又是一个六。接着又是一个。你最初可能会认为这只是一时好运。但如果这种模式持续下去,你可能开始怀疑有些不对劲。也许骰子被动了手脚?或者,更微妙的是,骰子不仅被动了手脚,其偏向性还在每次投掷中发生变化?起初,它偏向于六,然后逐渐转向偏向于一。在科学和工程学中,我们用一个术语来描述具有恒定、不变规则的过程:​​平稳性​​。一个公正的骰子是一个平稳过程;任何结果的概率都是永久固定的。而那个偏向性随时间变化的骰子则代表了一个​​非平稳​​过程。游戏规则在进行中发生了改变。

这种区别不仅仅是哲学上的好奇;它是分析任何随时间演化系统的最基本和最实用的概念之一。从经济学到物理学,我们许多最强大的数学工具都建立在这样一个假设之上:虽然结果可能是随机的,但其底层的概率和性质是稳定的。当这个假设被打破时,我们的工具可能会以惊人且具有误导性的方式失效。要真正理解世界,我们必须首先学会识别规则何时在发生变化。

变化世界的信号

那么,我们期望保持不变的这些“规则”究竟是什么?在时间序列分析的语境中,我们通常关注几个关键的统计属性。如果一个过程的基本特征与其观测时间无关,那么它就被认为是​​弱平稳​​的。这些特征是:

  1. ​​恒定的均值:​​ 过程的平均值不会向上或向下漂移。一个国家过去50年的国内生产总值(GDP)时间序列,由于其持续的上升趋势,是均值非恒定的一个典型例子。
  2. ​​恒定的方差:​​ 围绕平均值的波动或“离散”程度保持一致。一个经历了十年平稳期后又经历了十年剧烈波动的股票市场,其方差是时变的。
  3. ​​时不变的自协方差:​​ 这一点更为微妙,但却是问题的核心。它意味着过程在某个时间点的值与其在一段时间延迟 τ\tauτ 之后的值之间的关系,仅取决于延迟 τ\tauτ,而与你所处的时间点无关。

一个违反了以上任何一个条件的过程就是非平稳的。考虑一个由电阻和电容组成的简单电子电路。如果元件是标准的,电路对今天一个电压脉冲的响应将与它对明天同样脉冲的响应完全相同。这是一个​​时不变​​系统。但如果我们用一个光敏电阻替换那个电阻,并将电路置于闪光灯下呢?此时电阻随时间变化,R(t)R(t)R(t)。电路对输入电压的响应现在严重依赖于电压施加的时间——是在高阻值时刻还是低阻值时刻。系统的基本参数在变化,这使得系统成为​​时变​​的。系统参数的这种时变性是其产生信号非平稳性的一个深层原因。

即使是常用来模拟股票价格的简单随机游走,也是非平稳过程的一个完美例子。其方程为 Yt=Yt−1+εtY_t = Y_{t-1} + \varepsilon_tYt​=Yt−1​+εt​,其中 εt\varepsilon_tεt​ 是一个随机步长。虽然步长是平稳的(它们具有零均值和恒定方差),但位置 YtY_tYt​ 却不是。它的方差随时间线性增长,Var(Yt)=tσ2Var(Y_t) = t \sigma^2Var(Yt​)=tσ2。随机游走持续的时间越长,它就可能偏离得越远。事实上,它是自回归(AR)过程的一个特例,其中决定其稳定性的系数恰好处于使平稳性条件失效的临界值上。

为何标准工具会失效:傅里叶变换的盲点

你可能会问:“那又怎样?为什么这个属性如此重要?”它之所以重要,是因为我们用来洞察信号核心的最常用工具——​​傅里叶变换​​——在面对非平稳性时存在一个致命的盲点。

傅里叶变换就像是把整部交响乐,提炼成一张清单,上面列出了从最低的C音到最高的升F音所有演奏过的音符以及它们的音量。这是一个极其强大的总结。但请注意其中缺少了什么:旋律、节奏、和声。它告诉你信号中存在哪些频率,但完全没有关于它们何时出现的信息。它通过在信号的整个持续时间内进行平均来实现这一点。

对于一个平稳信号,比如长笛稳定吹奏的音调,这种方法效果很好。频率是恒定的,所以在时间上平均不会改变任何东西。但是现在考虑一个“啁啾”信号,就像音高持续上升的警报声。假设它在10秒内从100赫兹扫描到500赫兹。傅里叶变换会正确地告诉我们,100赫兹到500赫兹之间的频率都曾出现。但它无法告诉我们信号是从100赫兹开始到500赫兹结束。就傅里叶变换而言,这个信号也可能是一个从500赫兹下降到100赫兹的警报声,甚至可能是所有这些频率同时发出的刺耳和弦。

时间结构——“音高上升”的本质——丢失了。这种时间信息实际上并非完全丢失,而是隐藏在傅里叶变换复数输出的相位中。正是不同频率间相位的特定、非随机排列,共同在时间上创造了频率扫描的效果。当我们执行像代理数据检验这样的常用程序时,我们可能会将这些相位随机化,以创建信号的“打乱”版本。这种随机化行为破坏了时间结构,将非平稳的啁啾信号变成了平稳的噪声信号。一个旨在发现非线性的检验方法可能会看到这种巨大的结构差异,并错误地断言“非线性动力学!”,而罪魁祸首仅仅是非平稳性。

这种失败与另一个关键概念有着直接的对应关系:​​遍历性​​。一个遍历过程是指,通过观测单个、非常长的实现,就足以了解其所有的统计特性(其真实的均值、方差等)。这是一个极其有用的性质,因为它意味着我们可以仅从一个样本中学习到所有可能结果的“系综”信息。然而,一个过程必须是平稳的才能是遍历的。如果规则在变化,那么从单个长记录中获取的时间平均值将会把来自不同状态的信息混合在一起,产生一个无意义的数字,它不代表任何一个状态的平均值。如果我们取一个遍历的随机信号 X(t)X(t)X(t),并将其乘以一个时变增益 g(t)g(t)g(t),所得到的过程 Y(t)=g(t)X(t)Y(t) = g(t)X(t)Y(t)=g(t)X(t) 就变得非平稳,遍历性的承诺也随之消失。

驾驭混乱:与非平稳性共存

这么看来,世界似乎太过复杂,其规则总是处于变化之中,以至于我们简洁的数学模型无法适用。但这正是科学真正的美妙与智慧所在。我们没有放弃,而是发展出驯服、甚至拥抱非平稳性的方法。

其中一个最强大的思想是,不在数量本身中寻找平稳性,而是在其变化中寻找。回想一下我们用于描述股票对数价格的非平稳随机游走模型,Yt=μ+Yt−1+ZtY_t = \mu + Y_{t-1} + Z_tYt​=μ+Yt−1​+Zt​。过程 YtY_tYt​ 会漂移和游走。但如果我们观察每日对数回报率,Rt=Yt−Yt−1R_t = Y_t - Y_{t-1}Rt​=Yt​−Yt−1​,我们会发现一些非凡之处。方程变得很简单,Rt=μ+ZtR_t = \mu + Z_tRt​=μ+Zt​。这个新的过程,即每日变化,具有恒定的均值(μ\muμ)和恒定的方差(σ2\sigma^2σ2)。它是平稳的!通过取差分,我们剥离了非平稳性,揭示了其下隐藏的一个稳定、可预测的过程。这项技术被称为​​差分​​,是现代时间序列分析的基石。

另一种策略是调整我们的工具。如果全局傅里叶变换对啁啾信号失效,因为它在所有时间上取平均,那么解决方案很简单:不要在所有时间上取平均!相反,我们可以使用一个“滑动窗口”来一次分析信号的一小部分。这就是​​短时傅里叶变换(STFT)​​和​​小波分析​​背后的思想。这就像不是将交响乐作为一个整体来分析,而是一次分析一个乐谱小节,使我们能够构建一个图表,显示每个时刻存在哪些频率,从而保留了旋律和节奏。

理解非平稳性也起到了一个至关重要的警示作用。来自混沌理论的宏大方法,例如使用​​Takens定理​​从单个时间序列重建一个隐藏的低维吸引子,是建立在一个基本假设之上的:即系统的动力学是固定的,并且轨迹会以某种形式自我重复。如果我们天真地将这种方法应用于像GDP这样具有长期增长趋势的非平稳序列,算法将会失败。重建出的“吸引子”将只是一条长长的、缓慢弯曲且永不闭合的路径,这是趋势造成的假象,而不是任何潜在确定性混沌的反映。必须首先对数据进行去趋势处理,这是一个剥离非平稳性的过程,然后才能寻找更深层次的结构。

这个原则是真正普遍的。一位研究基因演化的分子生物学家可能会使用一个模型,该模型假设核苷酸替换的过程是平稳的——即碱基A、C、G和T的背景频率是恒定的。但如果存在一个定向的演化压力,例如,温泉中的细菌为了热稳定性而增加其GC含量,那么这个假设就被违反了。这个过程是非平稳的。替换的净流向不为零,打破了支撑该模型的细致平衡条件。如果不加以考虑,这可能导致对演化树的错误重建。

从经济系统的波动到警报声的音符,从电子电路的特性到生命密码本身,一个固定规则的世界与一个变化规则的世界之间的区别是至关重要的。认识到非平稳性是迈向更深刻、更诚实的理解的第一步。它迫使我们变得更聪明,去调整我们的工具,并去认识到,有时最有趣的故事不在于系统的状态,而在于它如何变化。

应用与跨学科联系

现在我们已经探讨了非平稳性的原理,让我们踏上一段旅程,看看这个思想将我们引向何方。平稳系统的那个舒适、可预测的世界——游戏规则永不改变——是一个非常有用的虚构。它让我们能够建立强大的理论和简单的模型。但如果我们仔细观察周围的世界,就会发现这个虚构逐渐消融。几乎万物都处于变化之中。一座金属桥梁在日晒和应力下老化,气候在几十年间变化,一个活细胞以短暂的爆发活动来响应信号。

认识到这种非平稳性并非麻烦,不是一个可以忽略的复杂问题。它是一扇通往更深刻、更诚实理解自然的大门。当我们旧有的、舒适的稳定性假设失效时,我们被迫变得更聪明。我们发明新的工具,提出更有洞察力的问题,并在此过程中,发现在贯穿所有科学领域的变化模式中,存在着一种非凡的统一性。

物理系统中变化的信号特征

让我们从我们能触摸和感受到的事物开始。想象一口完美铸造的青铜钟。如果你今天敲击它,它会发出清脆、洪亮的声音。如果你明天以完全相同的方式敲击它,你期望会听到完全相同的声音。这口钟的响应是*时间平移不变的*——这是平稳系统的一个标志。但并非所有材料都表现得如此可预测。

考虑一块仍在固化的混凝土,或一个刚刚被快速冷却的聚合物。这些材料正在“老化”。它们的内部微观结构仍在演化,这是一场分子缓慢沉降到位的舞蹈。如果你今天对这种材料施加一个小应变,你会测量到一种应力响应。如果你明天施加完全相同的应变,响应将会不同——也许会更硬一些。材料的“音调”改变了。这个简单的观察带来了深远的影响。描述这类材料的标准数学方法,即假设响应只取决于施加力后的流逝时间的简单卷积,在此失效。我们被迫采用一个更通用的框架,一个带有“双时间”核函数 G(t,τ)G(t, \tau)G(t,τ) 的遗传积分,这个核函数既知道施加力的时间 τ\tauτ,也知道我们观察它的时间 ttt。数学必须尊重材料本身有记忆和历史的物理现实。

这种系统在观测期间发生变化的想法也出现在许多其他地方。在化学中,工程师使用一种称为电化学阻抗谱(EIS)的技术来研究像腐蚀这样的过程。这就像为浸泡在溶液中的金属表面拍摄一张电学“肖像”。为了检查这张“肖像”是否有效,他们使用一种名为Kramers-Kronig检验的数学工具,该工具仅在系统是线性和平稳的情况下才有效。通常,对于像在盐水中腐蚀的镁合金这样的材料,这个检验会戏剧性地失败。为什么?因为电极表面在拍摄肖像时并没有保持静止!在测量进行的同时,金属正在活跃地溶解,一层多孔、疏松的锈层正在形成和分解。系统的电学特性——其电阻和电容——时刻都在变化。平稳性检验的失败并非实验的失败;它是大自然发出的直接信号,告诉我们系统充满了动态的、非平稳的变化。

这个主题延伸到大型工程结构。一座桥梁或一个飞机机翼的振动方式取决于其刚度、质量和内部阻尼。我们或许可以将其建模为一个具有恒定属性的简单振荡器。但如果这些属性本身在变化,可能是由于温度波动或材料疲劳的缓慢累积呢?系统就变得非平稳了。它的“固有频率”不再是一个常数,而是一个时变量。传统的工具,如傅里叶变换,将信号分解为永恒不变的正弦波之和,可能会产生误导。为了跟踪这种结构的健康状况,我们需要更复杂的工具,比如小波分析,它可以捕捉“瞬时频率”和“瞬时阻尼”随时间演变的过程。我们的问题从“频率是多少?”转变为“频率是如何变化的?”。

解码自然的非平稳信号

这种分析上的挑战——当产生信号的规则在变化时,如何理解信号——是现代科学中最深刻的挑战之一。想象一下,你试图理解一段对话,而对话所用语言中词语的含义在你听的过程中会慢慢改变。这就是我们在处理许多自然信号时面临的问题。

傅里叶变换是经典信号处理的基石,它为我们提供了信号的“频谱”——其构成频率的配方。它隐含地假设这些频率是永恒的。但鸟儿的啁啾、海浪的拍岸,或思考中的大脑的电活动呢?这些信号是瞬态的、不断变化的。试图用一个单一的、静态的谱来描述它们,就像试图用一套完美的、永恒的音叉来捕捉瀑布的精髓。

为了应对这个问题,科学家们首先开发了像短时傅里叶变换(STFT)和小波分析这样的方法。这些方法就像通过一个移动的窗口观察世界,假设信号的小片段是“局部平稳的”来分析。这是一个巨大的进步,但我们仍然需要事先选择窗口的大小或“小波”的形状。我们是在将自己的结构强加于数据之上。

一种更激进的方法,称为希尔伯特-黄变换(HHT),试图让信号自己说话。它不使用像正弦波或小波这样的预定义函数,而是自适应地将信号分解为一组“本征模态函数”(IMFs)——这些振荡直接源自信号自身的局部结构。由于HHT没有对线性度或平稳性做出任何先验假设,它可以为频率和振幅在高度复杂信号(如来自湍流或地震事件的信号)中如何演变提供更清晰的图像。

即使我们坚持使用旧方法,一点小聪明也能大有裨益。Welch方法是一种标准的功率谱估计方法,它通过平均较小的、重叠的段的光谱来实现。但是,如果信号的音量或功率正在缓慢上升或下降怎么办?简单的平均会被最响亮的段所主导。一个优美而实用的解决方案是:在平均之前,我们可以用每个段的局部功率来对其进行归一化。通过这种方式,每个段对估计的谱形状(如果你愿意,可以称之为“音色”)的贡献是相等的,而关于变化的功率(“响度”)的信息则被分开处理。这是区分不同类型变化的一种精湛技巧。

分析工具的选择在神经科学等领域是生死攸关的问题。我们神经元中微小的离子通道是思想的基本晶体管。当一个神经元放电时,这些通道以复杂的舞蹈方式打开和关闭。一些分析依赖于“平稳噪声分析”,它假设通道的活动处于稳态,允许科学家通过观察微小电流波动的频谱来研究其动力学。但许多通道,比如那些对一阵神经递质作出反应的通道,会产生一个短暂的、瞬态的电流,该电流先上升后下降——这是一个典型的非平稳过程。对于这些,需要一个不同的工具:非平稳波动分析(NSFA),它分析电流的方差如何随其均值随时间演变而变化。物理学家必须首先问:“我的系统是平稳的还是非平稳的?”答案决定了整个实验和分析策略。

拥抱不确定性:在变化世界中的预测与控制

到目前为止,我们已经看到非平稳性如何对测量和分析构成挑战。但它也位于一个更宏大追求的核心:在变化的世界中预测和控制系统。

想象一下,试图用雷达系统跟踪一个物体。卡尔曼滤波器是完成这项任务的黄金标准算法。它接收带噪声的测量值,并产生对物体真实状态(例如,位置和速度)的最优估计,以及对其自身不确定性的度量——误差协方差矩阵 PkP_kPk​。在一个简单的、平稳的世界里,这种不确定性可能会随着时间的推移收缩到一个恒定的稳态值。但是,如果我们跟踪的物体其动力学是非平稳的呢,例如,一架在“悬停模式”和“冲刺模式”之间随机切换的无人机?随着无人机行为的切换,卡尔曼滤波器必须适应。不仅状态估计更难确定,而且协方差矩阵 PkP_kPk​ 本身也永远不会稳定下来。它将持续振荡,其自身的动力学与它试图跟踪的系统的非平稳动力学锁定在一起,翩翩起舞。我们的不确定性本身也变得非平稳。

这个原则从预测延伸到控制。如何为一个其自身参数——A(t)A(t)A(t)和B(t)B(t)B(t)——随时间变化,并且还受到随机噪声冲击的系统设计一个最优控制器?你不能使用固定的策略。从Hamilton-Jacobi-Bellman方程导出的解决方案是,最优控制律本身必须是非平稳的。它采用反馈律的形式,但反馈增益矩阵 K(t)K(t)K(t) 随时间连续变化,由一个称为Riccati方程的时间倒推方程的解来规定。

值得注意的是,对于这类问题,加性随机噪声的存在并不改变最优反馈策略;这就是著名的“确定性等价原理”。无论海面是平静还是波涛汹涌,最优的驾驶方式都是相同的。然而,波涛汹涌确实会增加成本。随机的冲击为旅程的预期成本贡献了一个不可减少的部分,这个项在数学上被清晰地分离出来(价值函数中的 c(t)c(t)c(t))。在这里,我们看到了一个美丽的分离:系统动力学的非平稳性迫使控制策略是非平稳的,而来自随机噪声的非平稳性仅仅增加了一层不可避免的成本。

非平稳性在生命最宏大的尺度上

忽视非平稳性的后果,也许在生物科学领域最为深远,因为在生物科学中,变化是唯一的常态。

在演化生物学中,科学家通过比较非同义替换(dNd_NdN​,改变一个氨基酸)的速率和同义替换(dSd_SdS​,是沉默的)的速率来研究基因如何演化。比率 ω=dN/dS\omega = d_N/d_Sω=dN​/dS​ 是自然选择的一个关键指标。大于1的值通常被认为是正向选择或适应性演化的有力证据。然而,用于估计这个比率的模型通常依赖于一个平稳性假设:即DNA碱基(A、T、C、G)的背景概率在整个演化树上是恒定的。

但是,如果某个谱系在其碱基组成上经历了系统性的转变,例如,由于一个偏向于G和C碱基的突变过程?这个谱系将积累大量的、由突变偏向而非选择驱动的、朝向G和C的同义替换。一个期望这些变化少得多的平稳模型,将会严重低估该分支的真实 dSd_SdS​ 值。结果,比率 ω=dN/dS\omega = d_N/d_Sω=dN​/dS​ 可能会被人为地抬高到1以上,创造一个适应性演化的虚假信号。我们被愚弄了,在只有一个非平稳过程的地方看到了目的性。为了得到正确的故事,我们必须使用非平稳模型,允许突变的“规则”沿着演化树演化。

最后,让我们思考在我们这个全球变化的时代,保护和恢复所面临的挑战。“再野化”一个生态系统的想法通常涉及基于“历史基线”设定目标——即生态系统在过去某个时间点,在主要人类干扰之前的状态。但在一个非平稳气候的时代,这可能是一个被误导的目标。一个在1850年气候下可行的生态系统状态,在2050年的气候下可能根本无法维持。可行的生态状态集合本身就在变化。

因此,现代的、有科学依据的恢复方法必须放弃静态目标。我们不应追求一张固定的历史照片,而应追求一个动态的“参考条件”:即代表一个健康、有弹性的生态系统在今天和未来的环境条件下的状态和过程集合。这需要一个深刻的思维转变。它也要求我们积极对抗“基线漂移综合征”——那种让我们接受退化的现状为正常的代际遗忘。我们必须使用我们所拥有的一切工具——古生态学、历史记录和动态模型——来重建过去的丰富性,不是为了盲目地复制它,而是为了给我们为一个健康的、功能性的、且必然是动态的未来所怀有的雄心提供信息。

从一块金属上的锈迹到我们地球生态系统的命运,故事都是一样的。宇宙不是一张静态的照片;它是一部正在展开的叙事。假设平稳性就是只读了某一页就声称读懂了整本书。拥抱非平-稳性则是学会在故事被书写的同时阅读它,欣赏其复杂性之美,并在其不断变化的情节中找到我们自己的位置。