
从收音机里的静电噪音到股票市场的波动,随机过程在科学和工程领域无处不在。虽然一些过程的基本特性会随时间改变,但许多过程表现出一种统计上的一致性,使其可以被分析。核心的挑战在于如何用数学方式捕捉这种“不变特性”的概念,以建立有效的模型。本文将介绍广义平稳 (Wide-Sense Stationarity, WSS),这是一个用于分析此类随机信号的强大框架。
首先,我们将深入探讨 WSS 的原理与机制,定义其两个核心规则——恒定均值和时不变自相关——并探索关键的自相关函数的性质。然后,在应用与跨学科联系部分,我们将看到这个理论概念如何成为工程师和科学家的实用工具包,在众多领域实现系统辨识、信号滤波和高效计算。
想象一下,你正在调试一台老式模拟收音机。你将旋钮转到没有任何电台的位置,聆听静电噪音。这是一种随机、不可预测的嘶嘶声。现在,假设你今天录制了一分钟的静电噪音,明天又录制了一分钟。如果你要分析这两段录音,你将无法分辨哪段是哪天的。当然,具体的噼啪声会有所不同,但其统计特性——平均响度、频率范围、噪声的“质感”——将是相同的。产生这种噪声的潜在物理过程不随时间变化。这就是平稳性的直观核心。
现在,将其与录制城市街道的声音进行对比。凌晨 3:00 的录音将以路灯的安静嗡嗡声和偶尔经过的汽车声为主。而下午 3:00 的录音则是引擎轰鸣、刺耳的喇叭声和人声嘈杂的混合。产生声音的潜在“机制”因一天中的时间而根本不同。这个过程是非平稳的。
从电子电路中的噪声到股票市场价格的波动,科学和工程中充满了随机过程。为了对它们进行建模和预测,我们需要一种精确的数学方法来捕捉这种“不变特性”的思想。这引导我们走向了广义平稳 (WSS) 这个强大的概念。
一个随机过程要被认为是广义平稳的,它必须遵守两条简单而深刻的规则。这些规则并不要求过程的所有方面在所有时间内都保持不变,而是聚焦于两个关键的统计特性:平均值和相关结构。
第一条法则是最直观的:过程的均值(或平均值)必须是恒定的。我们将其写作 ,其中 是一个不随时间 变化的常数。
为什么这如此重要?考虑一个存在缓慢线性漂移的传感器。我们可以将其输出建模为 ,其中 是一些零均值随机噪声, 是漂移率。该信号的期望值为 。均值随时间线性增长(或减少)!这显然不是平稳的。要使这个过程有任何可能是平稳的,确定性的趋势必须不存在;我们必须有 。
另一个绝佳的例子是 Poisson 过程,它计算随时间发生的随机事件,如放射性衰变或顾客到达商店。如果平均事件发生率为 ,到时间 为止的期望事件数为 。均值持续增加。该过程在累积事件,因此其平均状态内在地与其运行了多长时间相关。这也违反了平稳性的第一条法则。
第二条法则更为微妙,它触及了过程内部结构的核心。它涉及自相关函数,该函数衡量过程在某一时刻 的值与其在另一时刻 的值之间的关系。我们将其定义为 。
该法则规定,这种关系必须只取决于两点之间的*时间延迟* ,而不是它们在时间轴上的绝对位置。换句话说, 必须仅是 的函数。信号现在与一秒后的相关性,应该与信号在午夜和午夜过一秒后的相关性完全相同。
让我们考虑白噪声的经典例子,它是一系列随机值,在不同时刻之间不相关。对于一个均值为零的离散时间白噪声过程 ,其自相关为 。这里的 是 Kronecker delta,当延迟 时为 1,否则为 0。这告诉我们两件事:
这种结构 仅取决于延迟 ,而不取决于绝对时间 。白噪声的“无记忆”特性今天和昨天是一样的。它完美地满足了第二条法则。
这两条法则——恒定均值和时不变自相关——是一个过程成为广义平稳的充分必要条件。
自相关函数 就像一个平稳过程的指纹。它告诉我们其内部的节奏和记忆。一个急剧达到峰值然后迅速降至零的自相关函数,属于一个能迅速忘记其过去的过程。一个宽阔、缓慢衰减的自相关函数,则属于一个具有长时记忆的过程,其当前值受到其遥远过去的强烈影响。
由于其重要性,自相关函数不能是任意的函数。其数学形式受到基本原理的约束。
对于实值过程,自相关函数必须是一个偶函数:。这只是常识。今天和明天之间的统计关系必须与明天和今天之间的关系相同。从 到 的延迟与从 到 的延迟是相同的“距离”。对于在通信等领域至关重要的复值信号,这可以推广为一个优美的性质,称为共轭对称性:。
自相关函数必须在延迟为零时取其最大值: 对所有 成立。为什么? 是信号的平均功率。这个不等式陈述了一个深刻的真理:一个信号与另一个时间点的相关性永远不可能超过它与自身的相关性。如果提出相反的观点,就如同想象一个函数 ,它在某些 处比在 处更大。这样的过程在物理上是不可能存在的;这就好比说你的回声比你最初的喊声更响亮。
自相关序列最微妙但最强大的性质是它必须是非负定的。这听起来很抽象,但其物理意义很简单:信号的功率永远不能为负。如果我们对任何 WSS 过程进行滤波,输出信号的功率必须大于或等于零。这个物理要求转化为对自相关函数形状的严格数学约束。
这个性质为通向频域提供了一座令人惊叹的桥梁。Bochner 定理告诉我们,一个函数是有效的自相关函数,当且仅当其傅里叶变换处处非负。这个变换正是功率谱密度 (PSD),它描述了信号的功率如何在不同频率上分布。由于给定频率的功率不能为负,PSD 必须是非负的,这反过来又迫使自相关函数必须是非负定的。这是信号处理中概念统一的一个优美例子——时域中的一个基本性质与频域中一个同样基本的性质密不可分。
到目前为止,我们只关心了前两个统计矩:均值和自相关。这就是为什么它被称为广义或弱平稳。但如果我们要求更多呢?
如果一个过程的整个统计特性——任意一组时间点的完全联合概率分布——对于时间平移是不变的,那么这个过程是严平稳 (SSS) 的。这意味着所有可能的统计量度——方差、偏度、峰度以及所有其他高阶矩——都必须不随时间变化。SSS 是一个更强、更具限制性的条件。
弱平稳是否意味着强平稳?一般而言,不是!考虑一个按特殊规则构建的过程:在偶数时间步,我们从 Laplace 分布中抽取一个随机数。在奇数时间步,我们从 Gaussian(正态)分布中抽取。我们仔细设置参数,使得两种分布的均值都为零,并且方差相同。
这个过程是 WSS 吗?让我们检查一下规则。均值始终为零(恒定)。方差也是恒定的。由于样本是独立的,自相关仅在延迟为零时非零,此时它等于方差。所以,是的,它是 WSS 的!
但它是 SSS 吗?绝对不是。概率分布的基本形状在每一步都在变化,在 Laplace 分布的尖峰和 Gaussian 分布熟悉的钟形曲线之间交替。偶数时间和奇数时间的统计“机制”是不同的。这是一个 WSS 但非 SSS 过程的完美例子。
这个规则有一个至关重要的例外:Gaussian 过程。对于一个 Gaussian 过程,均值和自相关函数完全定义了其所有的概率分布。因此,如果一个 Gaussian 过程是 WSS 的(意味着其均值和自相关是时不变的),那么它必然也是 SSS 的。对于这类特殊且普遍存在的过程,弱平稳和强平稳形式变得等价。
一个过程可以是 SSS 但非 WSS 吗?是的!这种令人惊讶的情况突显了我们对 WSS 定义中的一个隐藏假设。考虑一个过程,其中每个值都独立地从标准 Cauchy 分布中抽取。由于这些值是独立同分布 (i.i.d.) 的,根据定义,所有的联合概率分布都是时不变的。该过程是 SSS 的。
然而,Cauchy 分布是一种奇怪的分布。它的尾部非常重,以至于其均值和方差是未定义的——它们是无穷大!由于 WSS 是根据有限的、恒定的均值和有限的自相关来定义的,这个过程不可能是 WSS 的。这提醒我们,广义平稳是具有良好定义的一阶和二阶矩的过程的属性。
世界很少是完全平稳的。回想一下城市的声音。噪声模式不是平稳的,但它是周期性的。周一上午 9 点的噪声统计特性很可能与周二上午 9 点的非常相似。这引导我们走向循环平稳性的概念。
一个广义循环平稳 (WSCS) 过程,其均值和自相关不是恒定的,而是随时间周期性变化的。许多人造信号都表现出这种特性。例如,在数字通信中,数据通常被调制到正弦载波上。这可以建模为 ,其中 是代表数据的 WSS 过程, 是像余弦这样的周期函数。得到的过程 不再是 WSS 的,因为周期性的载波在信号的统计特性上留下了时变的结构。其自相关函数变得与载波具有相同的周期。
广义平稳是一个基础概念,一个完美的理想化,使我们能够构建强大的信号分析工具。但它也是一段旅程的第一步。通过理解它的规则、它的局限性,以及它与像循环平稳性这样的其他统计结构形式的关系,我们获得了一个更深刻、更通用的框架,来理解我们周围这个随机、动态的世界。
我们花了一些时间来熟悉广义平稳 (WSS) 过程的机制——这种统计稳定性的概念,即随机信号的基本属性,其均值和相关性,在我们沿着时间轴滑动观察窗口时不会改变。你可能会认为这只是一个巧妙但纯粹的数学抽象。事实远非如此。这个强大而单一的概念不仅仅是一种便利;它正是我们能够分析、操控和预测科学与工程领域中各种惊人现象的关键。它是连接我们观察到的混乱、波动的世界与我们建立的优雅、量化模型之间的桥梁。现在,让我们踏上征途,看看这座桥梁通向何方。
当工程师面对一个带噪声的信号——也许是灵敏放大器中微弱的热噪声嘶嘶声,或是通信线路中的随机抖动——他需要对其进行表征。它有什么特性?它有多强?它的本质是什么?WSS 模型提供了直接而实用的答案。我们已经看到,自相关函数 是 WSS 描述的核心,它不仅仅是一个抽象的公式,而是一张藏宝图。
例如,如果你让时间延迟 变得非常大,对于大多数有趣的过程,时间 的信号和时间 的信号最终应该会“忘记”彼此。在这个极限下,它们的期望乘积就变成了它们各自期望值的乘积。对于一个 WSS 过程,这告诉我们一个深刻的道理:自相关函数在大延迟下趋于的稳定值,恰好是信号均值的平方,即信号的直流分量。 中衰减到零的部分是自协方差,它描述了信号的波动。因此,通过观察 的形状,工程师可以立即将信号的稳定直流偏置与其波动的交流部分分离开来。
那么噪声的“强度”如何呢?我们通常用平均功率的概念来量化。这种随机波动携带多少能量?在这里,自相关函数再次给出了一个极其简单的答案。WSS 过程的平均功率就是其自相关函数在零延迟处的值,。这完全合乎情理,因为 是信号与自身相乘的期望值,。这个单一的数字,可以轻易地从自相关函数中读出,告诉电气工程师其电路必须应对的平均功率,这是一个直接且不可或缺的信息。
时域的相关性观点很直观,但频域往往能提供更深刻的见解。这正是著名的 Wiener-Khinchin 定理发挥作用的地方,它就像一个神奇的棱镜。它告诉我们,功率谱密度 (PSD) 是自相关函数的傅里叶变换。PSD 揭示了信号的功率是如何在不同频率之间分布的。一个波动缓慢的信号,其功率将集中在低频区域;而一个变化迅速的信号,则将在高频区域拥有更多功率。
例如,一个具有“衰减记忆”过程的常见模型——其中点与点之间的相关性随其间隔呈指数衰减,——在频域中会变换成一种特定的、类似钟形的形状,称为 Lorentzian 谱。这提供了一本字典,用于在信号随机性的时间“风格”与其频率“音色”之间进行转换。而且,美妙的是,这两种视角是一致的:我们从 得到的总功率,也可以通过将所有频率上的功率相加得到——也就是,通过对 PSD 在其整个定义域上积分。对于任何实值信号,PSD 是一个偶函数(围绕 对称),实验室中使用的频谱分析仪每天都依赖这个事实,当它们只显示正频率时。
当一个 WSS 过程不仅被观察,还被施加作用时,会发生什么?如果它通过一个会修改它的系统呢?WSS 属性的稳健性是其最有用的特性之一。考虑一个最基本的操作:微分。假设你有一个代表激光光斑位置的带噪声信号,你想了解它的速度。速度就是位置的时间导数。如果位置抖动是一个 WSS 过程,那么速度抖动也是 WSS 吗?
答案是肯定的。WSS 过程的导数也是 WSS。其均值变为零(因为常数均值的导数为零),其新的自相关函数可以通过对原始自相关函数求负二次导数得到。频域的观点更加引人注目。时间上的微分对应于将 PSD 乘以 。这意味着速度信号的功率谱是 。这个简单的规则告诉我们一个关键点:微分过程会极大地放大高频噪声。这是控制系统中的一个基本原则——如果你试图根据系统的速度来控制它,你必须警惕高频传感器噪声,这些噪声在你的速度估计中会比在位置测量中显著得多。
调制是通信的基石,它与 WSS 过程的概念密切相关。将一个 WSS 信号乘以一个正弦载波以便通过无线电传输,得到的信号通常是循环平稳的,它的频谱是原始频谱平移到载波频率。而另一种简单的调制,如将一个零均值离散时间 WSS 信号乘以 ,这对应于将其频谱平移采样频率的一半,则保留了 WSS 属性。WSS 框架为我们提供了数学上的信心,去分析和预测随机信号在通过构成我们全球通信系统的滤波器、调制器和信道时的行为。
此时,一个严谨的思考者可能会提出一个深刻的反对意见。WSS 过程是由其系综属性定义的——这些平均值是在无穷多个平行宇宙中取平均得到的,每个宇宙都有其自身的随机过程实现。但在现实世界中,我们只有一个宇宙。我们在有限的时间内测量一个信号。我们如何才能将理论上的系综平均与我们从数据中计算出的实际时间平均联系起来呢?
这座桥梁是一个叫做遍历性的概念。一个遍历过程是指,对于足够长的单个实现,其时间平均值会收敛到理论上的系综平均值。对于遍历的 WSS 过程,梦想成真:我们所见的一个世界的统计数据,告诉了我们所有可能世界的统计数据。
这种基于遍历性假设的信念飞跃,是系统辨识的基础。想象你有一个“黑箱”——一个未知的电子电路、一个化学过程或一个经济系统——而你想了解其内部运作。一个强大的技术是注入一个已知的 WSS 输入信号并测量输出。如果选择的输入是“白噪声”(一个 WSS 过程,其在不同时刻完全不相关,具有平坦的功率谱),奇妙的事情发生了。你测量的输出与你注入的输入之间的互相关,结果是系统自身冲激响应的直接副本——即其基本的“个性”。通过假设遍历性,我们可以从我们的单个实验中估计这个互相关,从而窥探黑箱的内部。WSS 理论,通过遍历性,让我们能将随机噪声变成一个强大的探针,用以发现世界的结构。
WSS 的馈赠不止于此。它们深入到计算领域。当我们分析一个 WSS 过程的连续 个样本块时,得到的 协方差矩阵具有一种特殊而优美的结构。因为样本 和样本 之间的相关性仅取决于延迟 ,所以矩阵的任何对角线上的所有元素都是相同的。这就是 Toeplitz 矩阵的定义。这不仅仅是美学上的奇特;它是一个计算上的奇迹。用于求解线性方程组或矩阵求逆的标准算法,是现代谱估计和自适应滤波的主力,其计算成本随矩阵大小的立方增长,即 。对于大的 来说,这慢得令人望而却步。但对于一个 Toeplitz 矩阵,像 Levinson-Durbin 递推这样的杰出算法可以在 时间内解决同样的问题。广义平稳这个抽象属性,为我们提供了一个具体的结构性钥匙,将一个计算上的“难题”简化为一个“可解”的问题,使得许多先进的信号处理技术成为可能。
我们的旅程以一个近乎哲学的问题结束:一个随机过程的未来能否从其过去预测?WSS 过程理论,通过 Paley-Wiener 定理,给出了一个惊人的答案。该定理提供了一个基于信号 PSD 对数的积分检验。如果该积分有限,则过程包含一个不可预测的、“新息”分量。如果积分发散到无穷大,则该过程原则上可以从其过去完美预测。
现在考虑一个我们经常在模型中使用的信号:一个严格带限的信号,其 PSD 在某个有限频率范围之外绝对为零。Paley-Wiener 判据对这样的信号说了什么?由于 PSD 在一个无限的频率范围上为零,其对数在该范围上为负无穷。积分检验明确地发散。结论是不可避免的:任何严格带限的 WSS 过程在理论上都是确定性的。如果你知道它的全部过去,你就能以完美的准确性预测它的全部未来。
想一想这意味着什么。它表明我们使用的方便的“带限”模型是一种虚构。任何包含任何真正意外元素的真实物理过程,其频谱都不可能被完美地、外科手术般地切断。必须总是在所有频率上都存在一些无穷小的、残余的能量,未来才能保持未知。广义平稳的假设,诞生于工程实用主义,却引导我们对信息、因果关系和随机性的本质产生了深刻的洞察。它告诉我们,要让宇宙拥有一个真正开放的未来,它的歌声必须包含所有的音符。