宽平稳过程

玻尔百科

核心要点

如果一个随机过程的均值为常数，且其自相关仅取决于两点之间的时间延迟，那么该过程是宽平稳（WSS）的。
自相关函数提供了过程的“指纹”，揭示了其总功率、直流功率，并通过维纳-辛钦定理揭示了其频率内容。
将一个 WSS 过程通过一个线性时不变（LTI）滤波器会产生另一个 WSS 过程，这是工程中塑造随机信号的一项基本原则。
遍历性是一个关键假设，它使得我们可以从单个、有限的时间序列测量中估计出整个过程系综的统计特性。

引言

在从工程学到物理学的各个领域，我们不断遇到一些随机信号，但它们随时间表现出某种形式的统计规律性。稳定的背景嘶嘶声、电机的随机振动或金融市场的波动可能每时每刻都看起来不可预测，但它们的整体特征——平均水平和内部节律——通常保持一致。宽平稳（WSS）过程的概念为理解和处理此类信号提供了必要的数学框架。它通过定义一种“统计同一性”的实用形式来应对分析随机性的挑战，这种形式不过于严格，却足够强大以适用于广泛的应用。本文将 WSS 过程分解为其核心组成部分。首先，我们将探讨“原理与机制”，定义支配 WSS 过程的两条简单规则，并检验自相关函数中编码的丰富信息。随后，“应用与跨学科联系”一节将展示这些理论思想如何应用于现实世界，探讨当我们对 WSS 信号进行滤波、采样和测量时会发生什么，并引入连接抽象理论与实际数据的关键概念——遍历性。

原理与机制

想象一下，你正在收听一个调谐在电台之间的收音机发出的稳定嘶嘶声，或者正在观察广阔无垠的大海上的波浪。如果你今天录制一段十秒钟的嘶嘶声，明天再录制一段十秒钟的嘶嘶声，这两段录音在细节上会完全不同。然而，在统计意义上，它们给人的感觉是相同的。平均响度、存在的频率范围、声音的“质感”——这些特征都没有改变。这种统计上“同一性”的直观概念，就是我们所说的平稳性的核心。这是一个非常有用的概念，因为它允许我们分析过程的一小部分，并对其在任何其他时间的行为做出有力的预测。

在物理学和工程学中，我们通常不需要最严格形式的平稳性。我们可以稍微放宽条件，仍然能得到一个非常强大的工具。这就引出了宽平稳性 (WSS) 的概念，它建立在两条简单且符合常识的规则之上。如果一个随机过程的均值和自相关满足这些条件，那么它就是 WSS 过程。让我们逐一来看。

同一性的本质：定义平稳性

规则 1：均值必须是常数。

这是最直接的要求。信号的平均水平不能随时间上升或下降，它必须是稳定的。假设你有一个传感器，其读数由于发热等原因正在缓慢向上漂移。我们可以将其建模为信号 $X(t) = at + N(t)$ ，其中 $N(t)$ 代表随机噪声， $at$ 是确定性漂移。该信号在时间 $t$ 的平均值，或期望值，是 $E[X(t)] = at$ 。你可以立即看到，这个平均值随时间变化。该过程不是平稳的。只有当漂移率 $a$ 恰好为零时，该过程才有可能是平稳的。统计特性随绝对时间而改变的过程称为非平稳过程。

规则 2：自相关必须仅依赖于时间延迟。

这条规则更为微妙，也更为强大。让我们首先思考自相关的含义。自相关函数 $R_{XX}(t_1, t_2) = E[X(t_1) X(t_2)]$ ，衡量的是信号在两个不同时间点 $t_1$ 和 $t_2$ 上的值的统计关系。它回答的是：“如果信号在时间 $t_1$ 很高，那么它在时间 $t_2$ 也可能很高吗？”

对于一个 WSS 过程，这种关系不能取决于你观察的时间点，而只能取决于你观察的时间间隔。也就是说，下午 1:00 和 1:01 之间信号的相关性，应该与下午 5:00 和 5:01 之间信号的相关性相同。时间差 $\tau = t_2 - t_1$ 是唯一重要的因素。因此，对于一个 WSS 过程，我们可以将自相关简单地写成一个变量，即时间延迟 $\tau$ 的函数： $R_{XX}(\tau)$ 。

一个很好的例子是简单地延迟一个信号会发生什么。如果 $X(t)$ 是一个 WSS 过程，我们创建一个新的延迟过程 $Y(t) = X(t - t_0)$ ，那么 $Y(t)$ 的自相关是什么？一个快速的计算表明 $R_{YY}(\tau) = E[Y(t)Y(t+\tau)] = E[X(t-t_0)X(t+\tau-t_0)]$ 。如果我们仅仅改变时间参考，令 $u = t - t_0$ ，这便成为 $E[X(u)X(u+\tau)]$ ，也就是 $R_{XX}(\tau)$ 。自相关函数完全不受时间平移的影响。过程的内部“节律”与它何时开始无关。

平稳过程一览

有了这两条规则，我们就可以开始建立一个囊括各种过程的“画廊”，其中一些是 WSS 的，一些则不是。其多样性可能会让你感到惊讶。

随机常数： 你能想到的最简单的“随机”过程是什么？一个完全不改变的过程如何？设 $X(t) = C$ ，其中 $C$ 是在最开始时选择一次的随机变量。也许它是一次化学反应的最终温度，这个温度有一定的随机性，但之后就永远固定了。这个过程是 WSS 吗？其均值为 $E[X(t)] = E[C]$ ，是一个常数。其自相关为 $R_{XX}(t_1, t_2) = E[X(t_1)X(t_2)] = E[C^2]$ ，也是一个常数。由于这些值不依赖于时间，只要二阶矩 $E[C^2]$ 是有限的，这个过程就是 WSS 的。这可能看起来微不足道，但它是一个很好的健全性检查：一个过程不需要“摆动”才能成为 WSS 过程。
欺骗性的振荡器： 现在来看一个更令人兴奋的案例。考虑一个看起来像纯正弦波的过程： $X_n = A \cos(\omega n) + B \sin(\omega n)$ 。这里，时间演化是离散的 ( $n=0, 1, 2, ...$ )，随机性来自振幅 $A$ 和 $B$ 。假设 $A$ 和 $B$ 是不相关的随机变量，均值为零，方差同为 $\sigma^2$ 。这个过程的任何一次实现都是一个具有特定振幅和相位的完美正弦波。这看起来一点也不平稳！但请记住，平稳性是系综——所有可能结果的集合——的属性。均值为 $E[X_n] = E[A]\cos(\omega n) + E[B]\sin(\omega n) = 0$ ，是常数。自相关呢？经过一些涉及三角恒等式的代数运算后，我们得到了一个了不起的结果： $E[X_n X_m] = \sigma^2 \cos(\omega(n-m))$ 。它只取决于时间延迟 $n-m$ ！所以，这个过程是完美的 WSS 过程。这是一个深刻的教训：一个过程在任何单个实例中可能看起来高度结构化且随时间变化，但其底层的统计“规则”可以是完全平稳的。
物理学家的噪声模型： 在许多现实世界的实验中，涨落在短时间尺度上是相关的，但在长时间尺度上是不相关的。高斯过程是对此的一个绝佳模型，其中电压涨落 $V(t)$ 有一个恒定均值 $\mu_0$ （一个直流偏置）和一个像 $K(s, t) = \sigma^2 \exp\left(-\frac{(s-t)^2}{\ell^2}\right)$ 这样的协方差函数。因为均值是常数，且协方差只依赖于时间差 $s-t$ ，所以这个过程是 WSS 的。这个函数形状告诉我们，两点之间的相关性随着它们之间时间间隔的增加而平滑且迅速地减小，这是一种非常普遍的物理行为。

自相关函数：一种统计指纹

自相关函数 $R_X(\tau)$ 远不止是平稳性的一个数学检验项，它还是过程的一种丰富指纹，揭示了其最深层的物理和统计特性。

零点处的峰值：平均功率： 在延迟为零时， $R_X(\tau)$ 的含义是什么？根据定义， $R_X(0) = E[X(t)X(t+0)] = E[X(t)^2]$ 。如果 $X(t)$ 代表一个 1 欧姆电阻两端的电压，那么 $X(t)^2$ 就是瞬时功率。因此，期望值 $E[X(t)^2]$ 就是信号的平均功率。所以，自相关函数在 $\tau=0$ 处的值不仅仅是一个数字，它还是该过程所携带的总平均功率。
遥远的未来：直流功率与交流功率： 当时间延迟 $\tau$ 变得非常大时会发生什么？对于大多数没有完美周期性分量的物理过程，时间 $t$ 处的信号将完全忘记其在时间 $t+\tau$ 时的状态。它们在统计上变得独立。在这种情况下，乘积的期望变成期望的乘积： $\lim_{\tau \to \infty} R_X(\tau) = E[X(t)X(t+\tau)] \to E[X(t)] E[X(t+\tau)] = \mu_X \cdot \mu_X = \mu_X^2$ 。自相关函数趋近的值是均值的平方！这为我们提供了一种分解信号功率的绝佳方式。例如，如果一个传感器信号的自相关为 $R_V(\tau) = 13 \exp(-\frac{\tau^2}{2\sigma_0^2}) + 36$ ，我们可以立即读出其功率分量。总功率为 $R_V(0) = 13 + 36 = 49$ W。在无穷远处的值为 $36$ W，这必定是直流功率（ $\mu_V^2$ ）。剩下的部分，即衰减到零的部分，代表了围绕均值的涨落。其功率贡献是交流功率，即 $R_V(0) - \mu_V^2 = 49 - 36 = 13$ W,。功率预算的全部信息都写在了自相关函数的形状里！
频率和白噪声： 当我们在频域中观察一个过程时，故事变得更加有趣。维纳-辛钦定理告诉我们，自相关函数 $R_X(\tau)$ 和功率谱密度 (PSD) $S_X(f)$ ——后者描述了信号功率在不同频率上的分布情况——构成一个傅里叶变换对。这种联系非常强大。考虑最终极的随机过程：白噪声。这是一种如此不可预测的信号，以至于它在任何瞬间的值都与它在任何其他瞬间的值完全不相关，无论两者有多近。它的自相关函数会是什么样的？对于任何 $\tau \neq 0$ ，它必须为零，并在 $\tau=0$ 处有一个无限尖锐的峰，以解释信号的功率。具有此性质的数学对象是狄拉克δ函数 $\delta(\tau)$ 。如果白噪声的功率谱密度是一个常数 $S_{VV}(f) = N_0/2$ ，那么它的自相关恰好是 $R_{VV}(\tau) = \frac{N_0}{2}\delta(\tau)$ 。一个平坦的频谱（所有频率都同样存在）对应一个在任意不同时刻都完全不相关的信号。

更深层次的探讨：宽平稳与严平稳

我们必须小心。我们对宽平稳性的定义只关注过程的前两个矩：均值和自相关。如果更高阶的统计特性，比如信号概率分布的偏度（不对称性）或峰度（“峰态”），随时间变化怎么办？

这就引出了一个更强的条件：严平稳性 (SSS)。如果一个过程的全部联合概率分布对于时间平移是不变的，那么这个过程是严平稳的。这意味着所有统计特性——均值、方差、偏度、每一阶矩、每一种可能的统计度量——在时间上都是恒定的。

显然，SSS 是一个强得多的条件。如果一个过程是 SSS 且具有有限的二阶矩，那么它也必须是 WSS。但反过来成立吗？WSS 是否意味着 SSS？

总的来说，答案是否。我们可以构造一个 WSS 但非 SSS 的过程。想象一个离散时间过程，在每一步，我们抽取一个独立的随机数。但我们根据时间步改变规则：在偶数时间步，我们从拉普拉斯分布（尖峰，重尾）中抽取；在奇数时间步，我们从高斯分布（经典的钟形曲线）中抽取。我们可以巧妙地设置参数，使得两种分布的均值都为零，且方差完全相同。这个过程是 WSS 的，因为它的均值（0）和自协方差（在零延迟处的一个δ函数）是时不变的。然而，概率分布的基本形状在每个时间步都来回翻转。这个过程不是严平稳的。

有一个非常重要的特例，这种区别消失了。对于一个高斯过程——即任何样本集合都具有联合高斯分布的过程——WSS 确实意味着 SSS。这是因为一个高斯分布完全由其均值和协方差唯一确定。如果这两者是时不变的，那么该过程的整个统计结构也必须是时不变的。这也是高斯过程在信号处理和机器学习中如此核心的原因之一：它们的平稳性特性是独一无二的简单和优雅。

因此，从一个简单、直观的“同一性”概念出发，我们穿行于随机过程的景观之中，揭示了时间、频率、功率和概率之间的深刻联系。平稳性的概念，以其宽平稳的形式，提供了恰到好处的结构，使随机世界变得可预测，而又不牺牲其行为的丰富性。

应用与跨学科联系

在上一章中，我们熟悉了宽平稳（WSS）过程，这是一个具有优美简洁性和秩序性的数学抽象。我们看到，它的“个性”——即其统计特征——不随时间改变。它的均值是稳固的，它的自相关仅取决于两点之间的时间延迟，而不取决于我们何时开始观察。这是一个非常清晰的图景。但现实世界很少如此纯粹。我们不只是观察过程；我们与它们互动。我们对它们进行滤波、采样、分割，并试图用有限的仪器来测量它们。

因此，自然而然地要问：当我们优雅的 WSS 模型与工程和测量的现实世界碰撞时，会发生什么？这正是这个概念真正威力和实用性体现的地方。我们即将踏上一段旅程，从理论的抽象层面走向其应用的繁忙工坊。

塑造随机性：滤波的艺术

原始信号，即使是一个表现良好的 WSS 信号，通常也并非我们最终所需。它可能被恒定的偏置所污染，或者我们可能只对它的快速波动感兴趣。这就是滤波的作用所在。滤波器就像雕刻家的凿子，剔除我们不想要的部分信号，塑造剩下的部分。

想象一下，你正试图稳定一个高精度激光器。传感器上的激光光斑位置会随机抖动，我们可以将这种运动建模为一个 WSS 过程 $x(t)$ 。我们不仅仅对它的位置感兴趣，还关心它移动得有多快，即它的速度 $v(t) = \frac{dx(t)}{dt}$ 。这种求导的行为，实际上就是一种滤波。它对信号的功率谱 $S_{xx}(\omega)$ 有何影响？事实证明，速度的功率谱是 $S_{vv}(\omega) = \omega^2 S_{xx}(\omega)$ 。乘以 $\omega^2$ 意味着高频分量被显著放大，而低频漂移被抑制。滤波器塑造了信号，以强调其“摆动”而忽略其缓慢的游移。

同样的原则也适用于数字世界。一个监测稳定过程的传感器可能有一个恒定的直流偏置，一个非零的均值 $\mu_x$ 。为了观察快速变化，我们可以应用一个简单的“一阶差分”滤波器： $y[n] = x[n] - x[n-1]$ 。对均值的影响立竿见影：输出均值变得恰好为零。滤波器完美地阻断了直流分量。再看它对功率谱的影响，我们发现它将输入谱乘以了一个因子 $4\sin^2(\omega/2)$ 。这个函数在 $\omega=0$ （直流）时为零，并随频率增加而增加，再次充当了高通滤波器的角色。

这些例子揭示了一个深刻而优美简洁的规则：当一个 WSS 过程通过任何稳定的线性时不变（LTI）滤波器时，输出也是 WSS 的。其功率谱密度就是输入功率谱密度乘以滤波器频率响应的幅值平方 $|H(\omega)|^2$ 。

$S_{YY}(\omega) = |H(\omega)|^2 S_{XX}(\omega)$

这个关系是统计信号处理的基石。它允许我们设计滤波器来随意塑造随机噪声的频谱。但它也可以反向工作，把我们变成科学侦探。假设我们在一个已知的低通滤波器的输出端观察到一个噪声信号 $Y(t)$ ，并发现其频谱为，比如说， $S_{YY}(\omega) = P_0 / (1 + (\omega/\omega_c)^2)$ 。那么进入滤波器的原始信号 $X(t)$ 是什么？利用我们的神奇公式，我们可以“解卷积”滤波器的影响。在这种情况下，我们会发现输入频谱 $S_{XX}(\omega)$ 必定是一个常数。输出端看似有结构的“有色”噪声，其源头竟是输入端完全无结构的“白色”噪声。我们从观察到的效果推断出了隐藏的原因。

通往数字世界的桥梁：采样、缩放与混叠

几乎所有现代信号分析都在计算机上进行。这就要求我们将连续的信息流 $X(t)$ 捕获为一个离散的数字序列 $x[n]$ 。这就是采样的行为。这对我们的 WSS 过程的统计特性有什么影响？

乍一看，答案非常简单。如果我们每隔 $T_s$ 秒对一个 WSS 过程 $X(t)$ 进行采样，得到的离散序列 $x[n]$ 的自相关就是原始自相关函数的采样版本： $R_{xx}[k] = R_X(kT_s)$ 。同样，如果我们有一个传感器穿过一个随机空间场，改变其速度等同于对得到的时间信号进行时间缩放。如果我们把速度加倍，测量信号的相关结构在时延域上会被压缩一半。一切似乎都以一种直接的方式进行缩放。

但这种优雅的简洁性背后隐藏着一个巨大的危险：混叠。信号处理的一个基本定理告诉我们，时域采样会导致信号的频谱在频域变得周期化。采样后信号的频谱是原始频谱的无限多个副本的总和，这些副本按采样频率的倍数移动。如果原始过程的频率高于采样频率的一半（奈奎斯特频率），这些移动的副本就会重叠。结果是对信号造成灾难性且不可逆转的破坏。原始信号中的高频成分在采样版本中伪装成低频成分。

这引出了扩展到随机过程的奈奎斯特-香农采样定理。为了能够从样本中完美地重建一个随机过程（在最小化均方误差的意义上），其功率谱密度必须在奈奎斯特频率之上为零。如果一个电子噪声源的带宽为 $\omega_0$ ，我们绝对必须以频率 $f_s$ 进行采样，使得 $\omega_0 \le \pi f_s$ 。这不仅仅是一个指导方针；它是支撑我们数字世界（从音频录制到医学成像）的坚实法则。

当平稳性被打破：循环平稳性一瞥

我们看到LTI滤波保留了宽平稳性。但其他看似简单的操作呢？考虑将我们的 WSS 过程 $X(t)$ 与一个确定性的周期信号（例如，一个周期性地“开启”和“关闭”信号的脉冲串）相乘。这是一种常见的操作，称为门控或斩波。

输出过程 $Y(t)$ 还是 WSS 吗？我们来检查一下。它的均值仍为零。但它的自相关 $E[Y(t)Y(t+\tau)]$ 呢？这现在涉及到周期性脉冲串 $p(t)$ ，并变为 $p(t)p(t+\tau)R_{XX}(\tau)$ 。由于 $p(t)p(t+\tau)$ 这一项的存在，这个函数现在依赖于绝对时间 $t$ ，而不仅仅是时延 $\tau$ 。平稳性被打破了！

但混乱并未降临。这些统计特性并不仅仅是任意地时变；它们在时间上是周期性的，其周期与我们的斩波信号 $p(t)$ 相同。我们创造了一个循环平稳过程。这不是一种病态，而是一种特性。通信和信号处理中许多最重要的信号，在设计上就是循环平稳的。无线电和无线通信中的载波和符号率给信号印上了周期性的统计结构。通过理解这种循环平稳性，我们可以构建能够锁定并解码这些信号的接收机，其效果远比假装它们是平稳的要好。

从理论到现实：遍历性的飞跃

我们还有最后一个，也许是最深刻的联系需要建立。在整个讨论中，我们谈论自相关函数 $R_X(\tau)$ 和功率谱密度 $S_X(\omega)$ 时，就好像它们是神谕给予我们的已知量。但在现实世界中，我们如何能找到它们呢？

自相关的定义 $E[X(t)X(t+\tau)]$ 是一个*系综平均——对一个无限的平行宇宙集合的平均，每个宇宙都有其自身的随机过程实现。在我们的宇宙中，我们永远只能看到一个*实现，而且还是在有限的时间内。我们怎么可能计算一个系综平均呢？

我们被一个强大而优美的思想所拯救：遍历性。遍历过程是一种特殊的平稳过程，对于这种过程，只要时间足够长，时间平均就等同于系综平均。这意味着通过长时间观察过程的单一路径，我们就可以了解整个系综的统计特性。系统仅通过时间演化就能探索其所有可能的统计状态。

这使得我们能够利用有限的 N 个数据点来计算自相关的估计值。一种常见的方法是计算 $\hat{R}_X[k] = \frac{1}{N} \sum_{n=0}^{N-1-k} x[n]x[n+k]$ 。但我们必须小心。这是一个估计量，其本身就是一个随机变量，而不是真实的确定性自相关函数。它有其自身的特性。例如，这个特定的估计量是有偏的；它的期望值实际上是 $\frac{N-k}{N}R_X[k]$ ，对于非零时延会系统性地低估真实值。

真实、理论上的自相关 $R_X(\tau)$ 与其有限记录的时间平均估计 $\hat{R}_X^{(T)}(\tau)$ 之间的区别至关重要。维纳-辛钦定理（即 PSD 是自相关的傅里叶变换）严格适用于真实的、基于系综的函数 $R_X(\tau)$ 。我们估计值 $\hat{R}_X^{(T)}(\tau)$ 的傅里叶变换给我们的是 PSD 的一个估计值（称为周期图），这个量本身是随机的，并带有其自身的误差和不确定性来源。

实现“遍历性飞跃”——即假设我们能够测量的单个世界能够代表整个系综——是连接 WSS 过程优美的数学理论与现实数据实用、混乱但迷人的世界的必要桥梁。正是这一飞跃，让我们能够利用这些强大的思想来设计通信系统、控制噪声电子设备、分析金融市场和解释地球物理数据，将平稳过程的抽象之美转化为切实的工程与发现。