离散时间状态空间模型

玻尔百科

定义

离散时间状态空间模型是一种通过两个核心方程来表示动态系统的数学框架，其利用状态向量捕获系统的完整记忆以预测未来行为。该框架在工程、生态学和神经科学等领域作为通用建模语言，通过状态矩阵的特征值定义系统的内部行为模式。离散时间状态空间模型为控制和估计提供了强大的工具，但对连续系统进行采样可能会改变其原有的可控性或可观测性。

核心要点

状态空间模型通过两个核心方程表示任何动态系统，将其完整的记忆捕获在一个状态向量中，以预测未来行为。
系统的内部自然行为模式（状态矩阵 A 的特征值）与其外部频率共振（其传递函数的极点）是相同的。
该框架提供了强大的工具来应对两大基本挑战：控制（使系统按预期运行）和估计（从不完整或带噪声的测量中推断隐藏状态）。
对连续系统进行采样的行为本身就可能改变其属性，可能导致能控性或能观性的丧失。
状态空间表示法是一种通用语言，用于在工程学、生态学和神经科学等不同领域中为具有隐藏状态的动态现象建模。

引言

我们如何能找到一种单一、统一的语言来描述各种动态系统的行为，从在太空中运行的卫星到昆虫物种的种群波动？状态空间模型提供了一个强大而优雅的答案。它提供了一个框架，用于捕捉系统在任何给定时刻的基本信息——即“状态”，使我们能够预测其未来并理解其基本属性。这种方法解决了从临时性描述转向用于分析、控制和估计的通用方法的挑战。

本文将引导您进入离散时间状态空间模型的世界。在第一部分“原理与机制”中，我们将剖析核心的状态方程和输出方程，探讨如何从物理原理或现有方程构建这些模型，以及它们揭示了系统内在特性的哪些方面。接下来，“应用与跨学科联系”部分将展示该框架的非凡效用，说明它如何使我们能够精确控制复杂机械，穿透带噪声测量的迷雾来估计隐藏变量，并为神经科学和生态学等不同领域的现象构建富有洞察力的模型。

原理与机制

想象一下，你想描述一个系统——任何系统。它可以是围绕太阳运行的行星、股票市场，或是一壶正在烧开的水。假设你知道它将受到的所有外部推动，那么为了预测它的未来，你现在需要知道的绝对最少的信息是什么？这个核心信息就是我们所说的系统的状态。它是系统的记忆，一个捕捉了其整个过去历史完整影响的快照。

状态空间方法是一个非常强大的思想，因为它表明我们可以用两个简单而优雅的方程来描述几乎任何系统的演化。它是一种动力学的通用语言。

事物的状态：系统的记忆

让我们从一个熟悉的事物开始：个人贷款。假设你借钱买了一台笔记本电脑。在任何特定时刻，最重要的数字是你的未偿还余额。这就是状态！我们称之为 $x[n]$ ，即第 $n$ 个月初的余额。要计算下个月的余额 $x[n+1]$ ，你只需要知道当前余额 $x[n]$ 和本月发生的任何交易，比如你的月度还款。你不需要知道所有过去还款的全部历史；所有信息都已汇总在当前余额中。

在离散时间的世界里，我们以固定的时钟节拍来观察系统，这种演化可以用两个方程来捕捉：

\begin{align*​} \mathbf{x}[n+1] &= A \mathbf{x}[n] + B \mathbf{u}[n] \\ \mathbf{y}[n] &= C \mathbf{x}[n] + D \mathbf{u}[n] \end{align*​}

让我们来分解一下。第一个是状态方程，第二个是输出方程。

$\mathbf{x}[n]$ 是状态向量，它是一个数字列表，包含了系统在时间步 $n$ 的完整记忆。对于我们的贷款，它只是一个数字，即余额。对于一个移动的物体，它可能是其位置和速度。
$\mathbf{u}[n]$ 是输入向量。这些是外部力量，是我们给系统的“推动”。对于贷款，它就是月度还款。
矩阵 $A$ 是动态矩阵。它描述了在没有任何外部输入的情况下，系统将如何自行演化。如果你停止还款， $A$ 描述了利息如何使你的债务增长。
矩阵 $B$ 是输入矩阵。它告诉我们输入 $\mathbf{u}[n]$ 如何影响状态。它将你的还款转化为贷款余额的减少。
现在来看第二个方程。我们通常无法直接看到内部状态。我们只能测量某些东西。 $\mathbf{y}[n]$ 是输出向量——我们实际可以观察到的东西。在贷款的例子中，输出可能就是余额本身，此时 $y[n] = x[n]$ 。
矩阵 $C$ 是输出矩阵。它决定了内部状态 $\mathbf{x}[n]$ 如何被转换为可观测的输出 $\mathbf{y}[n]$ 。
最后，矩阵 $D$ 是前馈矩阵。这是一个特殊的矩阵。它表示从输入到输出的直接、瞬时连接。想象一下你正在监测一个电路，你的测量值是电阻两端的电压（与状态、电流相关）和电源电压本身（输入）的混合。电源电压的任何瞬时变化都会立即在你的测量中显示出来。这个直接路径就是 $D$ 所捕捉的。如果没有这样的直接联系， $D$ 就为零。

构建模型：从现实到方程

这个状态空间框架非常优美，但是这些矩阵 $A, B, C,$ 和 $D$ 从何而来呢？主要有两条路径可以找到它们。

路径 1：从差分方程

许多数字系统，比如你手机里用来净化音频的滤波器，都是由差分方程描述的，这些方程将当前输出与过去的输出和输入联系起来。考虑一个由以下公式描述的简单数字音频滤波器：

$y_n = \alpha_1 y_{n-1} + \alpha_2 y_{n-2} + u_n$

这个方程具有记忆性——当前输出取决于前两个输出。为了将其纳入我们的状态空间框架（该框架只允许依赖于紧邻的前一个状态），我们可以玩一个聪明的花招。让我们将状态向量定义为我们需要记住的过去输出的列表：

$\mathbf{s}_n = \begin{pmatrix} y_{n-2} \\ y_{n-1} \end{pmatrix}$

现在，让我们看看这个状态如何演化。下一个时间步的状态 $\mathbf{s}_{n+1}$ 将是 $\begin{pmatrix} y_{n-1} \\ y_{n} \end{pmatrix}$ 。我们可以用旧状态 $\mathbf{s}_n$ 来表示它：

新状态的第一个分量是 $y_{n-1}$ ，它就是旧状态的第二个分量。
新状态的第二个分量是 $y_n$ ，我们可以从原始的差分方程得到： $y_n = \alpha_2 y_{n-2} + \alpha_1 y_{n-1} + u_n$ 。

把它写成矩阵形式，我们得到一个优美且结构化的结果：

\mathbf{s}_{n+1} = \begin{pmatrix} y_{n-1} \\ y_n \end{pmatrix} = \begin{pmatrix} 0 & 1 \\ \alpha_2 & \alpha_1 \end{pmatrix} \begin{pmatrix} y_{n-2} \\ y_{n-1} \end{pmatrix} + \begin{pmatrix} 0 \\ 1 \end{pmatrix} u_n

就这样，我们找到了我们的 $A$ 和 $B$ 矩阵！这种由基于过去值定义状态而产生的特定结构，被称为能控标准型。

路径 2：通过离散化从连续世界

现实世界中的许多系统——如机器人小车、卫星或化学反应——本质上是连续的。它们的动态由微分方程描述，例如 $\dot{\mathbf{x}}(t) = A_c \mathbf{x}(t) + B_c \mathbf{u}(t)$ 。要用数字计算机控制这样的系统，我们必须对其进行采样。这个将连续时间模型转换为离散时间模型的过程称为离散化。

让我们来看一个能想到的最简单的连续系统：一个理想积分器， $\dot{x}(t) = u(t)$ 。这表示 $x$ 的变化率等于输入 $u$ 。为了找到离散时间的更新规则，我们可以在一个采样周期内进行积分，从时间 $kT$ 到 $(k+1)T$ ：

\int_{kT}^{(k+1)T} \dot{x}(t) dt = \int_{kT}^{(k+1)T} u(t) dt

左边就是 $x((k+1)T) - x(kT)$ ，或者 $x[k+1] - x[k]$ 。对于右边，我们假设数字控制器在采样间隔内保持其输出恒定，这被称为零阶保持器 (ZOH)。因此，对于在 $kT$ 和 $(k+1)T$ 之间的 $t$ ， $u(t)$ 就是常数值 $u[k]$ 。积分变为：

x[k+1] - x[k] = \int_{kT}^{(k+1)T} u[k] dt = u[k] \int_{kT}^{(k+1)T} dt = T u[k]

重新整理后，我们得到离散时间状态方程：

x[k+1] = 1 \cdot x[k] + T \cdot u[k]

所以，对于这个系统，离散动态矩阵是 $A_d = 1$ ，输入矩阵是 $B_d = T$ 。这非常直观：新状态是旧状态加上一个与输入和施加时间（ $T$ ）成正比的量。

对于更复杂的系统，比如有质量和摩擦的机器人小车，计算会涉及矩阵指数 $\exp(A_c T)$ 。通用解是：

A_d = \exp(A_c T) \quad \text{and} \quad B_d = \left( \int_{0}^{T} \exp(A_c \tau) d\tau \right) B_c

虽然公式看起来令人生畏，但其直觉是一样的。 $A_d$ 告诉你系统在周期 $T$ 内如何自行演化，而 $B_d$ 告诉你一个恒定输入在同一周期 $T$ 内施加所产生的总累积效应。

系统的两面性：时域步进与频域节律

到目前为止，我们都是在时域中一步一步地思考系统。但物理学家和工程师们常常发现在频域中思考更具启发性——即探究系统如何响应不同频率的输入。连接这两个世界的桥梁是 Z 变换，频域中的关键对象是脉冲传递函数 $H(z)$ 。

如果你有一个状态空间模型 $(A, B, C, D)$ ，你可以用一个基础公式找到它的传递函数：

H(z) = C (zI - A)^{-1} B + D

这个公式就像一块罗塞塔石碑，将状态空间语言 $(A, B, C, D)$ 翻译成频域语言 $H(z)$ 。这种转换也可以反向进行。给定一个传递函数，例如来自音频效果器的传递函数，你可以推导出相应的状态空间模型，通常是我们之前看到的标准型。

但这种联系比简单的转换更为深刻。它揭示了系统行为的根本统一性。传递函数的极点是特殊的 $z$ 值，在这些值上系统响应可能变为无穷大——它们定义了系统的自然共振和稳定性。在时域中，动态矩阵 $A$ 的特征值决定了系统的自然“模态”——即系统在无外部干预时表现出的行为模式（如衰减、增长或振荡）。

美妙之处在于：传递函数的极点集合与状态矩阵 $A$ 的特征值集合是相同的。

这是一个深刻的结果。它意味着一个系统的内部自然节律（其特征值）恰好是它外部共振的频率（其极点）。这种统一性赋予我们巨大的能力：我们可以通过简单地计算更简单的矩阵 $A$ 的特征值来分析稳定性，而稳定性问题关乎 $H(z)$ 的极点。

基本问题：我们能看到什么，能做什么？

既然我们有了这个强大的模型，我们就可以对系统本身提出一些深刻的问题。它的本质特征是什么？它的基本局限性是什么？

系统的指纹：脉冲响应

你能对一个系统做的最有启发性的事情之一，就是给它一个单一、急剧的冲击——一个“脉冲”——然后观察它的反应。这个输出被称为脉冲响应 $h[n]$ ，它就像是系统独一无二的指纹。利用状态空间模型，我们可以为其找到一个优美的表达式。单位脉冲输入 $\delta[n]$ 在 $n=0$ 时为 $1$ ，在其他地方都为零。

在 $n=0$ 时，输出是 $y[0] = C \mathbf{x}[0] + D u[0] = D$ ，因为初始状态为零。
这个冲击将 $n=1$ 时的状态设置为 $\mathbf{x}[1] = A \mathbf{x}[0] + B u[0] = B$ 。
对于所有之后的时间 $n > 1$ ，输入为零，所以系统只是自行演化： $\mathbf{x}[n] = A \mathbf{x}[n-1] = A^{n-1} \mathbf{x}[1] = A^{n-1} B$ 。此时输出为 $y[n] = C \mathbf{x}[n] = C A^{n-1} B$ 。

将这些结合起来，得到完整的脉冲响应：

h[n] = D \delta[n] + C A^{n-1} B \, u[n-1]

其中 $u[n-1]$ 是一个单位阶跃函数，它在 $n \ge 1$ 时“开启”第二项。这个公式具有极好的描述性。 $D$ 项是瞬时冲击，而 $C A^{n-1} B$ 项是随后的振铃。对于一个数字谐振器，如果 $A$ 是一个缩放旋转矩阵， $A^{n-1}$ 会产生一个衰减的螺旋——这是对振铃声逐渐消失的完美数学描述。

能控性与能观性：能力与知识的极限

最后，我们来到了整个控制理论中两个最重要的概念：能控性和能观性。

能控性提问：我们能否将系统引导到任何期望的状态？通过施加某个输入序列，是否可能将系统从任何起点带到任何终点？
能观性提问：我们能否仅通过观察其输出来推断系统的完整内部状态？如果状态是系统隐藏的记忆，我们能从外部读取这份记忆吗？

你可能会认为，如果你能施加一个力并测量某个量，那么这两个问题的答案总是“是”。但世界更为微妙，尤其是在数字控制的离散世界中。

考虑一个简谐振子，比如弹簧上的质量块或 MEMS 谐振器。它有一个自然振荡频率 $\omega_n$ 。假设我们想用数字计算机来控制它，所以我们以固定的时间间隔 $T$ 采样它的位置。如果我们选择的采样周期非常糟糕会怎样？例如，如果我们选择 $T = \pi / \omega_n$ ，这恰好是振子自然周期的一半呢？

每次我们采样时，质量块都会处于其最大位移处，但位置在两侧交替。我们会看到一个序列，如 $+X_{max}, -X_{max}, +X_{max}, \dots$ 。仅从这一系列测量中，我们完全无法得知速度是多少！在每次测量时，速度都暂时为零。如果两个振荡具有相同的振幅，我们无法区分高能量振荡和低能量振荡。我们制造了一个盲点。系统变得不可观测。

类似地，如果我们试图在这些精确的时刻推动质量块，我们的推动效果会大打折扣。我们正在尝试控制一个我们已无法完全确定其内部状态的系统。事实证明，对于这个特殊的采样时间，系统也变得不可控。

这是一个惊人且至关重要的教训。采样的行为本身——将我们的离散世界观强加于连续现实之上——并非中立行为。它能从根本上改变我们试图理解和控制的系统的属性，将其部分隐藏起来，使其不受我们的影响。状态空间框架不仅为我们提供了建模这些系统的工具，还赋予我们理解这些深刻而实际的限制的智慧。

应用与跨学科联系

在我们之前的讨论中，我们打开了动态系统的“黑箱”，发现了一个丰富的内部世界——状态。我们看到，一个系统在任何时刻的全部状况都可以通过一列数字，即一个状态向量 $x$ 来捕捉，而它随时间的演化可以用一个简单而优雅的规则来描述： $x[k+1] = Ax[k] + Bu[k]$ 。你可能会想：“这不过是一场精妙的数学游戏，但它到底有什么用呢？”

简而言之，答案是几乎无所不能。状态空间方法的真正力量不仅在于其描述的优雅，更在于其非凡的实用性。它为科学和工程领域中一些最根本的挑战提供了一种统一的语言和一个工具包：控制我们周围的世界，推断我们无法直接看到的事物，以及为复杂现象构建忠实的模型。让我们踏上这段应用的旅程，你将看到这个简单的矩阵方程如何成为一把钥匙，开启一片广阔的可能性。

控制的艺术：塑造动态

从本质上讲，控制理论是让事物按照我们意愿行事的科学。状态空间表示法将这门艺术从试错过程转变为一种精确的、外科手术般的过程。如果状态向量 $x[k]$ 真正代表了系统的状况，而输入 $u[k]$ 是我们对其的控制手柄，那么我们就可以设计一个控制律来将状态引导到我们希望的任何地方。

想象一下，你是一名工程师，任务是使用卫星内部的反作用轮来调整其姿态。即使在太空真空中，旋转的轮子也具有惯性；当你命令其马达停止时，它会继续滑行。但如果你需要它立即停止呢？使用状态反馈控制器 $u[k] = -Kx[k]$ ，我们可以选择一个增益 $K$ 来施展一种魔法。对于一个简单的一阶系统，我们可以计算出精确的增益，迫使闭环动态在 z 平面的原点处有一个极点。其物理意义惊人：系统将在一个时间步内从任何初始状态达到完全静止。这种“无差拍”控制是精度的典范——没有超调，没有振铃，只有完美、瞬时的响应，而这一切都通过将系统自身的状态反馈到其输入而成为可能。

当然，世界很少如此简单。许多系统，从依靠尾焰平衡的火箭到保持直立的赛格威，本质上都是不稳定的。考虑一个经典的挑战：将摆锤平衡在其倒置位置——一个不稳定的平衡状态。其非线性运动方程很复杂，但在那个不稳定的单点周围，它们可以被一个线性状态空间模型近似。这个线性化模型虽然只是一个近似，却成了我们的游乐场。它允许我们设计控制器，比如复杂的模型预测控制（MPC），能够预测摆锤的下落趋势并施加精确定时的力矩来保持其平衡。这种“线性化并控制”的通用策略是现代工程的基石，它允许我们通过在最需要的地方应用状态空间方法的清晰性来驾驭复杂的非线性系统。

这种现代观点并未抛弃旧有、可靠的方法；它统一了它们。比例-积分-微分（PID）控制器是工业自动化领域不知疲倦的主力，从恒温器到化工厂无处不在。它的工作原理很简单：对当前误差（比例）、累积的过去误差（积分）和预测的未来误差（微分）作出反应。它似乎与我们的矩阵方程相去甚远，但事实并非如此。我们可以将 PID 控制器本身表示为一个状态空间系统，其中状态是具有物理意义的量，如误差的积分和前一个误差值。这样看待它，揭示了 PID 控制器的本质：一个旨在塑造误差信号的动态系统，证明了状态空间框架是一个宏大的舞台，新旧角色都可以在此扮演自己的角色。

估计的科学：穿透迷雾

如果说控制关乎行动，那么估计则关乎感知。我们很少能直接测量系统状态的方方面面。我们有温度计，但没有“偏差计”；我们有 GPS 坐标，但没有车辆“横向跟踪误差”的直接读数。我们的测量往往是带噪声的、不完整的和间接的。我们生活在一片感知的迷雾中。状态空间框架给了我们一把手电筒。

其核心思想是一段优美的双步舞，一个预测和更新的循环，这正是贝叶斯滤波的核心。首先，我们的状态空间模型扮演预言家的角色：利用当前的状态估计和已知的动态（ $A$ 和 $B$ ），它预测下一时刻状态将处于何处。然后，一个来自真实世界的新测量值到达。这个测量值是我们的基准真相，尽管它带有噪声。在更新步骤中，我们将我们的预测与这个新测量值进行比较。其差异，即“预测误差”或“新息”，告诉我们我们的预测错得有多离谱。我们利用这个误差来微调我们的状态估计，使其更符合现实。这个循环不断重复，每次测量都完善我们的信念，使我们对隐藏状态的估计收敛于真值。

这种双步舞最著名的体现就是卡尔曼滤波器。想象一下，你正在监测一个用于生长晶体的高精度熔炉。温度必须完美。你有一个热电偶，但你怀疑它的读数不完全准确；它有一个微小且缓慢漂移的偏差。你如何才能同时估计真实温度和这个无法测量的偏差呢？诀窍在于大胆地进行建模。我们创建一个增广状态向量，它不仅包括物理状态（温度偏差），还包括我们关心的隐藏状态（传感器偏差）。我们将偏差建模为“随机游走”——在每一步，它大致保持不变，但会受到一个微小的随机扰动。现在，卡尔曼滤波器就可以开始工作了。通过长期观察预期温度和测量温度之间的差异，它可以智能地推断出误差中有多少是由于实际温度变化造成的，又有多少是由于漂移的偏差造成的。它学会了看见不可见之物。

这引出了一个深刻且有时令人吃惊的问题：我们总能通过测量看到状态吗？答案是否定的。能观性的概念与能控性是对偶的。如果通过长期观察系统输出 $y[k]$ 能够唯一确定其初始状态 $x[0]$ ，那么该系统就是能观的。设计一个反馈控制器，虽然成功地稳定了系统，却可能无意中使其某些内部状态对输出变得不可见。系统可能运行得非常完美，但其内部动态的一个关键部分变成了一个幽灵，完全隐藏在我们的视野之外。这是一个深刻的警示：我们选择控制系统的方式会影响我们观察它的能力。

估计的力量也为实际工程问题提供了优雅的解决方案。一个常见的任务是计算信号的变化率，即导数。天真的方法——计算连续点之间的差值——对于带噪声的信号是灾难性的，因为它会极大地放大噪声。一种更智能的方法是使用状态观测器，如 Luenberger 观测器。我们不是对信号进行微分，而是为产生该信号的过程建立一个状态空间模型。观测器是该模型的一个副本，与真实系统并行运行。它接收相同的输入 $u[k]$ ，但同时也会被真实系统的输出 $y[k]$ 校正。观测器的其中一个状态可以被设计为输出导数的估计值。因为这个估计值来自基于物理的模型，而不是原始的差分计算，所以它要干净得多，对噪声的鲁棒性也更强。这是一种美妙的协同作用：我们使用一种估计技术来改进一项控制任务。

科学的通用语言：为世界建模

也许状态空间框架最深远的影响在于其超越了传统工程学，在科学建模中扮演了通用语言的角色。只要一个系统具有随时间演化且被不完美测量的隐藏状态——也就是说，几乎所有具有科学意义的系统都是如此——状态空间模型就提供了完美的思维工具。

考虑大脑中错综复杂的节律。脑电图（EEG）可能会显示一个 10 Hz 振荡的短暂爆发，然后迅速消失——一个“α 纺锤波”。我们如何创建一个能以这种方式行为的数学对象？我们可以将这种振荡看作一个二阶离散时间系统的输出。振荡的频率及其衰减率对应于系统在复平面上极点的位置。通过从期望的行为反向推导，我们可以精确计算出状态转移矩阵 $A$ 必须是什么样的才能产生这些极点。由此产生的状态空间模型成为大脑节律的“生成模型”，一个可用于模拟、分析和检测的紧凑数学描述。抽象的矩阵和向量已成为神经过程的模型。

这种建模能力在生态学等领域是革命性的。想象一位生物学家试图理解一个昆虫物种的种群动态。每年，他们调查一个栖息地并计算他们发现的昆虫数量。他们知道他们的计数并非真实的种群数量。有些昆虫被隐藏了，有些被错过了。此外，真实的种群数量本身每年都会因天气、食物可得性以及纯粹的出生和死亡偶然性而随机波动。状态空间框架为这个问题提供了完美的概念词汇。真实的、潜在的种群规模 $N_t$ 是状态。其年复一年的波动，由环境和人口统计学的随机性驱动，是过程噪声。生物学家的计数 $y_t$ 是观测值。由于不完美的探测导致的 $N_t$ 和 $y_t$ 之间的差异是观测误差。通过将其形式化，我们可以写下一个过程模型（例如，均值取决于去年种群数量的泊松分布）和一个观测模型（例如，代表计算每只昆昆虫概率的二项分布）。这种过程与观测的清晰分离是所有现代科学中最强大的思想之一，而状态空间模型是其天然的归宿。

但是矩阵 $A$ 、 $B$ 和 $C$ 从何而来呢？在摆锤和脑电图的例子中，我们从物理原理推导出它们。在生态学的例子中，它们代表生物学速率。但如果我们没有第一性原理理论怎么办？我们可以直接从数据中学习模型吗？可以。这就是系统辨识领域。通过向系统输入一个已知的输入序列 $u[k]$ 并记录输出 $y[k]$ ，我们可以搜索一组矩阵 $(A, B, C, ...)$ ，使得由它们创建的模型的预测与观测数据最匹配。这通常被表述为一个优化问题，我们最小化“预测误差”。这将我们的框架直接与统计学和机器学习的世界联系起来，使我们能够直接从实验数据中为未知系统构建模型。

从卫星的运动到我们头脑中的思想，从平衡杆到昆虫的嗡嗡声，离散时间状态空间模型提供了一个单一、统一的视角。它证明了一个良好抽象——隐藏“状态”这一概念——的力量，能为极其多样化的人类探究领域带来清晰、洞察和能力。它远不止是一场数学游戏；它是一种看待世界的方式。