状态估计器

玻尔百科

定义

状态估计器是控制工程中的一种组件，通过将数学模型与实际传感器测量值相结合，来重构系统无法直接测量的内部状态。该技术以可观测性为核心前提，确保能从输出中推断出内部状态，并通常利用分离原理来独立设计状态观测器和控制器。在实际应用中，状态估计器包括用于线性系统的 Luenberger 观测器，以及用于处理非线性系统的扩展卡尔曼滤波（EKF）。

核心要点

状态估计器（如龙伯格观测器）通过将数学模型与真实的传感器测量相结合，来重构系统无法测量的内部状态。
能观性是一个至关重要的概念，它决定了系统的内部状态是否能从其输出中推断出来，这是设计有效观测器的必要条件。
分离原理是控制理论中的一个基本成果，它允许状态控制器和状态观测器的设计独立进行，而不会影响整个系统的稳定性。
像扩展卡尔曼滤波器（EKF）这样的高级估计器，通过在当前状态估计值附近进行连续的线性近似，来应用这些原理处理非线性系统。

引言

控制一个复杂系统，无论是航天器还是生物过程，都面临一个根本性挑战：我们常常无法直接测量精确控制所需的所有关键信息。如果你能测量磁悬浮体的位置但无法测量其速度，你该如何使其稳定？我们所能看到的和我们需要知道的之间的这种差距，是工程学和科学领域的一个核心问题。仅仅依赖纯粹的仿真是不够的，因为任何微小的误差都可能导致模型偏离现实。状态估计器提供了解决方案，它就像一个数学透镜，从可用的测量数据中推断出隐藏的状态。本文将揭开状态估计世界的神秘面纱。第一部分“原理与机制”将深入探讨核心理论，解释像龙伯格观测器这样的观测器是如何工作的，能观性的关键概念，以及优雅的分离原理。随后，“应用与跨学科联系”部分将展示这些强大的工具如何应用于从机器人学、航空航天到合成生物学和物联网等不同领域，揭示估计不可见之物的普遍性。

原理与机制

想象一下，你正试图在完全黑暗中穿越一个复杂的迷宫。你有一张地图，也知道你计划要走的一系列转弯。但如果看不到墙壁，你如何知道自己实际在哪里？一个轻微的失误、一个意想不到的斜坡，或者地图上的一个错误，都可能让你彻底迷失方向。你需要一种方法来对照现实检查你的位置。状态估计器就是工程学上等同于你用来敲击墙壁的拐杖，是一种“看见”不可见之物并将你对系统的理解与现实世界联系起来的工具。

机器中的幽灵：模拟现实

让我们从最直观的想法开始。如果我们有一个完美的系统数学模型——比如说，一艘在太空中滑行的航天器——并且我们知道我们发送给其推进器的指令，为什么我们不能直接在计算机上运行一个完美的仿真呢？我们可以构建一个真实系统的“数字孪生”或“幽灵模型”，给它相同的输入，并假设它的状态（我们称之为 $\hat{x}$ ）与真实状态 $x$ 相同。

这可以用一个简单的仿真来描述： $\dot{\hat{x}} = A\hat{x} + Bu$ 。在这里， $A$ 代表系统的自然动力学（它自身会如何运动），而 $Bu$ 代表我们控制输入 $u$ 的影响。这本质上是一个反馈增益设为零的观测器，一种人们可能天真地提出的“极简”设计。

但问题出在哪里？这个幽灵模型与真实的航天器完全脱节。如果我们对状态的初始猜测 $\hat{x}(0)$ 与真实状态 $x(0)$ 哪怕只有一丝偏差，或者一股微小未建模的力（如太阳风）给了真实航天器一个轻推，仿真和现实就会开始偏离。估计误差 $e(t) = x(t) - \hat{x}(t)$ 不会被修正。其动力学由 $\dot{e}(t) = Ae(t)$ 决定。这个简单的方程蕴含着深刻的教训：误差的行为与系统本身完全一样！如果系统本身是不稳定的——就像一支立在笔尖上的铅笔——任何微小的初始误差都会呈指数级增长。我们的幽灵仿真会自信地报告铅笔仍然直立，而实际上，它早已倒在桌上了。纯粹的仿真是脱离现实的白日梦。

驯服幽灵：修正的力量

为了防止我们的仿真滑入幻想，我们需要不断地将其“推”向现实。我们利用我们能够测量到的信息来做到这一点。虽然我们可能无法看到完整的状态 $x$ （例如，航天器精确的角速度和内部温度），但我们可以测量某些输出 $y$ （例如，来自星跟踪器的姿态）。

龙伯格观测器的杰出之处在于，它将真实世界的测量值 $y$ 与我们的仿真预测应该看到的测量值 $\hat{y} = C\hat{x}$ 进行比较。这个差值 $y - \hat{y}$ 就是“意外”或新息。它是一个信号，告诉我们：“嘿，你的仿真出错了，证据就在这里！”

然后，我们可以将这个误差信号反馈回去，以修正我们的仿真。我们在模型中加入一个修正项，该修正项与此新息成正比，并由一个增益矩阵 $L$ 加权。观测器方程变为：

\dot{\hat{x}}(t) = A\hat{x}(t) + Bu(t) + L(y(t) - C\hat{x}(t))

这是全阶状态观测器的标准形式。它是一个美妙的综合体：它运行一个系统仿真 ( $A\hat{x} + Bu$ )，但又不断地用现实检查 ( $L(y - C\hat{x})$ ) 来约束它。矩阵 $L$ ，即观测器增益，决定了我们对“意外”的反应强度。高增益意味着我们非常信任测量值，并积极修正我们的估计；低增益意味着我们更信任我们的模型，并进行更温和的修正。

误差的无形之舞

现在到了真正优雅的部分。当我们使用这个修正后的观测器时，估计误差 $e(t) = x(t) - \hat{x}(t)$ 会发生什么变化？一些代数运算揭示了一个非凡的结果。如果我们找出误差的动力学，我们会得到：

\dot{e}(t) = (A - LC)e(t)

仔细观察这个方程。两件神奇的事情发生了。

首先，控制输入项 $Bu(t)$ 完全消失了！这是一种深刻的解耦。这意味着我们估计的收敛性与我们正在指令的具体机动动作无关。无论我们是指令航天器保持稳定还是进行快速翻滚，控制我们估计误差收缩至零的动力学完全独立于这些行为。观测器找出状态的工作与控制器驱动状态的工作是分开的。

其次，误差的命运由一个单一矩阵的性质决定： $(A - LC)$ 。这是一个线性系统，其行为由其特征值决定。你可以将特征值看作系统响应的基本“模态”或“特性”。一个正的实部特征值对应于一个指数增长的不稳定模态。一个负的实部特征值对应于一个指数衰减的稳定模态。对于我们的误差系统，我们希望 $(A-LC)$ 的所有特征值都在稳定区域（复平面的左半部分）。

这给了我们设计者一种超能力。通过选择观测器增益矩阵 $L$ ，我们通常可以将 $(A-LC)$ 的特征值放置在我们想要的任何位置。如果我们希望估计误差非常快地消失，我们就将特征值放在离左边很远的地方，对应于快速的指数衰减。如果我们满足于较慢的收敛速度，我们可以将它们放置得更靠近原点。我们实际上是在决定我们自身无知的半衰期。

现在你能看见我吗？观测的局限

是否总是可以通过选择 $L$ 来将误差系统的特征值放置在我们喜欢的任何地方？不幸的是，答案是否定的。这就引出了能观性这个关键概念。

想象一个系统，由两个独立的、不相互作用的部分密封在一个盒子里。我们唯一的传感器测量第一部分的某个属性。我们可以完美地估计第一部分的状态，因为我们能“看到”它的影响。但第二部分则完全是个谜。它根据自己的内部动力学演化，但其行为对我们的传感器没有任何影响。系统的这一部分是不能观的。

在数学上，一个不能观模态对应于系统矩阵 $A$ 的一个特征值，这个特征值无法通过任何观测器增益 $L$ 的选择来移动。无论我们如何设计观测器，与那个不能观状态相关的误差都将根据其自身的、不可改变的自然动力学演化。

那么，如果一个系统有不能观模态会发生什么？

良性情况：能检测性。 如果系统的不能观部分本身是稳定的（例如，它有摩擦并且会自然滑行至停止），那么估计它的误差也会自行衰减到零。我们无法用观测器加速它的衰减，但我们可以保证它在长期内不会引起问题。这样的系统被称为能检测的。对于许多实际应用来说，能检测性已经足够好了。我们可以构建一个观测器，保证总的估计误差最终会消失。
灾难性情况：不稳定且不能观。 现在想象一下，系统的不能观部分本身是不稳定的（就像一个正在缓慢积累直至爆炸的内部链式反应）。因为它是不能观的，我们的传感器没有给我们任何警告。我们的状态估计器对这个隐藏的危险一无所知，报告一切正常。与此同时，我们对这个不稳定状态的估计误差正在呈指数级增长，反映了真实系统的不稳定性。这是一个灾难性的失败。这就是为什么设计观测器的第一步总是要检查系统的能观性（或至少是能检测性）的根本原因。你必须知道你看不到什么。

一次漂亮的分离：分离原理

我们现在已经确立了如何构建一个能准确跟踪现实的“幽灵”。然而，最终目标是使用这个估计来控制系统。我们基于我们的估计来计算控制律，例如， $u = -K\hat{x}$ 。

这提出了一个深刻而令人不安的问题：我们正在追逐一个幽灵。控制作用是基于估计值 $\hat{x}$ ，而它总是与真实状态 $x$ 至少有微小的差异。我们观测器的不准确性难道不会干扰我们控制器的稳定性吗？反过来，控制器的行为难道不会影响观测器吗？我们似乎陷入了一个恶性循环。

答案是整个控制理论中最优美、最强大的结果之一：分离原理。它指出，对于线性系统，设计控制器（选择增益 $K$ ）的问题和设计观测器（选择增益 $L$ ）的问题是完全分开的。你可以独立地解决它们。

首先，假装你可以测量到完整的状态 $x$ ，并设计出最优的控制器增益 $K$ 来配置 $(A-BK)$ 的特征值，以达到你期望的性能。
其次，完全忘记控制器，设计出最优的观测器增益 $L$ 来配置 $(A-LC)$ 的特征值，以实现快速稳定的误差收敛。

当你将它们连接起来，让控制器作用于观测器的估计值时，组合后的系统将完全按照你设计每个部分的方式工作。整体稳定性是两个独立设计稳定性的组合。其数学原因惊人地优雅：描述完整组合系统动力学的矩阵可以排列成一种块三角形式。由于这种结构，其特征值集合就是控制器特征值（来自 $A-BK$ ）和观测器特征值（来自 $A-LC$ ）的并集。

这个原理使得现代控制系统变得切实可行。它允许将一个复杂的、相互交织的问题分解成两个更小、可管理的部分，并且可以独立解决。这是关于线性系统中信息与行动结构的一个深刻论断，揭示了一个看似复杂的世界中隐藏的简单性和统一性。

应用与跨学科联系

理解了状态估计器的原理和机制后，你可能会倾向于认为它们只是一种巧妙但小众的数学技巧。这大错特错。从可见之物中重构不可见之物的能力，是现代科学和工程学中最强大、最普遍的思想之一。它是一个数学透镜，让我们能够窥视从轰鸣的喷气发动机到活细胞中分子无声、无形的舞蹈的一切事物。让我们踏上旅程，穿越其中一些世界，看看状态估计器在行动中的风采。

设计完美的观测器：智能猜测的艺术

控制工程的核心是让系统按照我们的意愿行事。但如果你不知道它在做什么，你又如何能控制它呢？想象一下，试图完美地平衡一个磁悬浮装置（）。你的传感器可能会告诉你悬浮物体的精确位置，但对它的速度却一无所知。如果你只对位置做出反应，你总是会慢一步。当你看到它太高时，它已经在快速向上移动；当你修正并看到它太低时，它已经在急速下坠。要实现稳定、平滑的悬浮，你不仅需要知道它在哪里，还需要知道它要去哪里。

这就是状态估计器，如龙伯格观测器，登场的时刻。它利用我们确实拥有的信息——位置测量——并将其与我们对系统物理特性的知识（其模型，由矩阵 $A$ 和 $B$ 表示）相结合，对我们没有的信息——速度——做出智能的猜测。

但这里才是最美妙的部分。这不仅仅是一个被动的猜测。观测器会主动自我修正。它将根据其猜测期望看到的输出与传感器实际报告的输出进行比较。任何差异都是一个“新息”，一条新的信息，告诉观测器它的猜测有误。设计的精妙之处在于，我们工程师可以选择观测器增益 $L$ ，来精确地决定观测器如何对这个误差做出反应。通过选择误差动力学的极点，我们实际上是在决定我们估计器的“个性”。我们是希望它具有侵略性，迅速将估计值拉向真相，但有超调的风险？还是希望它平滑而谨慎，像一个能快速稳定且无振荡的临界阻尼弹簧？只要系统是能观的，我们就有能力设计我们自身不确定性的动力学，迫使我们的估计误差以我们期望的任何速率消失（,）。

此外，我们可以做到高效。如果一个传感器给了我们一个直接、清晰的某个状态的测量值——比如说，一个热过程中某个组件的温度——就没有必要构建一个复杂的机制来估计它。我们可以设计一个降阶观测器，它将所有精力集中在猜测那些仍然隐藏的状态上，然后简单地将其估计值与我们已知状态结合起来，得到一幅完整的图像（）。这是该理论实用性的一个优雅证明。

分离原理：控制理论的“奇迹”

现在我们来谈一个更深刻、更具启发性的应用。我们有一个需要完整状态的控制器，还有一个提供该状态估计值的观测器。显而易见的做法是，将观测器的输出直接输入到控制器中。原本设计为 $u(t) = -Kx(t)$ 的控制律变成了 $u(t) = -K\hat{x}(t)$ 。

这看起来很简单，但它提出了一个可怕的问题：这样做还行得通吗？或者更重要的是，这样做最优吗？我们设计控制器增益 $K$ 时，假设我们拥有完美的状态 $x(t)$ 。现在我们给它的是一个可能存在缺陷的估计值 $\hat{x}(t)$ 。估计中的误差会导致控制器行为失常，甚至可能使整个系统变得不稳定吗？

在线性系统以及特定类型的噪声和代价函数（即所谓的LQG问题，即线性二次高斯问题）的背景下，答案是一个惊人而优美的“不”。这种组合工作得非常完美。这就是著名的分离原理。它指出，你可以完全分开地解决控制问题和估计问题。首先，你假装可以访问真实状态，并设计出最好的控制器（这是LQR问题）。然后，你完全忘记控制器，设计出最好的状态估计器（这就是卡尔曼滤波器）。最后，你只需将估计器的输出连接到控制器的输入，得到的系统就是最优的输出反馈控制器。

这几乎像一个奇迹。控制器设计怎么可能不需要知道估计值有多大的噪声，而估计器设计又怎么可能不需要知道控制目标是什么？其数学论证堪称精美绝伦（）。当你写下你试图最小化的总代价时，它奇迹般地分裂成两个独立的项：一部分只依赖于控制器增益 $K$ ，另一部分只依赖于估计器增益 $L$ （）。你可以最小化其中一个而不影响另一个。“控制的代价”是你拥有完美信息时需要付出的代价，而“估计的代价”是你为不确定性付出的额外代价。为了获得最佳的整体结果，你只需将每个部分在各自的领域里做到最好。这种分离是所有工程学中最强大、最优雅的成果之一，它使得为磁悬浮执行器和航空航天飞行器等复杂应用构建高性能控制系统成为可能。

从线性到混乱的现实世界

当然，现实世界很少是线性的，也绝不会没有噪声。这正是卡尔曼滤波器及其后代真正大放异彩的地方。对于一个受到高斯随机噪声冲击的线性系统，卡尔曼滤波器是可证明的最优估计器。它就像一个学会了统计学的龙伯格观测器。在每一步，它都将其预测与新的测量值融合，并根据各自的置信度对它们进行加权。这种融合的关键是卡尔曼增益矩阵 $K_k$ 。这个矩阵的维度本身就讲述了一个关于信息流动的故事。如果你正在估计一个自平衡独轮车的角度和角速度，但只有一个角度传感器，你的卡尔曼增益将是一个 $2 \times 1$ 的矩阵。它描述了单一的测量信息（角度）如何被用来更新你的两个信念（对角度的估计和对速度的估计）（）。

但如果系统是非线性的呢？如果你正在追踪一个在流体中移动的探测器，其阻力与速度的平方成正比（）？卡尔曼滤波器的优雅方程不再直接适用。解决方案既务实又巧妙：扩展卡尔曼滤波器（EKF）。其思想是在每一个时间步，围绕当前的最佳估计对系统进行线性化。你基本上是在告诉滤波器：“我知道世界是弯曲的，但如果我现在只看其中一小块，它看起来是相当平坦的。”通过用一系列切线（或切面）来代替真实的非线性动力学，我们可以使用线性卡尔曼滤波器的强大机制，更新我们的估计，然后在我们新的、更优的估计位置重新进行线性化。这是微积分力量的证明，也是从GPS导航到机器人技术等各个领域都在使用的基本技术。

现实世界还会带来其他难题，比如外部干扰。一阵突如其来的风击中了你的无人机，或者一个电压尖峰冲击了你的电路。这种干扰直接影响了真实状态，但没有直接影响观测器的模型。结果呢？干扰“泄漏”到了估计误差中，进而污染了控制信号（）。因此，一个完整的设计不仅要考虑随机噪声，还必须考虑如何使估计器对这些确定性的、且常常不可预测的外部事件具有鲁棒性。

前沿：从机器到生命与网络

状态估计的力量是如此基础，以至于其应用远远超出了传统的机械和电气工程。以合成生物学领域为例，科学家们设计微生物群落来生产生物燃料或充当生物传感器。反应器中不同物种之间的相互作用是复杂的、非线性的，并且无法直接观察。你可以进行测量——比如总生物量或荧光蛋白的浓度——但你无法计算每一个细菌。通过用非线性方程（如Lotka-Volterra模型）对种群动态进行建模，生物学家可以使用扩展卡尔曼滤波器，从他们可以进行的测量中估计出每个物种隐藏的种群数量（）。在这里，“状态”不是位置和速度，而是生物群落的兴衰。其原理是完全相同的。

最后，状态估计是现代信息物理系统和物联网（IoT）的核心。想象一下一个通过无线网络远程控制的机械臂。运行在本地计算机上的观测器可以完美地访问机器人的传感器。它生成一个状态估计，并通过网络发送给主控制器。但如果网络不可靠，数据包丢失了怎么办（）？当一个数据包丢失时，控制器收不到新的信息。在这种情况下，优美的分离原理开始失效。估计误差的动力学仍然是清晰和确定性的，但机器人状态的动力学却变成了随机的——它们现在依赖于丢包的随机过程。整个系统的稳定性和性能不再仅仅取决于控制器和观测器，还取决于通信信道的质量。为这些网络化系统分析和设计估计器是当前一个活跃而关键的研究领域，对于自动驾驶汽车、远程手术和智能电网的未来至关重要。

从在简单的机械系统中构筑我们自己的确定性，到窥探生命共同体的隐藏状态，再到应对我们网络化世界的不完美，状态估计器远不止是一个工具。它是一个普适的透镜，用以理解和控制一个永远都部分隐藏在我们视野之外的世界。