极点配置观测器

玻尔百科

定义

极点配置观测器是控制工程中一种用于估计不可测系统状态的工具，也被称为龙伯格观测器，它通过将并行模型与实际系统测量值进行对比修正来实现状态估计。在系统满足完全可观测性的前提下，设计者可以通过极点配置来设定误差收敛特性。根据分离原理，观测器与控制器可以进行独立设计，但设计过程中需要在快速收敛速度与对测量噪声的鲁棒性之间进行权衡。

核心要点

Luenberger 观测器通过与实际系统并行运行一个模型，并利用测量误差对其进行校正，来估计不可测量的系统状态。
极点配置允许设计者选择观测器的误差收敛特性，但这项能力取决于系统是否完全可观测。
分离原理使得控制器和观测器的设计可以独立进行，它们各自的极点共同构成了整个系统的极点。
观测器设计涉及一个关键的权衡：快速收敛会放大测量噪声，而对噪声的鲁棒性则会导致响应变慢。
对偶原理在观测器设计（估计）和控制器设计（控制）之间建立了数学等价关系，将可观测性与可控性的概念联系起来。

引言

在工程与科学领域，从引导航天器到管理电网，我们常常面临一个关键挑战：我们无法测量所有需要控制的量。关键的系统变量，即“状态”，可能隐藏在我们的传感器之外。为解决这个问题，我们必须构建一个数学上的“虚拟传感器”——状态观测器，它能根据可用的测量值智能地推断出这些隐藏值。然而，仅仅模拟系统是不够的；任何微小的差异或外部干扰都可能导致我们的模拟偏离现实，使其估计变得毫无用处。

本文将深入探讨解决此问题最基本且最强大的方法之一：极点配置观测器。在“原理与机制”一章中，我们将探索 Luenberger 观测器如何利用测量反馈将系统模型锚定于现实。您将学习到极点配置如何赋予我们决定估计误差行为的能力，并发现其关键前提——可观测性。随后，“应用与跨学科联系”一章将阐明估计与控制之间深刻的对偶性，讨论噪声和模型不完美性带来的实际挑战，并揭示观测器作为通往自适应控制、最优控制和机器学习等高级领域的门户所扮演的角色。

原理与机制

您是否曾试过在手掌上平衡一根长杆？您会盯着杆的顶端。如果它开始倾斜，您会本能地移动手来抵消其下落。在此过程中，您扮演的是一个反馈控制器的角色。但您在测量什么呢？您不只是在看杆的角度，您还在直观地感知其变化率——它的角速度。您的大脑就像一个观测器，接收可用的测量值（视觉角度），并对系统的完整状态（角度和角速度）建立内部估计。这正是我们在几乎所有现代控制问题中面临的挑战，从引导火箭到管理电网：我们很少能测量到所有需要知道的信息。我们必须构建一个“虚拟传感器”——一个能智能地估计系统隐藏状态的数学构造。这就是状态观测器的世界。

构建数字孪生：Luenberger 观测器

您会如何着手构建这样一个估计器呢？20 世纪 60 年代，David Luenberger 提出了一个极为简洁而强大的思想。假设我们有一个物理系统，其行为由一组已知的规则支配，我们可以将其写成状态空间模型：

\dot{x}(t) = Ax(t) + Bu(t)

这里， $x(t)$ 代表我们系统的真实状态（如杆的角度和速度）， $u(t)$ 是我们施加的控制输入（我们手的移动），而矩阵 $A$ 和 $B$ 定义了系统的物理特性。

一个自然的第一步是在计算机上构建该系统的仿真——一个“数字孪生”。我们可以为我们的估计状态 $\hat{x}(t)$ 写一个方程：

\dot{\hat{x}}(t) = A\hat{x}(t) + Bu(t)

这个模型与真实系统并行运行，使用相同的控制输入 $u(t)$ 。但这里有个问题。如果我们最初的猜测 $\hat{x}(0)$ 是错误的怎么办？或者，如果一阵微风——一个我们模型中没有的扰动——推动了真实系统该怎么办？我们的仿真在其自身的完美世界中运行，对此将一无所知。估计误差 $e(t) = x(t) - \hat{x}(t)$ 将会持续存在甚至增长。我们的数字孪生将逐渐偏离现实。

为了解决这个问题，我们需要将我们的仿真锚定到现实世界。我们有一个真实的传感器，提供测量值 $y(t) = Cx(t)$ 。我们可以让我们的仿真自己预测传感器应该读到什么： $\hat{y}(t) = C\hat{x}(t)$ 。这两者之差 $y(t) - \hat{y}(t)$ 是一条极其宝贵的信息。它就是“预测误差”，准确地告诉我们仿真的世界观偏离了多远。Luenberger 观测器的天才之处在于将这个误差用作一个持续的校正项。我们将这个误差反馈到我们的仿真中，推动它向真实值靠拢：

\dot{\hat{x}}(t) = A\hat{x}(t) + Bu(t) + L(y(t) - C\hat{x}(t))

新增的项 $L$ 是观测器增益。它是一个我们可以调节的旋钮矩阵。如果预测误差很大，项 $L(y - \hat{y})$ 会施加一个强烈的校正。如果预测是完美的，校正项则为零。增益 $L$ 决定了我们在多大程度上信任测量值，以及我们以多大的力度校正我们的估计。

误差动态：一个自成一体的系统

这个设计很优雅，但它有效吗？为了找出答案，我们必须研究我们唯一真正关心的事情：估计误差 $e(t) = x(t) - \hat{x}(t)$ 。我们希望这个误差能迅速消失。让我们通过考察其导数 $\dot{e}(t) = \dot{x}(t) - \dot{\hat{x}}(t)$ 来看看这个误差是如何演变的。通过代入真实系统和我们观测器的方程，一个代数上的小奇迹发生了：

\dot{e}(t) = (A x + B u) - (A \hat{x} + B u + L(C x - C \hat{x}))

\dot{e}(t) = A(x - \hat{x}) - LC(x - \hat{x})

\dot{e}(t) = (A - LC)e(t)

仔细看这个最终方程。这是控制理论中最优美的结果之一。估计误差的动态完全构成了一个自成一体的系统！误差的演变只取决于当前的误差，而与控制输入 $u(t)$ 或真实状态 $x(t)$ 无关。这意味着让误差趋于零的问题与控制系统本身的问题是完全分离的。这就是著名的分离原理的核心。我们可以独立地设计我们的控制器（选择增益 $K$ ）和我们的观测器（选择增益 $L$ ），然后将它们组合在一起，并确信整个系统会正常工作。组合系统的特征行为（其极点）将简单地是控制器极点和观测器极点的并集。

选择的力量：极点配置

误差动态 $\dot{e}(t) = (A - LC)e(t)$ 将是稳定的，如果矩阵 $(A - LC)$ 的所有特征值都具有负实部。一个系统的特征值就像它的基频或行为模式；它们决定了系统如何随时间响应。我们称这些为观测器极点。通过选择增益矩阵 $L$ ，我们直接改变了矩阵 $(A-LC)$ ，从而移动了它的特征值。这被称为极点配置。

这是一种极其强大的能力。我们不只是确保误差趋于零；我们可以指定它如何趋于零。对于一个机械振荡器，我们可能希望估计误差在不振荡的情况下尽快衰减——即“临界阻尼”响应。或者，根据经验法则，我们可能要求我们的观测器比被控对象的自然动态快五倍左右，以确保估计值总是领先于它所跟踪的系统。

例如，如果我们有一个二阶系统，并希望观测器极点位于 $s = -p_1$ 和 $s = -p_2$ ，我们的目标特征多项式是 $(s+p_1)(s+p_2) = s^2 + (p_1+p_2)s + p_1p_2$ 。我们可以计算出 $(A-LC)$ 的实际特征多项式，用 $L$ 中的未知增益表示，它可能看起来像 $s^2 + (c_1 + l_1)s + (c_2 + l_2)$ 。通过简单地匹配系数，我们就可以解出所需的增益 $l_1$ 和 $l_2$ ，从而将极点精确地放置在我们想要的位置。我们就成为了误差动态的主人。

前提条件：可观测性

我们是否总能将观测器极点放置在任何我们想要的位置？答案是响亮的“不”，其原因触及了估计的本质。想象一个系统有一个隐藏的内部缺陷。假设一个组件正在不稳定地振动，但由于系统构造的巧合，这种振动对您正在观察的传感器完全没有产生任何影响。输出看起来完全平静，而在内部，一个状态正在无界地增长。这是一种不可观测的模式。因为这个模式对于输出 $y(t)$ 是不可见的，无论我们对输出进行何种处理，无论我们选择的增益 $L$ 多么巧妙，都无法告诉我们那个隐藏状态在做什么。我们估计误差中对应于此模式的分量将根据其自身的不稳定动态演变，完全不受我们反馈的影响。我们的观测器将失效，误差将增长至无穷大。

这个思想通过可观测性的概念被形式化。如果通过在有限时间内观察其输出 $y(t)$ ，我们能够唯一地确定其初始状态 $x(0)$ ，那么这个系统就是可观测的。如果一个系统是完全可观测的，我们就有能力将所有的观测器极点放置在我们喜欢的任何地方。如果不是，它的一些模式将对输出隐藏。

卡尔曼分解的数学为此提供了一幅美丽的图景。任何系统在概念上都可以被分成四个部分，但对我们而言，可以看作两部分：可观测部分和不可观测部分。观测器增益 $L$ 只能影响可观测部分的动态。与不可观测部分相对应的特征值是“固定的”，无论我们选择什么样的 $L$ ，它们都将作为极点出现在我们的误差动态中。如果这些固定的、不可观测的极点中有任何一个是不稳定的（位于复平面的右半部分），那么从根本上就不可能构建一个稳定的 Luenberger 观测器。这就是为什么可观测性测试，如检查可观测性矩阵的秩或使用 Popov-Belevitch-Hautus (PBH) 测试，是任何观测器设计中至关重要的第一步。

对偶之美：其工作原理

可观测性与极点配置能力之间的联系并非巧合。它源于线性系统数学中一种深刻而优美的对称性：对偶原理。

考虑两个独立的问题：

观测器设计： 我们有一个由 $(A, C)$ 定义的系统，我们想选择一个增益 $L$ 来配置 $(A-LC)$ 的极点。我们刚刚学到，这当且仅当 $(A, C)$ 是可观测的时才可能实现。
控制器设计： 我们有另一个由 $(A^T, C^T)$ 定义的系统，我们想选择一个反馈增益 $K$ 来配置 $(A^T - C^T K)$ 的极点。状态反馈控制的基本定理指出，这当且仅当对偶系统 $(A^T, C^T)$ 是可控的时才可能实现。

神奇之处在于：我们观测器矩阵的特征多项式 $\det(sI - (A-LC))$ 与其转置的特征多项式 $\det(sI - (A^T - C^T L^T))$ 完全相同。如果我们简单地设置控制器增益 $K = L^T$ ，这两个问题在数学上就变得完全相同！此外，控制问题的条件，即 $(A^T, C^T)$ 的可控性，在数学上等价于我们观测器问题的条件，即 $(A, C)$ 的可观测性。

这种惊人的对应关系意味着，我们为设计控制器所拥有的每一个结果、每一种算法和每一份直觉，都可以通过“对偶化”直接应用于设计观测器。可观测性之于估计，正如可控性之于控制。

工程师的困境：极点应置于何处？

知道了我们可以将极点放置在任何地方，我们便面临一个实际问题：我们应该将它们放在哪里？答案在于权衡两个基本的折衷。

1. 速度与噪声敏感性

让我们再次审视误差动态，但这一次，我们要承认真实世界的测量是有噪声的。我们测量的输出实际上是 $y_m(t) = Cx(t) + v(t)$ ，其中 $v(t)$ 是测量噪声。误差动态变为：

\dot{e}(t) = (A - LC)e(t) - Lv(t)

为了使我们的观测器快速——即让误差迅速衰减——我们需要将 $(A-LC)$ 的极点放置在复平面的左侧深处。这通常需要我们的增益矩阵 $L$ 中有较大的值。但请看上面的方程：噪声 $v(t)$ 在进入我们的估计器之前被乘以 $L$ 。一个大的增益 $L$ 就像一个测量噪声的强力放大器。我们面临一个经典的工程妥协：

快速极点 (大 $L$ )： 从初始误差中快速收敛，但估计值会抖动，对传感器噪声敏感。
慢速极点 (小 $L$ )： 平滑、抗噪声的估计，但在校正误差时会反应迟钝。

让观测器“任意快”是一个诱人但危险的幻想；它不可避免地导致系统被噪声主导。

2. 观测器速度与控制器性能

分离原理保证了观测器和控制器的极点是独立的集合。然而，这并不意味着观测器的性能对被控对象的行为没有影响。控制律是 $u(t) = -K\hat{x}(t)$ 。代入 $\hat{x} = x - e$ ，我们得到 $u(t) = -Kx(t) + Ke(t)$ 。真实状态的动态实际上是：

\dot{x}(t) = (A-BK)x(t) + BKe(t)

估计误差 $e(t)$ 对我们的受控系统起到了一个驱动扰动的作用！如果观测器很慢， $e(t)$ 将会很大且持续存在，导致实际状态 $x(t)$ 显著偏离其期望路径，通常会导致大的超调——这种现象被称为“峰值”。

为了恢复我们用理想状态反馈设计的性能，估计误差 $e(t)$ 必须比系统自身的响应时间快得多地消失。这给我们带来了一个关键的经验法则：观测器极点应该比控制器极点快。 一个常见的指导方针是将观测器极点设置得比主导控制器极点快大约 2 到 6 倍。这确保了估计值对于控制器来说“足够好，足够快”，而又不会因为太快而被测量噪声所削弱。这是一个微妙的平衡，找到这个谱系上的正确位置是控制工程的真正艺术所在。

应用与跨学科联系

掌握了极点配置观测器的设计原理后，我们现在踏上了一段更激动人心的旅程。我们将超越教科书示例的纯净范畴，去看看这个优雅的数学工具如何在混乱、复杂而迷人的现实世界中找到其用武之地。您会发现，一个伟大科学思想的力量不仅在于其内部的一致性，还在于其联系的广度以及它所开启的新视角。观测器就是这样一个思想，其应用揭示了工程与科学领域一种美妙的统一性。

控制与估计的美妙对偶性

现代控制理论中最深刻的见解之一是对偶原理。乍一看，控制一个系统和估计其状态似乎是不同的问题。一个是关于影响世界（控制），另一个是关于感知世界（估计）。然而，事实证明它们是同一枚数学硬币的两面。

想象你正在为一个具有动态矩阵 $A$ 和输入矩阵 $B$ 的系统设计一个状态反馈控制器。你的目标是找到一个增益 $K$ 以将由 $A-BK$ 决定的闭环系统的极点放置在期望的位置。现在，考虑为具有动态矩阵 $A^T$ 和输出矩阵 $C^T$ 的系统设计一个 Luenberger 观测器。寻找观测器增益 $L$ 以放置由 $A-LC$ 决定的观测器误差极点的问题，在数学上等同于为“对偶”系统 $(A^T, C^T)$ 寻找控制器增益。为同一组期望极点计算控制器增益和观测器增益涉及一组惊人平行的计算。这并非纯粹的巧合；它是线性系统结构中一种深刻的对称性，是抽象化统一力量的证明。

这种美妙的理论对称性带来了一个强大的实际后果，即分离原理。由于控制和估计问题是对偶的，我们可以分别解决它们。我们可以首先设计一个状态反馈控制器，就好像真实状态是可用的一样，将系统极点放置在我们希望的任何位置。然后，我们可以设计一个 Luenberger 观测器来估计状态，将观测器的误差极点放置在我们希望的任何位置。当我们把观测器连接到控制器（使用估计状态 $\hat{x}$ 而不是真实状态 $x$ ）时，得到的组合系统正如我们所期望的那样工作：它的极点集合就是控制器极点和观测器极点的并集。这种模块化的设计理念是现代工程的基石。它使我们能够将一个复杂问题分解为两个更小、更易于管理的问题，这一策略在设计从飞行控制器到机器人系统的各种事物中都是不可或缺的。

观测器在充满不完美的世界中

现实世界并非我们方程式中那种纯净的环境。它充满了噪声、延迟和偏差。观测器的一个关键应用是帮助我们应对这些不完美之处，使其从一个简单的状态估计器转变为一个用于信号处理和系统辨识的多功能工具。

一个绝佳的例子是估计那些甚至不属于系统物理状态的东西。想象一个传感器，比如压力计或加速度计，它有一个持续存在的未知偏移或偏差。这个偏差污染了我们获取的每一次测量。我们如何找到并移除它呢？我们可以耍一个聪明的花招：我们对系统的状态进行增广。通过将偏差 $b$ 定义为一个额外的状态变量，其动态就是简单的 $\dot{b}=0$ （因为它是常数），我们可以为这个新的增广系统设计一个观测器。这个观测器不仅会估计被控对象的物理状态，还会提供对偏差本身的实时估计。这项技术被广泛用于仪器的在线校准、消除电子信号中的直流偏移以及在导航系统中估计传感器漂移。

然而，在现实世界中使用观测器伴随着一个至关重要的警示。人们很容易认为“更好”的观测器总是“更快”的——即其误差极点被放置在复平面左半部分的很远处，以确保快速收敛。但这种直觉可能是危险的错误。我们对世界的模型永远不会是完美的。它们可能会忽略微小的时间延迟，比如数字传感器管道中的单样本延迟。当一个高增益（快速）观测器遇到这种未建模的延迟时，它可能会变得不稳定。观测器试图基于延迟的信息积极地校正其估计，结果却陷入了“追逐自己尾巴”的境地。基于这个有缺陷的估计的控制动作可能会与系统的需求异相到达，从而向振荡中注入能量而不是抑制它们。此外，高增益观测器会放大任何测量噪声，并将其注入控制回路。这揭示了一个基本的权衡：观测器性能与对模型不确定性和噪声的鲁棒性。设计的智慧不在于让观测器尽可能快，而在于使其足够快，同时尊重我们对系统知识的局限性。

前沿与跨学科联系

极点配置观测器不是终点，而是通往控制、优化和机器学习等更高级主题的门户。它的概念在许多其他领域中都有回响。

在自适应控制中，我们经常处理参数未知且必须“在线”学习的系统。观测器是一个关键组件，为自适应算法提供所需的状态估计。然而，又出现了另一个微妙的权衡。如果一个高增益观测器在其状态估计中产生瞬态“峰值”，而自适应算法又太快（即学习率高），参数估计可能会被严重扰乱，甚至可能导致整个系统失稳。为了避免这种“峰值现象”，需要进行时间尺度分离：观测器必须足够快以提供良好的估计，但自适应过程必须足够慢以对观测器的初始瞬态进行平均。这种相互作用是设计安全可靠的学习系统的核心。

极点配置允许我们将极点放置在任何我们喜欢的地方，但它并没有告诉我们最佳位置在哪里，尤其是在存在随机噪声时。这就是它与最优控制的联系所在。例如，线性二次高斯（LQG）框架为最优观测器——著名的卡尔曼滤波器——提供了一套方案。它以一种在高斯白噪声存在下最小化平均平方估计误差的方式来放置极点。将极点配置设计与同一系统的 LQG 设计进行比较，突显了在指定期望的瞬态响应（极点配置）和为随机性能进行优化（LQG）之间的权衡。

如果我们不知道噪声的统计特性，但我们知道它的能量是有界的呢？这就引出了鲁棒控制和 $H_{\infty}$ 设计的世界。在这里，目标是设计一个能够最小化任何可能扰动下的最坏情况估计误差的观测器。这种鲁棒设计理念确保了有保证的性能边界，这在安全关键应用中是一项关键要求。这类问题通常被表述为涉及线性矩阵不等式（LMI）的凸优化问题，将经典控制理论与现代优化的前沿联系起来。

最后，即使在极点配置的数学内部，也存在一些微妙之处，暗示了线性系统的深层结构。对于单输出系统，虽然我们可以放置重根极点，但我们不能自由选择由此产生的动态的几何结构。对于任何重根特征值，系统都被约束为只有一个对应的若尔当块。这不是一个需要克服的限制，而是一个需要理解的基本属性，让我们得以一窥支配着我们试图控制的动态世界的优雅而严谨的规则。

从其与控制的优雅对偶性，到其作为现代自适应和鲁棒系统基石的角色，极点配置观测器远不止是一个简单的估计器。它是一个镜头，通过它我们可以更好地感知世界；一个工具，用以管理世界的不完美；也是我们追求设计智能可靠系统过程中的一个基本构建块。