伴随矩阵的性质

玻尔百科

定义

伴随矩阵的性质指线性代数中关于矩阵与其伴随矩阵之间关系的数学规律，其核心基于矩阵与伴随矩阵之积等于行列式与单位矩阵之积的基础恒等式。这些性质为求逆矩阵提供了显式公式，并揭示了当原矩阵为奇异矩阵时伴随矩阵在秩和结构上的变化特征。伴随矩阵的性质通过量化系统敏感度和提高计算效率，将抽象代数理论与工程应用领域紧密联系在一起。

核心要点

伴随矩阵性质的基石是基本恒等式： $A \cdot \text{adj}(A) = \det(A) \cdot I$ 。
伴随矩阵为矩阵的逆提供了一个显式公式： $A^{-1} = \frac{1}{\det(A)} \cdot \text{adj}(A)$ 。
对于一个秩为 n-1 的奇异矩阵 A，其伴随矩阵 adj(A) 是一个由 A 和 Aᵀ 的零空间构成的秩为 1 的矩阵。
伴随矩阵揭示了深层的结构信息，通过量化系统敏感性和实现计算效率，将抽象代数与应用领域联系起来。

引言

对许多人来说，矩阵的伴随矩阵（或称古典伴随矩阵）似乎仅仅是一个计算上的奇特之物——一个用于推导矩阵求逆公式的踏脚石，除此之外便被归入线性代数的附录。然而，这种观点忽略了其深刻的结构意义。伴随矩阵不仅仅是一个计算过程，它更是一面透镜，揭示了矩阵的内在特性，从其可逆性到其在复杂变换下的行为。本文旨在通过将伴随矩阵从一个简单的工具提升为一个统一代数、几何和应用科学的核心概念，来弥补这一知识空白。

本文将通过两个核心章节引导您更深入地理解伴随矩阵。在“原理与机制”一章中，我们将从连接矩阵、其伴随矩阵和行列式的优雅基本恒等式开始。从这一个方程出发，我们将揭示其所有主要性质，包括著名的矩阵求逆公式、它们行列式之间的关系，以及伴随矩阵揭示矩阵零空间的奇异矩阵这一引人入胜的情形。接下来，“应用与跨学科联系”一章将把这些理论见解付诸实践，展示它们在现实世界中的力量。我们将看到伴随矩阵如何描述对称性和物理不变量，如何确保从数论到控制系统等领域的结构完整性，并提供关键的计算捷径，从而使大规模科学模拟成为可能。

原理与机制

现在我们已经了解了伴随矩阵，你可能会认为它只是一个计算上的奇特之物——一个计算子矩阵行列式的繁琐练习。但事实远非如此！伴随矩阵不仅仅是一堆数字，它是更深入理解矩阵本身的关键。它就像一个影子，揭示了投射它的物体的内在特性和行为。要看到这一点，我们必须从线性代数中最优雅、最强大的恒等式之一开始。

矩阵之影：基本恒等式

对于任何大小为 $n \times n$ 的方阵 $A$ ，矩阵 $A$ 、其伴随矩阵 $\text{adj}(A)$ 和其行列式 $\det(A)$ 之间存在一种惊人地简洁的关系。这个关系是：

A \cdot \text{adj}(A) = \text{adj}(A) \cdot A = \det(A) \cdot I_n

其中 $I_n$ 是 $n \times n$ 的单位矩阵。

让我们停下来欣赏一下这个公式告诉我们什么。当您将一个矩阵乘以它的伴随矩阵——这个由代数余子式构成的看似复杂的构造——结果并不是某个新的复杂矩阵。相反，您得到的是最简单的对角矩阵：单位矩阵，其中每个对角线元素都只是 $A$ 的行列式。就好像伴随矩阵扮演了一个完美的“反矩阵”的角色，抵消了 $A$ 所有的非对角线复杂性，只留下了其本质的标量精髓——行列式。这一个优美的恒等式是解开伴随矩阵所有秘密的罗塞塔石碑。

从这个恒等式，我们可以立即推导出一个著名的结果。让我们问问乘积 $\det(A \cdot \text{adj}(A))$ 的行列式会是什么。利用我们的恒等式和行列式的一个标准性质 ( $\det(c B) = c^n \det(B)$ )，我们可以在不知道矩阵 $A$ 任何一个元素的情况下推导出答案。对于一个 $3 \times 3$ 的矩阵，若 $\det(A) = 2$ ，我们发现 $\det(A \cdot \text{adj}(A)) = \det(2 \cdot I_3) = 2^3 \det(I_3) = 8$ 。这是我们中心恒等式的一个直接而优美的推论。

可逆世界：逆矩阵的配方

我们的基本恒等式的第一个也是最著名的应用是求矩阵的逆。如果一个矩阵 $A$ 是可逆的，我们知道它的行列式非零，即 $\det(A) \neq 0$ 。看到我们的恒等式 $A \cdot \text{adj}(A) = \det(A) \cdot I_n$ ，一个想法应该会跃入你的脑海。如果我们只是将两边都除以标量 $\det(A)$ ，我们会得到：

A \cdot \left( \frac{1}{\det(A)} \text{adj}(A) \right) = I_n

这个方程的形式与逆的定义 $A \cdot A^{-1} = I_n$ 完全相同。所以，我们找到了它——一个适用于任何矩阵的逆的概念性公式：

A^{-1} = \frac{1}{\det(A)} \text{adj}(A)

这个公式意义深远。它告诉我们，一个矩阵的逆实际上只是其伴随矩阵经过重新缩放的结果。

让我们在一个非常优雅的场景中看看它的实际应用。考虑一个正交矩阵 $M$ 。这些矩阵代表空间中的纯粹旋转和反射——即保持长度和角度的变换。一个定义性的属性是它们的逆就是它们的转置，即 $M^{-1} = M^T$ ，并且它们的行列式总是 $1$ 或 $-1$ 。现在，假设你有一个 $4 \times 4$ 的正交矩阵 $M$ 代表一个反射，所以它的行列式是 $-1$ 。它的伴随矩阵是什么？使用我们的新公式：

\text{adj}(M) = \det(M) \cdot M^{-1} = (-1) \cdot M^T = -M^T

多么简单！对于这个几何上如此基本的矩阵，伴随矩阵的复杂机制简化为仅仅是其负转置。

矩阵、其伴随矩阵和其逆之间的关系如此紧密，以至于如果你知道其中任意两个，你就可以找到第三个。想象你是一位密码学家，密钥，一个可逆矩阵 $A$ ，已经丢失了。你只有一个日志文件，其中包含它的行列式和伴随矩阵。你是不是就束手无策了？完全不是！从 $\text{adj}(A) = \det(A) A^{-1}$ ，我们可以找到 $A^{-1}$ ，然后简单地将其求逆以恢复 $A$ 。实际上，通过一个优美的恒等式 $\text{adj}(\text{adj}(A)) = (\det A)^{n-2} A$ 存在一条更直接的路径，它直接从伴随矩阵本身得到 $A$ 。

双行列式记

我们的中心恒等式引出了另一个问题：伴随矩阵本身的行列式是什么？让我们对 $A \cdot \text{adj}(A) = \det(A) \cdot I_n$ 的两边取行列式：

\det(A) \cdot \det(\text{adj}(A)) = \det(\det(A) \cdot I_n) = (\det A)^n

如果 $A$ 是可逆的，我们可以用 $\det(A)$ 去除，得到一个惊人地简单的缩放定律：

\det(\text{adj}(A)) = (\det A)^{n-1}

伴随矩阵的行列式就是原始[矩阵行列式](@article_id:303413)的 $n-1$ 次方。这种关系是严格且可预测的。如果你知道一个 $3 \times 3$ 矩阵 $A$ 的行列式是 $d$ ，那么它的伴随[矩阵的行列式](@article_id:303413)必须是 $d^2$ 。

但是如果矩阵是奇异的，即 $\det(A) = 0$ 呢？该公式似乎表明 $\det(\text{adj}(A)) = 0^{n-1} = 0$ ，对于 $n \ge 2$ 这确实是正确的。然而，这正是故事变得真正有趣的地方。一个零值可以隐藏大量的结构。

在奇异性的边缘：秩为1之美

当一个矩阵是奇异的，它没有逆。它将一些非零向量映射到零向量——这些向量构成了它的零空间。我们的基本恒等式 $A \cdot \text{adj}(A) = \det(A) \cdot I_n$ 变成了非常不同且深刻的东西：

A \cdot \text{adj}(A) = 0 \cdot I_n = \mathbf{0}

这个方程表明，当你将变换 $A$ 应用于其伴随矩阵的任何一列时，结果都是零向量。换句话说， $\text{adj}(A)$ 的每一列都位于 $A$ 的零空间内。

现在，让我们考虑最微妙的奇异情况：一个大小为 $n \times n$ 的矩阵 $A$ ，其秩恰好为 $n-1$ 。这个矩阵是奇异的，但只是勉强如此。它以最微小的差距未能成为可逆矩阵。根据秩-零度定理，其零空间的维数为 1。

因此，如果 $\text{adj}(A)$ 的每一列都必须位于这个一维零空间内，那么它的所有列都必须是单个基向量的标量倍。这意味着关于伴随矩阵本身的秩有某些非凡之处：它的秩最多为 1。秩有没有可能为 0？那将意味着 $\text{adj}(A)$ 是零矩阵。这只在 $A$ 的所有 $(n-1) \times (n-1)$ 子式都为零时才会发生，而这将暗示 $A$ 的秩小于 $n-1$ 。但我们开始时假设秩恰好是 $n-1$ ！因此，至少有一个子式必须非零，这意味着 $\text{adj}(A)$ 不是零矩阵。

我们得出了一个惊人的结论：对于任何秩为 $n-1$ 的矩阵 $A$ ，其伴随矩阵 $\text{adj}(A)$ 是一个秩为1的矩阵。这个处于可逆性边缘的矩阵 $A$ ，其复杂的伴随矩阵坍缩成了最简单的非零形式。

我们还可以更深入。不仅秩是 1，而且我们可以以惊人的精度描述其结构。我们看到 $A \cdot \text{adj}(A) = \mathbf{0}$ ，这将 $\text{adj}(A)$ 的列置于 $A$ 的零空间（我们称其基向量为 $x$ ）。该恒等式的另一半， $\text{adj}(A) \cdot A = \mathbf{0}$ ，告诉我们 $\text{adj}(A)$ 的行必须位于 $A$ 的左零空间（即 $A^T$ 的零空间；我们称其基向量为 $y$ ）。一个列都是 $x$ 的倍数、行都是 $y^T$ 的倍数的秩 1 矩阵必须采取外积的形式：

\text{adj}(A) = c \cdot x y^T

对于某个非零标量 $c$ 。这是最终的启示。伴随矩阵不是一个任意的秩 1 矩阵；它是由 $A$ 及其转置的零空间的基向量直接构建的。伴随矩阵架起了一座桥梁，将逆（不存在）的概念与导致其不存在的原因——零空间——联系起来。

游戏规则：性质与运算

最后，伴随矩阵在常见的矩阵运算下表现出可预测且优雅的行为，这进一步巩固了它与矩阵结构的深层联系。

转置： 转置的伴随矩阵是伴随矩阵的转置： $\text{adj}(A^T) = (\text{adj}(A))^T$ 。一个直接的推论是，如果一个矩阵 $A$ 是对称的（ $A = A^T$ ），那么它的伴随矩阵也必须是对称的。结构得以保留。
乘积： 乘积的伴随矩阵 $\text{adj}(AB)$ 呢？就像逆和转置一样，顺序是相反的：
$\text{adj}(AB) = \text{adj}(B) \cdot \text{adj}(A)$
我们可以通过查看可逆矩阵的逆公式来理解其原因： $\text{adj}(AB) = \det(AB)(AB)^{-1} = \det(A)\det(B)B^{-1}A^{-1} = (\det(B)B^{-1})(\det(A)A^{-1}) = \text{adj}(B)\text{adj}(A)$ 。这个规则即使对于奇异矩阵也成立，体现了一个基本的代数真理。
标量乘法： 对于一个标量 $c$ ， $\text{adj}(cA) = c^{n-1}\text{adj}(A)$ 。这种缩放行为与行列式和代数余子式的工作方式完全一致。

这些性质中的每一个都强化了这样一个观点：伴随矩阵不是线性代数的附带品。它是一个核心角色，被编织在矩阵工作方式、它们如何被求逆、它们如何成功或失败地成为可逆矩阵，以及它们如何与定义它们的基本空间相关联的织物中。它是一个具有深远实用性的概念，并且正如我们所见，也具有深邃的美感。

应用与跨学科联系

在前面的讨论中，我们细致地构建了伴随矩阵——任何方阵的一个奇特伴侣，由其子行列式的马赛克构成。我们确立了它最著名的恒等式：一个矩阵 $A$ 乘以其伴随矩阵 $\text{adj}(A)$ ，得到的是行列式 $\det(A)$ 乘以单位矩阵 $I$ 。初看之下，这似乎仅仅是一个代数上的奇特现象，是通往更实用的矩阵求逆公式的垫脚石。

但如果仅止于此，那将是一大憾事。这就好比学会了国际象棋的规则，却从未欣赏过象棋大师策略的艺术。伴随矩阵远不止是一个计算工具；它是一个深刻的结构探测器。它是原始矩阵的影子，蕴含着关于其性质、对称性及其在更广阔世界中角色的丰富故事。现在，让我们踏上一段旅程，探索这个隐藏的故事，看看伴随矩阵如何将抽象的代数世界与物理、工程和计算的现实世界联系起来。

映照矩阵灵魂之镜：结构与对称性

在我们涉足物理世界之前，让我们先欣赏伴随矩阵提供的深层结构信息。它不仅告诉我们关于单个矩阵的信息，还告诉我们矩阵运算的本质。

考虑两个矩阵 $A$ 和 $B$ 的相乘。如果我们取它们乘积的伴随矩阵，会得到什么？人们可能凭直觉猜测是它们各自伴随矩阵的乘积， $\text{adj}(A)\text{adj}(B)$ 。但矩阵的世界自有其曲折。实际的规则是 $\text{adj}(AB) = \text{adj}(B)\text{adj}(A)$ 。顺序是相反的！用抽象代数的语言来说，这意味着伴随映射不是一个同态，而是一个反同态。它尊重可逆矩阵的群结构，但它像镜子一样反射它。这种顺序反转是矩阵求逆工作方式的一个基本结果——因为 $(AB)^{-1} = B^{-1}A^{-1}$ ——而伴随矩阵通过 $\text{adj}(A) = \det(A)A^{-1}$ 与逆紧密相连。

当一个矩阵“损坏”时——也就是说，当它是奇异的， $\det(A)=0$ 时，伴随矩阵的结构洞察力最为耀眼。这样的矩阵表示一个压缩空间的变换，将至少一个方向压扁成一个点。任何被映射到零向量的非零向量被称为特征值为 0 的特征向量。我们如何找到这些特殊的向量？基本恒等式提供了一个惊人优雅的答案。根据基本恒等式 $A \cdot \text{adj}(A) = \det(A)I_n$ ，当 $\det(A)=0$ 时，我们有：

$A \cdot \text{adj}(A) = \mathbf{0}$

这个方程告诉我们，伴随矩阵的每一列都是 $A$ 对应于特征值 0 的特征向量。伴随矩阵，在其构造中，自动地收集了构成奇异矩阵零空间（或核）的向量。这是一个非凡的数学机制：当矩阵变为奇异的那一刻，它的伴随矩阵就转变为其零空间向量的储存库。

对于那些对更高等代数有兴趣的人来说，伴随矩阵可以揭示更精细的细节。通过考察平移矩阵 $A - \lambda I$ 的伴随矩阵，我们可以推断出矩阵标准型中若尔当块的数量和大小的信息。例如，知道 $\text{adj}(A - \lambda I)$ 是一个非零矩阵，告诉我们 $A - \lambda I$ 的秩恰好比其全维度小一，这反过来又限制了其若尔当型的结构，即该特征值只有一个若尔当块。这就像使用一个特殊的镜头来分辨线性变换的“原子”结构。

从整数到控制系统：两个环的故事

伴随矩阵的力量超越了抽象结构，延伸到数系的构造中。考虑一个元素全为整数的矩阵。它的代数余子式是通过这些整数的和与积计算出来的，所以它们也必须是整数。因此，一个整数矩阵的伴随矩阵总是一个整数矩阵。

这个简单的事实有一个优美的推论。矩阵 $A$ 的逆是 $A^{-1} = \frac{1}{\det(A)}\text{adj}(A)$ 。如果我们有一个整数矩阵 $A$ ，而它的行列式恰好是 $1$ 或 $-1$ ，那么它的逆 $A^{-1}$ 就只是 $\pm 1$ 乘以整数伴随矩阵。这保证了 $A^{-1}$ 也是一个整数矩阵。这样的矩阵构成了一个特殊的群体，称为幺模群，这在数论、晶体学和离散几何学中至关重要。伴随矩阵为理解这个群为何在求逆运算下是“封闭的”提供了关键。

现在，让我们进行一次飞跃。如果我们的矩阵元素不是数字，而是函数呢？在控制理论中，工程师们使用矩阵来描述系统，这些矩阵的元素是复变量 $s$ 的多项式或有理函数，其中 $s$ 通常代表频率。一个具有多项式元素的矩阵 $G(s)$ 描述了一个多输入多输出（MIMO）系统。这样的系统在什么情况下是可逆的，并且其逆系统也由多项式描述？逻辑与整数情况完全相同。逆矩阵 $G(s)^{-1}$ 涉及将多项式伴随矩阵除以多项式行列式 $\det(G(s))$ 。为了使逆矩阵的元素保持为简单的多项式，行列式必须是多项式环中的一个单位——即一个非零常数。如果 $\det(G(s))$ 是一个像 $1$ 这样的常数，那么 $G(s)^{-1}$ 将是一个多项式矩阵。伴随矩阵确保了这种结构完整性，弥合了离散数论与动态系统的连续世界之间的鸿沟。

伴随矩阵在物理世界：敏感性、不变量和效率

到目前为止我们探讨的联系可能看起来优雅而抽象。让我们将伴随矩阵带到现实世界，看看它在物理和计算科学中的作用。

想象一个复杂的线性方程组， $A\mathbf{x} = \mathbf{b}$ ，它可以描述从电路到经济模型的任何事物。向量 $\mathbf{b}$ 代表输入（如电压、投资），而 $\mathbf{x}$ 代表输出（如电流、利润）。一个关键问题是：输出对输入的变化有多敏感？如果我们轻微地改变第 $j$ 个输入 $b_j$ ，第 $i$ 个输出 $x_i$ 会改变多少？这由偏导数 $\frac{\partial x_i}{\partial b_j}$ 来衡量。使用从伴随矩阵公式推导出的克莱姆法则，可以证明：

$\frac{\partial x_i}{\partial b_j} = \frac{(\text{adj}(A))_{ij}}{\det(A)} = (A^{-1})_{ij}$

伴随矩阵的元素（由行列式缩放）恰好是这些敏感性系数！伴随矩阵是系统相互联系的完整地图，其中每个元素都量化了一个特定的因果关系。

伴随矩阵还揭示了物理系统中的隐藏不变量。伴随矩阵的迹 $\text{tr}(\text{adj}(A))$ 等于 $A$ 的所有主 $2 \times 2$ 子式的和。从几何上看，这些子式与矩阵如何变换面积有关。在量子力学的一个惊人应用中，可以从描述基本量子粒子（量子比特）状态的 Pauli 算子构造一个矩阵 $M$ 。计算表明，对于任何纯量子态， $\text{tr}(\text{adj}(M))$ 总是等于数字 2。无论量子比特的具体朝向如何，这个常数都会出现，指向量子态空间的一个深刻、不变的几何属性。这说明了物理学中一个反复出现的主题：看似抽象的数学量，如伴随矩阵的迹，通常对应于深刻的物理不变量。

最后，或许在我们这个时代最重要的是，伴随矩阵是计算效率的引擎。在量子化学等领域，科学家使用量子蒙特卡洛方法来模拟分子行为。这些模拟涉及计算一个巨大的“斯莱特矩阵”的行列式，通常要计算数百万次。对系统进行微小的改变——例如，移动一个电子——对应于只改变矩阵的一列。从头重新计算整个行列式在计算上是不可行的，即使在最快的超级计算机上也要花费数百年。

在这里，伴随矩阵提供了一个神奇的捷径。一个利用伴随-逆关系的巧妙推导表明，新行列式与旧行列式的比值可以通过一个简单的向量点积找到，这个操作比完整的行列式计算快得多。这个数学上的“更新规则”是使这些大规模模拟成为可能的关键。一块19世纪的矩阵理论成为了21世纪计算科学的基石。

从群论的纯粹对称性到量子模拟的实际需求，伴随矩阵证明了它是一个具有非凡深度和多功能性的工具。它是数学美丽且常常令人惊讶的统一性的证明，揭示了将抽象与应用结合成一个单一、连贯整体的隐藏联系。