矩阵乘积的行列式

玻尔百科

核心要点

两个方阵乘积的行列式等于它们各自行列式的乘积： $\det(AB) = \det(A)\det(B)$ 。
从几何角度看，行列式的绝对值代表了线性变换的体积缩放因子，该法则表明，连续变换的缩放因子是各独立变换缩放因子的乘积。
此性质证明了行列式在基变换（相似变换）下是不变的，使其成为变换本身的内在属性。
该法则简化了逆矩阵（ $\det(A^{-1}) = 1/\det(A)$ ）、矩阵的幂以及 LU 和 SVD 等矩阵分解的行列式计算。

引言

在线性代数的研究中，矩阵乘法和行列式计算是两个基本运算。尽管这两种运算都可能计算量巨大，但它们都编码了关于方程组和线性变换的关键信息。当这两种运算相遇时，一个自然而重要的问题便产生了：矩阵乘积的行列式 $\det(AB)$ 与单个矩阵的行列式 $\det(A)$ 和 $\det(B)$ 有何关系？答案并非复杂的公式，而是一条极其简洁优雅且影响深远的法则。本文将深入剖析这一定理基石。

接下来的章节将引导您理解这一强大的概念。首先，在“原理与机制”部分，我们将介绍该乘法法则，通过一个例子进行演示，并探索其与变换下体积缩放相关的深刻几何意义。我们还将揭示其对逆矩阵、奇异矩阵和相似矩阵的直接推论。随后，“应用与跨学科联系”部分将展示这条简单的法则如何成为一条统一的线索，将物理学、计算机科学和抽象代数中的概念联系起来，从量子力学的结构到计算算法的效率，无所不包。

原理与机制

在我们探索矩阵世界的旅程中，我们经常遇到看似复杂繁琐的运算。矩阵乘法，以其行与列相乘的繁复步骤，便是一个典型例子。计算行列式，这个蕴含了矩阵大量信息的单一数值，也可能是一项涉及代数余子式和展开的乏味工作。那么，当这两种复杂性相遇时会发生什么呢？对于两个矩阵乘积的行列式 $\det(AB)$ ，我们能说些什么？

人们可能会天真地猜测，像线性代数中的许多事物一样，它是一个简单的和： $\det(A) + \det(B)$ 。或者，它可能是一个更为复杂、几乎没有直观性的混乱公式。而现实，正如在物理学和数学中经常出现的那样，既出人意料地简单，又蕴含着深刻的美感。

乘法的奇迹

让我们来做一个小实验。假设我们有两个简单的 $2 \times 2$ 矩阵：

$A = \begin{pmatrix} -3 & 4 \\ 2 & 1 \end{pmatrix}, \quad B = \begin{pmatrix} 5 & -1 \\ -2 & 6 \end{pmatrix}$

矩阵 $A$ 的行列式是 $(-3)(1) - (4)(2) = -11$ 。矩阵 $B$ 的行列式是 $(5)(6) - (-1)(-2) = 28$ 。那么，它们的乘积 $AB$ 的行列式是多少呢？首先，我们计算乘积矩阵：

$AB = \begin{pmatrix} -3 & 4 \\ 2 & 1 \end{pmatrix} \begin{pmatrix} 5 & -1 \\ -2 & 6 \end{pmatrix} = \begin{pmatrix} (-15-8) & (3+24) \\ (10-2) & (-2+6) \end{pmatrix} = \begin{pmatrix} -23 & 27 \\ 8 & 4 \end{pmatrix}$

这个新矩阵的行列式是 $\det(AB) = (-23)(4) - (27)(8) = -92 - 216 = -308$ 。

现在让我们看看这些数字： $\det(A) = -11$ ， $\det(B) = 28$ ，以及 $\det(AB) = -308$ 。稍加观察便能揭示其中的“魔术”： $-11 \times 28 = -308$ 。看起来，乘积的行列式就是行列式的乘积！

这并非巧合。它是线性代数中一个基本而强大的定理：对于任意两个相同大小的方阵 $A$ 和 $B$ ，以下关系恒成立：

$\det(AB) = \det(A)\det(B)$

这个优雅的法则是矩阵的一个基石性质，它简化了无数的计算，并为理解矩阵的本质提供了深刻的见解。

变换的几何学

为什么这个简单的乘法法则会成立呢？要真正地感受它，我们必须停止将矩阵仅仅看作一个数字盒子，而开始将其视为一种线性变换——一种拉伸、压缩、旋转或剪切空间的行为。在这种视角下，行列式具有优美的几何意义：行列式的绝对值 $|\det(A)|$ 是变换 $A$ 对体积的缩放因子。如果你对一个单位立方体应用变换 $A$ ，所得到的平行六面体的体积将是 $|\det(A)|$ 。

现在，矩阵乘积 $AB$ 代表先执行变换 $B$ ，然后对结果再执行变换 $A$ 。想象一个体积为 1 的单位立方体。

我们应用变换 $B$ 。立方体被形变为一个平行六面体，其新体积为 $|\det(B)|$ 。
现在，我们对这个新形状应用变换 $A$ 。变换 $A$ 会将任何体积缩放一个因子 $|\det(A)|$ 。因此，它将我们体积为 $|\det(B)|$ 的平行六面体变成一个体积为 $|\det(A)| \times |\det(B)|$ 的新形状。

因此，先应用 $B$ 再应用 $A$ 的总体积缩放因子，就是各个缩放因子的乘积。这正是法则 $\det(AB) = \det(A)\det(B)$ 告诉我们的。

一个绝佳的物理例子可以在材料科学中找到。想象一个完美的单位立方体晶体。当受到应力时，它会发生形变。这种形变可以被建模为一系列操作：一次旋转，接着沿三个正交轴的拉伸，然后再进行另一次旋转。这些操作中的每一个都可以由一个矩阵表示。我们称它们为 $R_1$ （第一次旋转）、 $U$ （拉伸）和 $R_2$ （第二次旋转）。总形变是乘积 $F = R_2 U R_1$ 。最终体积是初始体积（1）乘以 $\det(F)$ 。使用我们的法则：

$\det(F) = \det(R_2) \det(U) \det(R_1)$

纯旋转不改变体积——它只是转动对象——所以任何旋转[矩阵的行列式](@article_id:303413)都是 1。这意味着 $\det(R_1) = \det(R_2) = 1$ 。因此，总体积变化就是 $\det(F) = \det(U)$ 。拉伸矩阵 $U$ 的行列式就是其沿各轴的拉伸因子的乘积。这一系列复杂的变换最终归结为缩放因子的简单相乘，正如我们的几何直觉所预示的那样。

一条简单法则的推论

这条单一、简单的法则引出了一系列其他重要的性质。

首先，考虑逆矩阵 $A^{-1}$ ，它“撤销”变换 $A$ 。它们的乘积是单位矩阵 $I$ ，它不做任何操作（ $A A^{-1} = I$ ）。让我们对等式两边取行列式：

$\det(A A^{-1}) = \det(I)$

在左边使用我们的乘积法则，并知道单位矩阵不改变体积（ $\det(I)=1$ ），我们得到：

$\det(A)\det(A^{-1}) = 1$

如果 $A$ 是可逆的（因此 $\det(A) \neq 0$ ），我们可以立即求出其逆矩阵的行列式：

$\det(A^{-1}) = \frac{1}{\det(A)}$

“撤销”变换的缩放因子就是原始缩放因子的倒数。这使我们能够毫不费力地解决诸如求 $\det(A^{-1}B)$ 之类的问题。它就是 $\det(A^{-1})\det(B) = \frac{\det(B)}{\det(A)}$ 。

其次，如果一个矩阵是奇异矩阵怎么办？奇异矩阵是指行列式为零的矩阵。从几何上看，这意味着变换将空间压缩到更低的维度——例如，将一个 3D 物体投影到一个 2D 平面上，其体积为零。如果我们将一个奇异矩阵 $A$ 与任何其他矩阵 $B$ 相乘，会发生什么？我们的法则立即给出答案：

$\det(AB) = \det(A)\det(B) = 0 \cdot \det(B) = 0$

如果一系列变换中的任何一步将体积压缩为零，那么后续的任何变换都无法使其恢复。总变换将始终是奇异的。

最后，我们可以轻松地求出矩阵幂的行列式。例如， $\det(A^2) = \det(AA) = \det(A)\det(A) = (\det(A))^2$ 。一般地，对于任何正整数 $n$ ， $\det(A^n) = (\det(A))^n$ 。

一种更深层的不变性：改变你的视角

当我们考虑坐标系变换，或称基变换时，这条法则的真正威力才显现出来。想象你有一个由矩阵 $N$ 表示的变换。然而，你的同事喜欢从不同的角度看待世界，使用另一组基向量。要从你的视角转换到她的视角，需要使用一个基变换矩阵 $M$ 。要转换回来，则使用 $M^{-1}$ 。

在你同事的世界里，你的变换 $N$ 由一个不同的矩阵 $K = MNM^{-1}$ 来描述。这被称为相似变换。矩阵 $N$ 和 $K$ 看上去完全不同，它们的元素也不同。但它们代表着完全相同的物理变换，只是用不同的语言（坐标系）来描述。

我们能对 $K$ 的行列式说些什么呢？让我们应用我们的法则：

$\det(K) = \det(MNM^{-1}) = \det(M) \det(N) \det(M^{-1})$

使用我们关于逆矩阵的结论 $\det(M^{-1}) = 1/\det(M)$ ，我们发现：

$\det(K) = \det(M) \det(N) \left(\frac{1}{\det(M)}\right) = \det(N)$

这是一个非凡而深刻的结果。矩阵的行列式在基变换下是不变的。无论你用什么坐标系来写下你的矩阵，它所代表的体积缩放因子都是变换本身的一个内在的、不变的属性。这就是为什么像行列式这样的量在物理学中如此重要——它们捕捉了过程的基本现实，而与观察者所选择的参考系无关。

这与特征值完美地联系在一起。矩阵的特征值是其沿主方向（特征向量）的特殊缩放因子。事实证明，行列式也等于其所有特征值的乘积。这完全合乎情理：总体积缩放必定是沿各个主方向缩放的乘积。由于相似变换不改变底层的变换，它也不会改变特征值。因此， $\det(K) = \det(N)$ 是因为它们具有相同的特征值。

统一的图景：从行运算到宏大的分解

掌握了乘积法则及其推论，我们现在可以自信地剖析更复杂的表达式。像 $-2A^T B$ 这样的矩阵可能看起来令人生畏，但我们可以将其分解。对于一个 $4 \times 4$ 矩阵，我们使用标量法则 $\det(kM) = k^4 \det(M)$ 、乘积法则，以及转置矩阵的行列式与原矩阵相同的事实 $\det(A^T) = \det(A)$ 。谜题的每一块都恰到好处地落入其位。

这种观点甚至解释了初等行变换如何影响行列式的熟悉规则。每个行运算——交换两行、将一行乘以一个标量、或将一行的倍数加到另一行——都等同于在左侧乘以一个相应的初等矩阵 $E$ 。因此，新的行列式是 $\det(EM) = \det(E)\det(M)$ 。

将一行的倍数加到另一行对应于行列式为 1 的初等矩阵。所以 $\det(M)$ 不变。
交换两行对应于行列式为 -1 的初等矩阵。所以 $\det(M)$ 符号翻转。
将一行乘以一个标量 $\alpha$ 对应于行列式为 $\alpha$ 的初等矩阵。所以 $\det(M)$ 乘以 $\alpha$ 。

行列式乘积法则是父概念，所有这些来自入门课程的熟悉规则都源于此。

这种统一的力量延伸到重要的计算技术。求解线性方程组或计算行列式最常用的方法之一是 LU 分解，我们将矩阵 $A$ 分解为一个下三角矩阵 $L$ 和一个上三角矩阵 $U$ 的乘积，即 $A=LU$ 。行列式便简化为 $\det(A) = \det(L)\det(U)$ 。由于三角矩阵的行列式就是其对角元素的乘积，这为计算 $\det(A)$ 提供了一种非常高效的方法。此外，如果 $A$ 是非奇异的（ $\det(A) \neq 0$ ），我们的法则告诉我们 $\det(L)$ 和 $\det(U)$ 也必须非零。这一简单事实对算法的稳定性和成功具有至关重要的意义。

从一个简单的乘法观察出发，我们经历了几何直觉的旅程，探索了强大的推论，并揭示了统一线性代数中许多看似分散的概念的深层联系。法则 $\det(AB) = \det(A)\det(B)$ 不仅仅是一个需要记忆的公式；它是通向数学及其所描述的物理世界中优美且相互关联的结构的一扇窗户。

应用与跨学科联系

我们已经看到，矩阵乘积的行列式是它们各自行列式的乘积。表面上看，这只是一个简洁明了的代数法则： $\det(AB) = \det(A)\det(B)$ 。但如果仅止于此，就如同只欣赏书的封面而从未阅读其中的故事。这个简单的法则不仅仅是一种计算上的便利；它是一个关于变换如何复合、效应如何累积以及“体积”在抽象空间中如何表现的深刻陈述。它是一条金线，贯穿几何学、物理学、计算机科学，甚至抽象数学最深层的结构。让我们拉起这条线，看看它能揭示出怎样的奇迹。

变换的几何学：分解复杂性

让我们从一幅图景开始。想象你有一个由矩阵 $A$ 表示的变换，它对一张橡胶板进行挤压和旋转。这可能是一个复杂的过程。但是，如果我们能将这个复杂的变换分解成一系列更简单、更直观的动作呢？物理学和数学中充满了这种“分而治之”的策略。我们的行列式法则正是揭示整体效应与各简单部分之间关系的关键。

一个优美的例子是极分解。任何线性变换 $A$ 都可以唯一地分解为一个沿特定轴线的纯拉伸（或压缩），由一个正定对称矩阵 $P$ 给出，随后是一个纯旋转或反射，由一个正交矩阵 $U$ 给出。所以，我们写成 $A = UP$ 。那么，总体积变化 $\det(A)$ 与这两个截然不同的动作有何关系呢？我们的法则立即给出答案： $\det(A) = \det(U)\det(P)$ 。 $P$ 的行列式代表了由拉伸引起的体积变化，而 $U$ 的行列式则告诉我们关于方向的信息。由于纯旋转或反射不改变体积，只改变方向，其行列式必须是 $+1$ （对于保持“手性”的旋转）或 $-1$ （对于像镜像一样将其翻转的反射）。这意味着 $\det(U)$ 就是 $\det(A)$ 的符号！。这个法则完美地将体积变化的量级与其方向的翻转分离开来。

通过著名的奇异值分解（SVD），我们可以进行更深入的挖掘。它告诉我们，任何线性变换 $A$ 都可以被看作一个三步过程：（1）一次旋转（ $V^T$ ），（2）沿垂直轴的缩放（ $\Sigma$ ），以及（3）另一次旋转（ $U$ ）。所以， $A = U\Sigma V^T$ 。行列式会发生什么变化呢？ $\det(A) = \det(U)\det(\Sigma)\det(V^T)$ 。旋转矩阵 $U$ 和 $V^T$ 的行列式只是 $\pm 1$ 。所有“体积变化”的作用都集中在对角矩阵 $\Sigma$ 中，其行列式就是其对角元素——奇异值 $\sigma_i$ ——的乘积。因此，行列式的绝对值不过是所有奇异值的乘积： $|\det(A)| = \prod \sigma_i$ 。这是一个绝妙的结果！它证实了我们的直觉：一个变换的总的体积变化就是它沿其主方向施加的拉伸的乘积。这不仅仅是一个几何上的奇观，它也是数据压缩和机器学习中强大技术的基础。

计算能力与数值方法

到目前为止，我们谈论的都是优美的思想。但这个法则能胜任繁重的工作吗？当然可以。在科学计算领域，我们可能需要求解包含数百万个变量的数百万个方程来预测天气或设计喷气发动机，效率就是一切。

直接计算一个巨大矩阵的行列式是一场计算噩梦。但如果我们能将矩阵 $A$ 分解成更简单矩阵的乘积，比如 $A = LU$ ，其中 $L$ 是下三角矩阵， $U$ 是上三角矩阵呢？这就是著名的 LU 分解。三角矩阵的美妙之处在于，它们的行列式计算起来微不足道：只需将对角线上的数字相乘即可。我们的法则随后为我们提供了一个巨大的捷径： $\det(A) = \det(L)\det(U)$ 。我们用两个简单的任务取代了一项艰巨的任务。这一原理是数值线性代数的基石，使得大规模模拟成为可能。

这种计算优势也延伸到其他领域，如数字信号处理。你对手机说话的声音是时域中的一个信号。要处理它——去噪或添加效果——我们通常使用离散傅里叶变换（DFT）将其转换到频域，该变换由矩阵 $F_n$ 表示。处理过程本身可能是另一个矩阵运算，比如乘以一个滤波器矩阵 $D$ 。最终结果来自乘积矩阵 $F_n D$ 。分析这个组合操作的性质，根本上依赖于其行列式就是 $\det(F_n)\det(D)$ 这一事实。从你的音乐播放器到核磁共振成像（MRI）扫描，这个原理都在默默地、高效地处理数据。

物理学的语言与对称性

物理定律通常是关于什么不改变的陈述——即在某些变换下哪些量是守恒的。行列式是分类这些变换的完美工具。

在奇妙而精彩的量子力学世界中，粒子的状态由一个向量描述。随着时间的推移，这个向量会演化，但其总概率必须始终保持为 1。这意味着时间演化变换，由一个酉矩阵 $U$ 表示，必须保持向量的长度。其数学条件是 $UU^\dagger = I$ ，其中 $I$ 是单位矩阵。应用我们的行列式法则，我们发现 $\det(U)\det(U^\dagger) = \det(I) = 1$ 。这不仅仅是一点代数运算；它是对宇宙在最小尺度上动力学的基本约束。

此外，在量子理论中，像能量或动量这样的物理可观测量由厄米矩阵（Hermitian matrix）表示。一个深刻的原理指出，如果两个可观测量可以同时被精确测量，它们的矩阵，比如 $A$ 和 $B$ ，必须对易： $AB=BA$ 。这意味着它们共享一组共同的特征向量。对于一个给定的特征向量，乘积算符 $AB$ 的特征值就是单个特征值的乘积，即 $\lambda_k \mu_k$ 。当我们观察总的行列式时，我们看到我们的法则从这个量子基础上浮现出来： $\det(AB) = \prod (\lambda_k \mu_k) = (\prod \lambda_k)(\prod \mu_k) = \det(A)\det(B)$ 。宏观的代数法则是微观对易量子系统行为的直接结果。

抽象结构与统一原理

行列式乘积法则最优雅的应用也许是在抽象代数领域，特别是群论，这是研究对称性的数学。考虑所有在 3D 空间中保持原点固定的旋转和反射。这些变换构成一个称为正交群 $O(3)$ 的群。每个变换都由一个正交矩阵表示。我们知道它们的行列式必须是 $+1$ （对于纯旋转）或 $-1$ （对于反射）。

当我们一个接一个地执行变换时会发生什么？假设我们有两个来自这个群的矩阵 $M_1$ 和 $M_2$ 。组合变换是乘积 $M_1 M_2$ 。行列式法则 $\det(M_1 M_2) = \det(M_1)\det(M_2)$ 告诉我们这些对称性究竟是如何组合的：

一个旋转（ $\det = 1$ ）后接另一个旋转（ $\det=1$ ）得到一个旋转（ $\det = 1 \times 1 = 1$ ）。
一个旋转（ $\det = 1$ ）后接一个反射（ $\det=-1$ ）得到一个反射（ $\det = 1 \times -1 = -1$ ）。
一个反射（ $\det = -1$ ）后接另一个反射（ $\det=-1$ ）得到一个旋转（ $\det = -1 \times -1 = 1$ ）。

想一想最后一点。它从数学上证明了一个我们熟悉的想法：看镜子中的反射会得到一个旋转！ $+1$ 和 $-1$ 的简单算术完美地捕捉了对称性如何复合的深刻几何结构。它表明，行列式不仅仅是一个数字；它是一个为变换分类的标签，而乘积法则就是这些标签如何组合的规则手册。这使得数学家能够识别出关键的结构，比如纯旋转的特殊子群 $SO(n)$ ，它构成了描述相对论和粒子物理学中旋转的数学基石。

因此，我们回到起点： $\det(AB) = \det(A)\det(B)$ 。它不仅仅是一个方程，更是一个故事。它讲述了体积和方向上的几何操作如何组合。它讲述了复杂的计算问题如何被分解成更简单的部分。它讲述了量子领域物理定律的约束和混沌系统的行为。它也讲述了对称性本身深刻而优美的结构。在其简单的形式中，它蕴含了一个充满联系的宇宙，提醒我们，在数学中，最优雅的法则往往是那些在人类思想最广阔的领域中回响的法则。