四元数表示

玻尔百科

核心要点

四元数可以通过2x2复矩阵进行忠实表示，从而将其抽象的代数规则转化为我们所熟悉的线性代数语言。
基本的四元数性质，如范数、共轭和求逆，与矩阵的行列式、共轭转置（伴随）和矩阵的逆直接对应。
用于描述三维旋转的单位四元数集合，在数学上与特殊酉群SU(2)等同，揭示了其与量子力学之间的深刻联系。
这种矩阵表示法为处理计算机图形学和机器人学中的旋转提供了一种稳健、无万向节死锁的方法，并且是描述量子系统的基础。

引言

四元数由威廉·罗恩·哈密顿（William Rowan Hamilton）发现，是一种扩展了复数的强大的四维数系。然而，其抽象的性质和非交换的乘法规则使其难以直接理解和应用。这就产生了一个知识鸿沟：我们如何才能在一个更具体、更直观的框架中利用四元数的力量？解决方案在于找到一种忠实表示——一种将四元数代数转化为我们熟知的矩阵世界的方法。

本文旨在探索这座连接抽象代数与应用科学的强大桥梁。首先，在“原理与机制”一章中，我们将逐步构建四元数的标准2x2复矩阵表示。我们将揭示四元数性质与矩阵运算之间优美的相似之处，最终引出单位四元数与量子力学中的SU(2)群之间的深刻联系。随后，“应用与跨学科联系”一章将展示这种表示法不仅仅是数学上的一个奇妙构造，更是在不同领域中的重要工具——从创建流畅的三维动画、导航无人机，到描述量子领域中粒子的基本自旋。

原理与机制

对具体形式的探寻

我们已经介绍了四元数，这种形式为 $q = a + bi + cj + dk$ 的奇特的四维数。威廉·罗恩·哈密顿（William Rowan Hamilton）的发现是代数想象力的一次飞跃，但它们的乘法规则，特别是 $ij = -ji$ 这样的反对易性质，可能让人觉得抽象和笨拙。我们如何才能更直观地掌握它们？我们如何才能“看到”它们的作用？

在物理学和数学中，驯服一个抽象代数系统的一个强有力的策略是为它找到一个表示。可以把它看作一本翻译词典。我们将四元数这门陌生的语言翻译成一种更熟悉的语言：矩阵及其运算的语言。如果我们的翻译是好的——数学家称之为忠实表示——那么四元数世界中的每一条规则和关系都将在矩阵世界中有一个完美的对应。我们用矩阵进行的任何计算，都将为相应的四元数提供一个有效的结果。这不仅仅是一个巧妙的技巧；这是利用强大且易于理解的线性代数工具来探索新领域的一种方式。

构建矩阵“伪装”

我们的目标是找到一组行为与四元数基元 $\{1, i, j, k\}$ 完全相同的矩阵。我们正在寻找满足定义关系 $\rho(i)^2 = \rho(j)^2 = \rho(k)^2 = \rho(i)\rho(j)\rho(k) = -\rho(1)$ 的矩阵，我们称之为 $\rho(1), \rho(i), \rho(j), \rho(k)$ 。

让我们尝试使用 $2 \times 2$ 的复数矩阵来构建这种表示。这是一个合理的猜测，因为复数本身已经包含一个虚数单位。

首先，从简单的部分开始。四元数 $1$ 是乘法单位元，所以它的矩阵表示 $\rho(1)$ 必须是单位矩阵：

\rho(1) = I = \begin{pmatrix} 1 0 \\ 0 1 \end{pmatrix}

现在来看虚数单位。我们需要平方为 $-I$ 的矩阵。对于 $\rho(i)$ ，一个自然的选择是使用复数 $i$ 本身：

\rho(i) = \begin{pmatrix} i 0 \\ 0 -i \end{pmatrix}

我们来验证一下： $\rho(i)^2 = \begin{pmatrix} i^2 0 \\ 0 (-i)^2 \end{pmatrix} = \begin{pmatrix} -1 0 \\ 0 -1 \end{pmatrix} = -I$ 。完全正确。

对于 $\rho(j)$ ，我们需要另一个平方为 $-I$ 的矩阵，但它还必须以正确的方式与 $\rho(i)$ 相互作用。让我们尝试一个简单的非对角形式：

\rho(j) = \begin{pmatrix} 0 1 \\ -1 0 \end{pmatrix}

快速验证可知 $\rho(j)^2 = \begin{pmatrix} 0 1 \\ -1 0 \end{pmatrix} \begin{pmatrix} 0 1 \\ -1 0 \end{pmatrix} = \begin{pmatrix} -1 0 \\ 0 -1 \end{pmatrix} = -I$ 。到目前为止一切顺利。

关键时刻在于 $k$ 。在四元数代数中， $k = ij$ 。如果我们的表示要成立，那么必须有 $\rho(k) = \rho(i)\rho(j)$ 。我们直接计算这个矩阵乘积：

\rho(k) = \rho(i)\rho(j) = \begin{pmatrix} i 0 \\ 0 -i \end{pmatrix} \begin{pmatrix} 0 1 \\ -1 0 \end{pmatrix} = \begin{pmatrix} 0 i \\ i 0 \end{pmatrix}

这就得到了我们用于 $k$ 的候选矩阵。我们必须验证它是否满足所有必需的性质。它的平方是 $-I$ 吗？

\rho(k)^2 = \begin{pmatrix} 0 i \\ i 0 \end{pmatrix} \begin{pmatrix} 0 i \\ i 0 \end{pmatrix} = \begin{pmatrix} i^2 0 \\ 0 i^2 \end{pmatrix} = \begin{pmatrix} -1 0 \\ 0 -1 \end{pmatrix} = -I

是的！那么著名的反对易性呢？我们来检验一下 $\rho(j)\rho(i)$ ：

\rho(j)\rho(i) = \begin{pmatrix} 0 1 \\ -1 0 \end{pmatrix} \begin{pmatrix} i 0 \\ 0 -i \end{pmatrix} = \begin{pmatrix} 0 -i \\ -i 0 \end{pmatrix} = -\rho(k)

成立！我们为四元数基元找到了一组自洽的矩阵“伪装”。

现在，我们可以通过将这些基矩阵与相同的实系数相结合来表示任何四元数 $q = a + bi + cj + dk$ ：

\rho(q) = a\rho(1) + b\rho(i) + c\rho(j) + d\rho(k)

\rho(q) = a\begin{pmatrix} 1 0 \\ 0 1 \end{pmatrix} + b\begin{pmatrix} i 0 \\ 0 -i \end{pmatrix} + c\begin{pmatrix} 0 1 \\ -1 0 \end{pmatrix} + d\begin{pmatrix} 0 i \\ i 0 \end{pmatrix}

将这些合并成一个单一矩阵，我们得到了最终结果：

\rho(a + bi + cj + dk) = \begin{pmatrix} a+bi c+di \\ -c+di a-bi \end{pmatrix}

这个特定的矩阵结构就是四元数的标准表示。任何四元数都可以唯一地写成这种形式，并且任何这种形式的矩阵都对应一个唯一的四元数。我们的词典构建完成了。

表示法中的奥秘

这种矩阵形式不仅仅是为了记法上的方便。它揭示了四元数的抽象规则与矩阵的具体性质之间惊人的一致性。让我们来探索其中一些奇妙的联系。

范数变为行列式

四元数的范数 $|q|$ 是它在四维空间中的“大小”或“长度”，其平方由 $|q|^2 = a^2 + b^2 + c^2 + d^2$ 给出。让我们计算其矩阵表示 $\rho(q)$ 的行列式：

\det(\rho(q)) = (a+bi)(a-bi) - (c+di)(-c+di)

= (a^2+b^2) - (-c^2-d^2) = a^2+b^2+c^2+d^2 = |q|^2

这是一个非凡的结果。四元数范数的平方这个抽象概念，与我们熟悉的矩阵行列式完全相同。这并非偶然；它表明我们的表示捕捉到了四元数代数的深层结构。

共轭变为伴随

每个四元数 $q = a + bi + cj + dk$ 都有一个共轭 $q^* = a - bi - cj - dk$ 。在我们的矩阵世界里，这个运算是什么样的呢？让我们找出 $q^*$ 对应的矩阵：

\rho(q^*) = \begin{pmatrix} a-bi -c-di \\ c-di a+bi \end{pmatrix}

现在，让我们取原始矩阵 $\rho(q)$ 并计算其共轭转置（或埃尔米特伴随），用匕首符号 $\dagger$ 表示。该运算包括先进行转置，然后对每个元素取复共轭。

\rho(q)^\dagger = \begin{pmatrix} a+bi c+di \\ -c+di a-bi \end{pmatrix}^\dagger = \begin{pmatrix} \overline{a+bi} \overline{-c+di} \\ \overline{c+di} \overline{a-bi} \end{pmatrix} = \begin{pmatrix} a-bi -c-di \\ c-di a+bi \end{pmatrix}

它们是完全相同的！ $\rho(q^*) = \rho(q)^\dagger$ 。四元数共轭这一代数规则，与取相应矩阵的共轭转置完全一样。

逆的揭示

这种平行的结构为我们找到四元数的逆提供了一种优美的方法。对于任何非零四元数 $q$ ，其逆由公式 $q^{-1} = \frac{q^*}{|q|^2}$ 给出。让我们利用新发现将其转化为矩阵语言：

\rho(q)^{-1} = \rho(q^{-1}) = \rho\left(\frac{q^*}{|q|^2}\right) = \frac{1}{|q|^2}\rho(q^*) = \frac{\rho(q)^\dagger}{\det(\rho(q))}

这正是这种形式的 $2 \times 2$ 矩阵求逆的标准公式！寻找四元数逆的抽象代数规则，完美地反映在矩阵代数的一个具体过程中。

皇冠上的明珠：旋转与SU(2)群

当我们考虑范数为1的单位四元数时，这种表示的真正威力与美感才得以最充分地展现。正是这些四元数，能够优雅地描述三维空间中的旋转。

在我们的矩阵世界里，一个四元数的范数为1意味着什么？这仅仅意味着它的矩阵表示的行列式必须为1。

|q|=1 \quad \iff \quad \det(\rho(q)) = 1

此外，对于单位四元数，其逆就是其共轭，即 $q^{-1} = q^*$ 。让我们看看这对它的矩阵意味着什么：

\rho(q)^{-1} = \rho(q^*) = \rho(q)^\dagger

所以，对于一个单位四元数，其矩阵的逆就是它自身的共轭转置。一个具有这种性质 $U^{-1} = U^\dagger$ 的矩阵 $U$ 被称为酉矩阵。

综上所述，所有单位四元数的集合对应于所有酉且行列式为1的 $2 \times 2$ 复矩阵的集合。这是一个非常重要且被深入研究的矩阵集合，称为2次特殊酉群，即 $SU(2)$ 。

这是一个深刻而优美的联系。由单位四元数编码的三维旋转代数，在数学上与 $SU(2)$ 群等同。而这个 $SU(2)$ 群正位于量子力学的核心，用于描述电子等基本粒子的内禀角动量，即“自旋”。Hamilton 为理解三维空间而设计的抽象代数，在一个世纪后，在量子领域找到了其最基本的物理应用。

更深层次的分类

有人可能会想，我们是否可以使用更简单的矩阵，比如只包含实数的矩阵。事实证明，对于我们找到的这种紧凑、优美的表示，复数是必不可少的。来自群论的高级工具，如Frobenius-Schur 指示子，可以对表示进行分类。对于四元数群（ $Q_8$ ，所有四元数的一个小型有限子集），该指示子为 $-1$ 。这个值表示一种“四元数型”或“伪实数型”的表示类型。这意味着该表示与其复共轭表示等价，但不能被化为实数值。在某种意义上，其结构与四元数的本性紧密相连，以至于它无法被简化为同样大小的纯实数形式。

我们可以使用实矩阵来表示四元数，但我们必须转向更高的维度。例如，任何四元数都可以用一个 $4 \times 4$ 的实矩阵来表示。虽然这种 $4 \times 4$ 的表示在某些计算应用中很有用，但它失去了与复群 $SU(2)$ 那种奇妙、直接且优美的联系，而正是这种联系揭示了代数、几何与物理学基本定律之间的深刻统一。

应用与跨学科联系

在揭示了四元数优美的代数机制之后，你可能会倾向于认为它们只是一种巧妙但或许小众的数学奇物。事实远非如此！Hamilton 在都柏林桥上的发现不仅仅是一个代数难题的解答，它更是开启一门似乎是自然本身所使用的语言的钥匙。我们刚刚讨论的原理并不仅仅局限于教科书。它们在我们周围无处不在，从你口袋里的智能手机到量子领域最深邃的奥秘。现在，让我们踏上一段旅程，去看看这些非凡的数字在何处安家落户。

旋转大师：从无人机到数字世界

四元数最直接、最具体的应用是描述三维空间中的旋转。你可能熟悉其他方法，比如指定围绕不同轴的一系列三次旋转，通常称为欧拉角。这种方法起初看似直观，但它存在一个臭名昭著的问题，即“万向节死锁”，这是一种丢失一个自由度，导致运动颠簸、不可预测的情况。这个数学难题已经困扰了工程师和飞行员数十年。

四元数优雅地回避了整个问题。一个单位四元数可以表示任何三维旋转，而组合旋转就像乘以两个四元数一样简单。这不仅仅是一个优美的数学技巧，它彻底改变了游戏规则。在计算机图形学和视频游戏中，动画师使用四元数插值（通常称为“slerp”）为角色和物体创建平滑、自然的旋转。无人机、飞机和卫星的导航系统依赖四元数来处理来自陀螺仪和加速度计的数据，从而在空间中保持稳定而精确的方向感，无需担心万向节死锁。

这种实用性以惊人的力量延伸到科学领域。以材料科学领域为例，物理学家研究金属等多晶材料的性质。这类材料的宏观性质取决于数百万个微观晶粒的取向。描述“织构”，即这些取向的统计分布，是一项艰巨的任务。虽然可以使用欧拉角，但四元数表示法固有的高效性和稳健性使其成为编目和分析这种复杂取向数据的更优越的工具。

但是，对于包含旋转和平移的运动，比如机器人手臂移动抓取物体，情况又如何呢？在这里，一个迷人的四元数扩展——对偶四元数登上了舞台。一个对偶四元数 $\hat{q} = q_r + \epsilon q_d$ 是一个由两部分组成的数，其中 $q_r$ 是用于旋转的标准四元数， $q_d$ 处理平移，而 $\epsilon$ 是一个具有属性 $\epsilon^2 = 0$ 的特殊“对偶单位”。令人难以置信的是，一次对偶四元数乘法就可以表示一个完整的刚体运动——一次旋转后跟一次平移。这将一个复杂的几何操作打包成一个简洁的代数形式，使其在机器人学、运动学和三维运动规划等领域中具有不可估量的价值。

量子世界的秘密语言

如果说四元数在三维旋转中的应用令人印象深刻，那么它们在量子力学核心的出现简直是惊为天人。这是物理学家 Eugene Wigner 所说的“数学在自然科学中不可思议的有效性”的一个绝佳例子。一个于1843年发明的代数系统，竟然成了描述1920年代及以后物理学的完美语言。

这种联系是深刻的：单位四元数群，在所有实际应用中，都与数学群 $SU(2)$ 相同，而后者支配着像电子这样的基本自旋1/2粒子的行为。它也描述了对单个量子比特（qubit）——量子计算的基本单位——的变换。一个旋转量子比特状态的量子门可以用一个 $2 \times 2$ 的酉矩阵来表示。但它同样可以由一个单位四元数表示。组合量子门——设计量子算法的一项基本任务——等价于简单地将它们对应的四元数相乘。Hamilton 的抽象代数在量子计算机中找到了直接的物理实现。

这种联系甚至更深，触及自然界最微妙的对称性之一：时间反演对称性。量子力学中有一个基本定理，即 Kramers 定理，它指出，对于任何在没有磁场的情况下拥有奇数个自旋1/2粒子的系统，每个能级都必须至少是双重简并的。这意味着你不可能有一个孤立的能态；它们总是成对出现。为什么？原来，这类系统的反酉时间反演算符背后的数学机制，其结构与四元数代数完全相同。四元数单位 $i$ 与 $j$ 反对易这一事实不仅仅是一条规则；它是一个深刻物理原理的反映，这个原理确保了我们所知的物质的稳定性。

甚至离散四元数群 $Q_8 = \{\pm 1, \pm i, \pm j, \pm k\}$ 也找到了用武之地。在量子信息领域，人们必须对量子态如何因与环境相互作用而衰退进行建模，这一过程称为退相干。某些类型的噪声，如“去极化信道”，可以被优美地建模为对四元数群元素作用的平均，从而在这个有限代数结构与量子噪声的复杂现实之间建立了直接联系。

统一的视角：贯穿数学的脉络

四元数的影响力并不仅限于物理学和工程学；它们像一根统一的线索，将数学本身中看似毫不相关的领域编织在一起。

考虑线性常微分方程组，它们可以模拟从电路到种群动态的各种系统。对于某类 $4 \times 4$ 系统，其解通常通过计算矩阵指数 $e^{At}$ 得到，但其实可以用一种更优雅的方式求得。如果矩阵 $A$ 正是某个四元数 $q$ 的实矩阵表示，那么解矩阵 $e^{At}$ 就恰好是四元数指数 $e^{qt}$ 的矩阵表示。系统的动力学特性被完美地捕捉在四元数空间中的一条平滑路径上。

这暗示了一个更宏大的联系。配备了对易子 $[q_1, q_2] = q_1q_2 - q_2q_1$ 的四元数空间构成了一个李代数。这种结构是连续对称性理论的数学基础，而连续对称性理论是现代物理学的基石。四元数对易子并非一个随意的定义；它是旋转的无穷小生成元，将四元数代数直接与李理论的强大框架联系起来。

即便在抽象代数内部，四元数也揭示了优美的结构相似性。矩阵的极分解，即将其唯一地分解为一个旋转（酉矩阵 $U$ ）和一个拉伸（正定矩阵 $P$ ），在四元数世界中有一个完美的类比。任何非零四元数 $q$ 的矩阵表示都可以进行这种分解。奇妙之处在于，酉因子 $U$ 精确对应于四元数的方向部分（ $q/|q|$ ），而拉伸因子 $P$ 则对应于其大小（ $|q|$ ）。这展示了“方向”和“大小”的几何直觉与线性代数的抽象机制之间的绝佳一致性。

旅程并未就此结束。数学家们已将代数基本定理——即每个多项式在复数中都有一个根——等概念扩展到四元数领域。虽然四元数的非交换性使问题变得复杂得多，但人们已经开发出强大的工具来计算四元数多项式的零点，将问题与大型实矩阵的特征值联系起来，并进入了超复分析这一迷人的领域。

从实用到深奥，四元数已经证明其远超 Hamilton 所能想象的范畴。它们是数学思想相互关联及其描述物理宇宙的奇异能力的明证。它们是现实的一个基本组成部分，隐藏在显而易见之处，存在于电子的自旋和无人机的飞行之中。