矩阵力学

玻尔百科

定义

矩阵力学是量子力学的一种基本表述形式，其中能量和动量等物理量被表示为被称为厄米算符的特定矩阵。在该理论框架下，任何量子测量的可能结果都被限制在对应厄米算符特征值的实数集合内。量子系统的状态由矢量描述，通过矩阵作用于这些矢量来刻画系统演化，其数学模型广泛应用于量子计算机设计和黑洞理论研究等领域。

核心要点

在矩阵力学中，能量和动量等物理性质并非由数字表示，而是由称为厄米算符的特殊矩阵表示。
任何量子测量的可能结果都局限于相应厄米算符的本征值集合，这些本征值都是实数。
量子系统的状态由一个矢量描述，矩阵作用于这些矢量来描述跃迁和时间演化。
矩阵力学的形式体系作为一种通用语言，连接了从量子计算机的实际设计到黑洞的理论模型等不同领域。

引言

20世纪初，当面对原子和光的奇异行为时，经典物理学中那些优雅且可预测的定律开始瓦解。能量以离散的包（即量子）存在、电子等粒子展现出波粒二象性等发现，引发了一场深刻的危机。旧的规则被打破，人们迫切需要一种新的数学语言来描述这个奇怪的亚原子现实。本文将探讨量子力学的第一个成功且影响深远的表述：Werner Heisenberg的矩阵力学。

这个框架解决了如何表示不再是简单数字的物理量的根本难题。它提出了一个激进的想法：位置、动量和能量等性质最好由称为矩阵的数学对象来描述。我们将穿越这个抽象而强大的世界，揭示支配这种新量子算术的规则。本文的结构旨在帮助你从零开始建立理解。在第一部分“原理与机制”中，我们将探讨核心概念，例如为什么可观测量必须是厄米矩阵，以及如何从中提取真实世界的测量结果。随后，“应用与跨学科联系”将揭示这些思想惊人的应用范围，展示矩阵力学不仅是历史上的一个奇珍，更是从量子计算、凝聚态到时空本质等现代前沿领域中充满活力的工作语言。

原理与机制

想象一下，你是一位20世纪初的物理学家。你刚刚发现，经典物理学平滑、可预测的世界在原子尺度上失效了。能量以离散的包（即量子）的形式出现。一个电子似乎既像粒子又像波。旧的规则不再适用，你需要一本新的宇宙说明书。Werner Heisenberg，在灵光一闪间，找到了这样一本说明书。他意识到量子系统的性质——诸如能量、位置和动量——其行为不像普通数字，而更像矩阵。这便是矩阵力学这个奇异而美丽的世界。

本章将带我们进入那本新的规则手册。我们不会迷失在数学的细节中，而是试图捕捉Heisenberg当年感受到的那种直觉的闪电。我们将提出简单的问题，并发现它们引出了关于现实构造的深刻真理。

一种描述现实的奇异新算术

在你周围看到的世界里，一个物体的属性都只是数字。一个球有位置、速度、动能。你可以把它们写下来。但在量子领域，这还不够。一个物理性质，或者我们称之为可观测量，不是一个静态的数字，而是一个动作，一个过程。而代表动作的数学对象是算符。在矩阵力学中，这些算符就是矩阵。

让我们来思考最简单的量子系统。它不是一个球或一颗行星，而是只有两种可能状态的东西。比如电子的内禀角动量，即自旋，沿着某个选定轴的测量结果可以是“上”或“下”。这是一个量子比特，量子信息的基本单位。你可能会认为“上”是+1，“下”是-1。但量子力学说：“没那么快。” 代表沿不同轴——x、y和z轴——测量自旋的算符，实际上是矩阵！例如，沿y轴的自旋算符由这个奇特的小矩阵表示：

\sigma_y = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix}

注意那个i，-1的平方根！在描述一个非常真实的物理性质的核心之处，竟然出现了虚数。这是我们得到的第一个线索：规则已经改变了。描述现实的对象不再只是简单的实数。

物理现实的试金石：厄米算符

这就引出了一个关键问题。如果我们的可观测量是充满复数的矩阵，我们如何得到在实验室实验中看到的普通的、实数的结果？物理学家测量到的能量是2.5电子伏特，而不是2.5 + 3i电子伏特！

必须有一个约束，一个规则来确保测量的结果是实数。这个规则确实存在。代表物理可观测量的矩阵必须具有一个特殊性质：它们必须是厄米(Hermitian)矩阵。

这是什么意思呢？如果一个矩阵 $\hat{A}$ 等于其自身的共轭转置（记作 $\hat{A}^{\dagger}$ ），那么它就是厄米矩阵。要求得共轭转置，你首先要交换矩阵的行和列（转置），然后对每个元素取复共轭。所以，条件是 $\hat{A} = \hat{A}^{\dagger}$ 。

我们来看看problem 7650里的泡利自旋矩阵 $\sigma_y$ 。它是厄米矩阵吗？首先，我们取它的转置：

\sigma_y^T = \begin{pmatrix} 0 & i \\ -i & 0 \end{pmatrix}

现在，我们对每个元素取复共轭（将i替换为-i）：

(\sigma_y^T)^* = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix}

看！我们得到了原始矩阵，所以 $\sigma_y^{\dagger} = \sigma_y$ 。它是厄米矩阵。这个简单的检验是通往物理现实的大门。任何通过此检验的矩阵都可能代表你可以测量的东西。任何未通过的矩阵则不能。例如，在一个简单的练习中，我们给定几个矩阵，只有满足这个条件的矩阵，比如 $B = \begin{pmatrix} 1 & 1-i \\ 1+i & 0 \end{pmatrix}$ ，才能对应一个物理可观测量。对角元素必须是实数，而非对角元素 $B_{12}$ 必须是 $B_{21}$ 的复共轭，这些条件都满足了。

这个性质是如此基础，以至于如果我们要用其他已知矩阵构建一个哈密顿量（能量算符），我们必须以保持厄米性的方式来构建它，这反过来又对我们可以使用的数值系数施加了严格的限制关系。这不仅仅是一个数学游戏；这是关于物理世界结构的深刻陈述。这里有一个美妙的联系：虽然时间演化算符必须是幺正的（保持态矢量的长度不变），但这些演化的生成元——像能量这样的可观测量——结果是厄米算符。

寻找答案：本征值和本征态

所以，我们已经确定可观测量是厄米矩阵。很好。但是数字——实际的测量结果——在哪里呢？

它们隐藏在矩阵内部，提取它们的方法是解本征值方程：

\hat{A} | \psi \rangle = \lambda | \psi \rangle

这个方程看起来很抽象，但其思想却非常直观。把算符矩阵 $\hat{A}$ 想象成一个动作，比如“测量沿y轴的自旋”。大多数时候，当这个动作作用于一个任意的量子态矢量 $|\psi\rangle$ 时，它会把它变成一个完全不同的矢量。但对于某些特殊的状态，称为本征态， $\hat{A}$ 的作用仅仅是将该状态乘以一个数 $\lambda$ 进行缩放。这个态在抽象空间中的“方向”保持不变。这个特殊的数 $\lambda$ 被称为本征值。

奇迹就在这里：厄米算符的本征值总是实数。这是一个数学事实，也是整个结构能够成立的原因。对一个可观测量 $\hat{A}$ 进行测量的所有可能结果的集合，恰好就是它的本征值集合。

让我们用我们的老朋友 $\sigma_y$ 矩阵来看看这个过程。为了找到它的本征值，我们解特征方程 $\det(\sigma_y - \lambda I) = 0$ ，其中 $I$ 是单位矩阵。

\det \begin{pmatrix} -\lambda & -i \\ i & -\lambda \end{pmatrix} = (-\lambda)(-\lambda) - (-i)(i) = \lambda^2 - 1 = 0

解是 $\lambda = 1$ 和 $\lambda = -1$ 。这些是你在沿y轴测量电子自旋时唯一可能得到的值（在我们使用的单位下）。它们是实数，正如所承诺的那样！

系统的状态与跃迁之舞

我们有了可观测量（厄米矩阵）和可能的结果（它们的实数本征值）。但是系统本身呢？在我们测量它之前，它的状态是什么？

在矩阵力学中，系统的状态由一个矢量描述——一个我们称为右矢(ket)的列矩阵，写作 $|\psi\rangle$ 。对于我们的二能级量子比特系统，我们可以定义一个基。一个常见的选择是沿z轴有确定自旋的态构成的基，我们称之为 $|0\rangle$ 和 $|1\rangle$ 。

|0\rangle = \begin{pmatrix} 1 \\ 0 \end{pmatrix}, \quad |1\rangle = \begin{pmatrix} 0 \\ 1 \end{pmatrix}

现在我们可以看到算符对一个态做了什么。让我们将 $\sigma_y$ 算符作用于态 $|0\rangle$ ：

\sigma_y |0\rangle = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix} \begin{pmatrix} 1 \\ 0 \end{pmatrix} = \begin{pmatrix} (0)(1) + (-i)(0) \\ (i)(1) + (0)(0) \end{pmatrix} = \begin{pmatrix} 0 \\ i \end{pmatrix} = i \begin{pmatrix} 0 \\ 1 \end{pmatrix} = i|1\rangle

算符 $\sigma_y$ 将态从 $|0\rangle$ 翻转到了 $|1\rangle$ （并乘以了 $i$ ）。在量子力学中，我们常常想知道在算符 $\hat{O}$ 的影响下，从某个初态 $|\psi_i\rangle$ 跃迁到某个末态 $|\psi_f\rangle$ 的概率幅。这由“矩阵元” $\langle \psi_f | \hat{O} | \psi_i \rangle$ 给出。左矢(bra) $\langle \psi_f |$ 是右矢 $|\psi_f\rangle$ 的共轭转置。在我们的例子中， $\sigma_y$ 导致从 $|0\rangle$ 到 $|1\rangle$ 跃迁的概率幅是 $\langle 1 | \sigma_y | 0 \rangle$ 。利用我们上面的结果，可得 $\langle 1 | (i|1\rangle) = i \langle 1|1 \rangle = i$ ，因为态 $|1\rangle$ 是归一化的（ $\langle 1|1 \rangle = 1$ ）。这个跃迁的概率是概率幅的模长平方： $|i|^2 = 1$ 。跃迁是必然发生的！

选择正确的视角：对角化

我们写下矩阵和矢量的方式取决于我们选择的基态（比如我们的 $|0\rangle$ 和 $|1\rangle$ ）。这就像是选择用街道地址还是GPS坐标来描述一个位置。物理现实是相同的，但你写下的数字是不同的。

有没有一个“最好”的基矢可以使用呢？对于一个给定的系统，最自然的基几乎总是其哈密顿算符 $\hat{H}$ （总能量算符）的本征基。为什么？因为在这个基中，哈密顿矩阵变得异常简单：它是对角的。所有非对角元素都为零，而对角元素就是系统的能量本征值。

想象一个二能级系统，其中初始的基态 $|\psi_1\rangle$ 和 $|\psi_2\rangle$ （或许代表一个电子处于两个势阱之一）相互耦合。其哈密顿量可能看起来像这样：

H = \begin{pmatrix} E_0 + \delta & V \\ V & E_0 - \delta \end{pmatrix}

非对角项 $V$ 是一个“耦合”，导致系统在 $|\psi_1\rangle$ 和 $|\psi_2\rangle$ 之间振荡。这些不是“定态”，因为它们的能量没有明确定义。但是如果我们解出这个矩阵的本征值，我们就能找到系统的真实、确定的能级。如果我们然后用它自己的本征矢量所构成的基来写哈密顿量，表示形式会完全改变。新的矩阵，我们称之为 $H'$ ，将是对角的：

H' = \begin{pmatrix} E_a & 0 \\ 0 & E_b \end{pmatrix}

其中 $E_a$ 和 $E_b$ 是我们找到的能量本征值。在这个特殊的基中，没有耦合。一个能量为 $E_a$ 的态将永远保持能量为 $E_a$ （在没有其他微扰的情况下）。这个寻找本征基以使算符矩阵对角化的过程被称为对角化，它是量子物理学家工具箱中最强大的工具之一。

超越矩阵：从离散到连续

到目前为止，我们一直在玩一些小巧的 $2 \times 2$ 矩阵。但是，对于一个可以在一条直线上任意位置的粒子呢？它的位置不是两种状态之一，而是一个连续的变量。矩阵力学如何处理这种情况？

答案是矩阵变成了无穷维的。行和列的索引，之前是像1和2这样的离散数字，现在变成了像位置 $x$ 这样的连续变量。对矩阵元的求和变成了积分。态矢量不再是一列数字，而是一个连续的函数，即著名的波函数 $\psi(x)$ 。

但核心思想完全相同！像 $\langle \psi_m |\hat{O}| \psi_n \rangle$ 这样的矩阵元变成了一个积分：

O_{mn} = \int \psi_m^*(x) \hat{O} \psi_n(x) dx

例如，在量子谐振子（分子振动的模型）中，我们可以计算位置算符平方 $\hat{x}^2$ 在基态（ $n=0$ ）和第二激发态（ $n=2$ ）之间的矩阵元。这涉及一个看起来很复杂的、包含厄米多项式和高斯函数的积分，但最终，它只给出一个数字， $\frac{\hbar}{\sqrt{2}m\omega}$ 。这个数字的意义与我们简单的 $2 \times 2$ 矩阵元相同：它量化了一个物理算符在两个态之间的耦合程度。这一认识统一了Heisenberg的矩阵力学和Schrödinger的波动力学——它们是对同一底层现实的两种不同描述。

这个框架也清晰地解释了为什么有些算符可以代表可观测量，而另一些则不能。一维动量算符是 $\hat{p} = -i\hbar \frac{d}{dx}$ 。那个看起来无害的微分算符 $\frac{d}{dx}$ ，当作用于在边界处消失的波函数时（比如在盒子中），实际上是反厄米的。这意味着它本身不能代表一个物理可观测量。但是当乘以 $-i\hbar$ 后，得到的动量算符 $\hat{p}$ 是厄米的，它的本征值（可能的动量）是实数。这个形式体系正确地引导着我们。

能级不交叉规则：当能级相互排斥时

让我们以这个矩阵形式体系中最美丽、最不直观的预测之一来结束。考虑一个系统，比如一个分子，其两个能级依赖于某个参数，比如说两个原子之间的距离 $R$ 。在一个简化的“透热”视图中，我们可能有两条能量函数曲线 $E_1(R)$ 和 $E_2(R)$ ，它们在某个距离 $R_0$ 处相交。

矩阵力学怎么说？真实的哈密顿量包含一个非对角耦合项 $V$ ，它混合了这两个态。所以能量矩阵看起来像我们之前的 $2 \times 2$ 例子：

H(R) = \begin{pmatrix} E_1(R) & V \\ V & E_2(R) \end{pmatrix}

真实的能级是这个矩阵的本征值。正如我们之前发现的，本征值涉及一个平方根项： $\sqrt{(E_1(R) - E_2(R))^2 + 4V^2}$ 。这些能量有可能相等吗？要使之发生，平方根内的项必须为零。但是，如果耦合项 $V$ 不为零，那么 $4V^2$ 项总是正的！即使在 $E_1 = E_2$ 的 $R_0$ 点，平方根项也是 $\sqrt{4V^2} = 2|V|$ 。

能级可以靠得很近，但它们永远不能交叉。耦合项 $V$ 迫使它们相互“排斥”。这被称为避免交叉。能级之间的最小间隙恰好是 $2|V|$ 。这不是一个小修正；这是系统能谱性质的根本性改变，完全由一个 $2 \times 2$ 厄米矩阵的数学性质所预测。这一现象对于理解化学反应速率、材料中的能量转移以及许多其他量子现象至关重要。这是一个绝佳的例子，说明了矩阵力学简单而严格的规则如何揭示了量子世界深刻且常常令人惊讶的行为。

应用与跨学科联系

对于初次接触矩阵力学的学生来说，它可能感觉像是对Schrödinger更为直观的波动力学的一次奇怪而抽象的绕道。为什么要用无穷的数字数组和晦涩的乘法规则，来取代熟悉的函数和微分方程？事实证明，答案是Werner Heisenberg、Max Born和Pascual Jordan偶然发现的东西，远比仅仅是计算氢原子能级的另一种方法更为根本。他们发现了一种新的语言，一种数学句法，它将被证明是量子世界的母语。

一个物理理论的真正力量和美感，不仅体现在它为解决原有问题而设计的能力，更在于它意外开启的全新探究领域。现在我们已经掌握了矩阵力学的基本原理，可以开始一段激动人心的旅程，看看这个框架如何远远超出了简谐振子或氢原子的范畴。我们将看到，这些矩阵不仅仅是可观测量的抽象占位符；它们是量子计算机的齿轮和杠杆，是物质奇异态的蓝图，也是我们洞察时空和黑洞量子本质的最有希望的窗口。

从抽象代数到具体计算：量子信息

矩阵力学最直接、最具技术革命性的应用，或许是在量子计算领域。如果一个经典比特是一个简单的开关，0或1，那么一个量子比特（qubit）则是一个二维复矢量空间中的矢量。它的状态不仅仅是“上”或“下”，而是可以是任何叠加态，由一个列矢量表示。那么，是什么对这个状态执行操作呢？是一个矩阵。

量子算法中的每一个操作，每一个逻辑门，都是作用在量子比特态矢量上的一个幺正矩阵。我们学到的那些看似怪异的矩阵乘法规则，现在具有了具体、物理的意义。它们就是量子逻辑的法则。构建一系列门来执行一个算法，直接对应于按特定顺序将它们各自的矩阵相乘。

例如，一些最强大的双量子比特门，如受控Z门（ $CZ$ ），并非基本门，而是由更简单的门构造而成。通过对目标量子比特施加一个阿达玛门（ $H$ ），然后是一个受控非门（ $CNOT$ ），最后再施加一个阿达玛门，就可以精确地构筑出 $CZ$ 门。这个复合操作的最终 $4 \times 4$ 矩阵就是代表每一步的矩阵的乘积： $U_{CZ} = (I \otimes H) \cdot CNOT \cdot (I \otimes H)$ 。这种“矩阵工程”的过程是量子算法设计师的日常工作，将抽象的计算任务转化为由激光或磁场执行的具体物理操作序列。矩阵力学的语言，毫不夸张地说，是量子宇宙的汇编语言。

集体之舞：凝聚态与多体物理

从一两个粒子跃升到一块金属中 $10^{23}$ 个盘旋的电子，是物理学中最艰巨的挑战之一——多体问题。直接描述是不可能的。然而，在这里，矩阵力学也为驯服这种巨大的复杂性提供了关键工具。

考虑解释电阻。在一个微小的电子器件中，一个中心散射区域（可能是一个单分子）连接到宏观的电学引线。我们不可能对引线中的每一个原子进行建模。相反，我们使用基于矩阵的格林函数形式体系来做一件非常巧妙的事情。我们“积掉”环境，将其对我们分子的全部影响捕捉在一个称为自能的矩阵值函数 $\Sigma(E)$ 中。这个自能充当对分子自身哈密顿矩阵的修正。它的实部移动了分子的能级，而它的虚部则赋予了它们有限的寿命，代表了电子逃逸到引线中这一真实的物理过程。块矩阵求逆的抽象数学成为描述开放量子系统的强大物理工具，将微观世界与我们的宏观测量联系起来。

除了输运现象，矩阵力学甚至为表示多体系统的状态提供了一种革命性的方法。完整的波函数是一个复杂到噩梦般的对象。然而，对于一大类物理上重要的基态，将系统缝合在一起的量子纠缠具有一种特殊的、局域的结构。这种结构可以通过矩阵积态（Matrix Product State, MPS）以惊人的效率来捕捉。系统状态不再由一个巨大的张量描述，而是由一串小矩阵描述，每个粒子对应一个。系统的物理性质被编码在这些矩阵中。在现代物理学最美丽的发现之一中，人们发现对于某些“拓扑有序”的物相——这些物相具有隐藏的全局序，在任何局域测量中都不可见——纠缠谱揭示了这种隐藏的结构。通过在我们的矩阵链中做一个切割，并找到由此产生的约化密度矩阵的本征值，我们发现本征值成对简并出现。这种简并是一个稳健的、拓扑的标记，不能被小的扰动所消除。这是一个关于集体量子态的深刻真理，用矩阵本征值的语言书写而成。

最深层的结构：规范理论、弦论和量子引力

到目前为止，我们一直使用矩阵来描述量子系统。现在我们迈出一个激进的飞跃：如果矩阵本身就是基本的自由度呢？这是矩阵模型的核心思想，它是一种简化的“玩具”量子理论，其中动力学变量本身就是一个矩阵 $M(t)$ ，其元素随时间变化。

这些模型最初作为数学上的奇趣被研究，当Gerard 't Hooft证明在极大矩阵的极限下（ $N \to \infty$ ），某些量子场论——包括QCD（夸克和胶子的理论）的简化版本——变得可解时，它们便登上了中心舞台。在这些矩阵模型中，人们可以计算在完整理论中极其困难的性质，例如“胶球”的质谱，这是一种纯粹由胶子组成的束缚态，类似于质子但没有任何夸克。这些模型甚至可以表现出相变。在某个临界温度下，矩阵本征值的分布会突然改变，这一现象精确对应于规范理论中的禁闭-解禁闭相变，即夸克和胶子要么被永久地困在粒子内部，要么以自由等离子体的形式存在。一锅粒子汤的统计力学被映射到了矩阵本征值的统计力学上！

当我们进入弦论和量子引力的领域时，这种联系变得更加深刻。

在弦论中，D-膜是开弦可以端接的对象。在低能量下，一个包含 $N$ 个D-膜的系统的动力学由一个 $SU(N)$ 矩阵量子力学描述。矩阵元本身代表着在膜之间伸展的弦。现在，想象一个真正奇异的场景：一个膜是静止的，另一个在匀加速运动。根据安鲁效应（Unruh effect），加速的观察者会将真空体验为一个热浴。令人难以置信的是，这在矩阵模型中得到了体现：连接膜的弦模获得了一个与加速度成正比的热质量修正。相对论、热力学和量子力学在一个单一的矩阵方程中变得密不可分。

这个思想最壮观的应用是BFSS矩阵模型，这是一个关于M理论（我们通向“万有理论”的主要候选者）的完整、非微扰定义的提议。该模型假定，整个宇宙在其最基本的层面上，是由九个大矩阵的量子力学所描述的。在这个单一模型中，描述一个黑洞是可能的。惊人的是，该模型展现了一个完全类似于霍金-佩奇相变的相变，其中一团引力子热气体坍缩形成一个黑洞。矩阵本征值的“解禁闭”相对应于黑洞状态。

此外，对大型随机矩阵的研究（随机矩阵理论，RMT）为理解黑洞的量子性质提供了一个强大的统计框架。一个黑洞被认为是一个最大混沌的量子系统，其离散的能级应该遵循RMT的统计定律。谱形式因子（一种能量级相关性的度量）被预测会显示出一个特征性的“斜坡”——随时间的线性增长。当我们通过允许黑洞能级衰减来模拟其蒸发时，这个斜坡被修正，在下降前达到一个峰值。矩阵模型是研究量子混沌、离散性和蒸发之间相互作用的完美舞台，借此来应对像黑洞信息佯谬这样物理学中最深的谜题。

从量子计算机的实用逻辑到黑洞内部的深刻奥秘，Heisenberg引入的那些奇怪的数字数组，已经成为我们最通用、最强大的工具。矩阵力学的发展历程证明了抽象数学思想的力量，它能够揭示物理世界背后隐藏的统一性和令人惊叹的美。