张量网络：一种统一的复杂性语言

玻尔百科

定义

张量网络：一种统一的复杂性语言指一种通过关注符合面积定律的低纠缠态来解决维度灾难的数学框架。该方法通过将巨大的波函数分解为矩阵乘积态（MPS）或投影纠缠对态（PEPS）等可管理的张量结构，以此匹配物理系统的纠缠特征。除了量子物理领域，张量网络还为计算机科学、机器学习和逻辑建模中的复杂性问题提供了一种统一的描述语言。

核心要点

张量网络通过聚焦于希尔伯特空间中那些遵循纠缠面积定律的、与物理相关的微小角落，解决了“维度灾难”问题。
矩阵乘积态 (MPS) 是一种适用于一维系统的张量网络拟设，它将一个巨大的波函数分解为一条由小巧、可控的张量组成的链。
张量网络的几何结构，例如二维的 PEPS 或分支的树张量网络，必须被精心设计以匹配物理系统特定的纠缠结构。
除了量子物理学，张量网络还为复杂性提供了统一的语言，在计算机科学、逻辑谜题和机器学习模型中都有直接应用。

引言

理解由众多相互作用部分组成的系统——从高温超导体中的电子到复杂机器学习模型中的变量——是现代科学的一个决定性挑战。这一挑战在量子世界中表现得尤为严峻。量子力学的规则预测，随着粒子数量的增加，复杂性会呈现惊人的指数级增长，这个问题被称为“维度灾难”，它使得传统模拟方法除了对极小的系统外都无能为力。本文介绍张量网络，这是一个强大而优雅的数学框架，它通过利用自然界一个深刻的秘密——物理系统并非其可能达到的那般复杂——来驾驭这种复杂性。

本文将引导您了解这一革命性的范式。在第一章原理与机制中，我们将深入探讨核心概念，探索“纠缠面积定律”如何让我们绕开维度灾难。我们将看到这一原理如何体现在矩阵乘积态 (MPS) 中，后者是像 DMRG 这样非常成功的算法背后的引擎。在第二章应用与跨学科联系中，我们将见证这种语言非凡的普适性，超越量子物理的范畴，看张量网络如何为解决计算机科学、逻辑学乃至人工智能中的问题提供统一的框架。让我们首先直面催生了张量网络的那个巨大难题。

原理与机制

大数的暴政：一个大到无法探索的宇宙

让我们从一个谜题开始我们的旅程，这个问题乍一看似乎预示着任何理解多粒子量子世界的尝试都将以失败告终。想象你有一条由50个微小磁体或“自旋”组成的链，每个自旋都可以指向上或下。这是一个看似简单的系统。要完全描述它的量子态，你需要为这些自旋的每一种可能组态写下一个数——一个复数值系数。有多少种组态呢？第一个自旋有两种可能，第二个有两种，依此类推，总共有 $2^{50}$ 种可能性。

这个数字， $2^{50}$ ，大约是 $10^{15}$ 。要存储如此多的系数，将需要数拍字节(petabyte)的内存，这远远超出了标准计算机的能力。那么，如果我们有300个自旋呢？对于一个分子或一种材料来说，这只是一个不大不小的数目。组态的数量变成了 $2^{300}$ ，约等于 $10^{90}$ 。这个数字远大于整个可观测宇宙中原子的估计数量。这种复杂性的指数级爆炸，我们称之为维度灾难。

试图通过直接处理这些系数来解决量子问题，就像试图绘制地球上每一片海滩上每一粒沙子的地图。这就是像精确对角化 (ED) 等方法所面临的挑战。虽然原则上是精确的，但对一个有 $N$ 个自旋的系统进行 ED 的计算时间大致按 $O((d^N)^3)$ 指数增长，其中 $d$ 是每个格点的状态数（例如，对于一个自旋， $d=2$ ）[@2372978]。即使对于很小的 $N$ ，这也是完全不可能的。希尔伯特空间——这个所有可能量子态所居住的抽象空间——是一个我们根本无法完全探索的广袤宇宙。

那么，我们是否在开始之前就已经失败了？完全不是。事实证明，大自然出奇地“懒惰”。

小世界的秘密：纠缠与面积定律

关键的认识在于，自然界真正关心的状态——比如材料的基态（最低能量状态）——并不会在广袤的希尔伯特空间中随机游走。它们栖身于一个由深刻原理主导的微小特殊角落：纠缠的面积定律。

纠缠是粒子之间一种奇特的、独属于量子的关联。当两个粒子纠缠在一起时，无论它们相距多远，它们的命运都是相互交织的。一个量子态中的纠缠量并非均匀分布。对于大多数物理上现实的哈密顿量（那些主要具有局域相互作用的哈密顿量）的基态，纠缠具有一种非常特定的结构。

想象一下，我们将粒子系统划分为 A 和 B 两个区域。面积定律指出，A 和 B 之间的纠缠量不是随着区域 A 的体积（粒子数量）增长，而是随着分隔 A 和 B 的边界大小而增长 [@2801624]。

让我们把这个概念具体化：

对于一维自旋链（一个有能隙的系统），一个连续块的“边界”只有两个点，无论该块有多长。面积定律规定，纠缠是一个常数， $S \approx O(1)$ 。
对于二维薄片，一个区域的边界是其周长。面积定律表明，纠缠与该周长成比例， $S \propto L$ ，其中 $L$ 是线性尺寸。
在一些特殊的“临界”（无能隙）一维系统中，纠缠会略有增强，随区域大小对数增长， $S \propto \ln(L)$ 。

这是一个优美而有力的洞见。它告诉我们，物理基态只是“局域”纠缠的。一个粒子与其近邻的纠缠最强。这意味着我们不需要描述那些主导希尔伯特空间大部分体积的、极其复杂的长程纠缠模式。我们可以设计一种数学描述——一种拟设（ansatz）——它从根本上就遵循这种面积定律。这就是张量网络的诞生。

编织波函数：矩阵乘积态 (MPS)

对于一维系统，最完美的工具是矩阵乘积态 (MPS)。其思想异常简单。我们不再用一个包含所有 $d^N$ 个系数的庞大张量，而是将其分解为一条由 $N$ 个小得多的三阶张量组成的链，每个格点对应一个。可以将其想象成用一串索引卡片替换一本巨大、无法阅读的巨著，每张卡片描述一个粒子，并有指针连接到其左右邻居。

链中的每个张量都有三个“腿”：

一个物理指标（或腿），表示该格点上物理粒子的状态（例如，自旋向上或向下）。
两个虚拟指标（或腿），它们与链中相邻的张量进行缩并或“粘合”。

对于一个特定的组态 $|s_1 s_2 \cdots s_N\rangle$ ，其多体波函数的系数可以通过取出相应的张量 $A^{s_1}, A^{s_2}, \dots, A^{s_N}$ （现在它们是矩阵）并将它们相乘得到： $\mathrm{Tr}(A^{s_1} A^{s_2} \cdots A^{s_N})$ [@3018451]。因此得名“矩阵乘积态”。

虚拟腿的“粗细”被称为键维数，用 $D$ 或 $\chi$ 表示。这个单一的数字控制着 MPS 的能力。一个 MPS 在任何一个键上能捕捉到的最大纠缠熵为 $S \le \ln(D)$ [@2453948]。而魔力就在于此：对于一维有能隙系统，面积定律告诉我们纠缠是恒定的。这意味着我们可以使用一个固定的、小的键维数 $D$ 来获得一个极其精确的近似，无论链 $N$ 变得多长！

这就是为什么基于 MPS 的算法，如密度矩阵重整化群 (DMRG)，能取得如此惊人的成功。它们通过在由面积定律界定的、物理相关的希尔伯特空间小角落里工作，从而逃脱了维度灾难。DMRG 在一维系统中的计算成本不是指数级的，而是多项式级的，通常为 $O(N D^3)$ [@2372978]。

当然，并非所有状态都是生而平等的。MPS 非常适合表示像 Affleck-Kennedy-Lieb-Tasaki (AKLT) 态这样的状态，这是有能隙且具有短程纠缠的系统的典型例子。然而，像 Greenberger-Horne-Zeilinger (GHZ) 态 $|GHZ\rangle = \frac{1}{\sqrt{2}}(|00\cdots0\rangle + |11\cdots1\rangle)$ 这样具有长程关联的状态，对简单的 MPS 结构构成了挑战。虽然它们可以用一个很小的键维数（ $D=2$ ）来表示，但它们不是“单射的”。这是一个与转移矩阵中谱隙缺失相关的技术特性，它标志着它们的长程关联，并将其与典型的有能隙基态区分开来 [@3018451]。

探寻之路：变分优化与规范形式的魔力

好了，我们有了一个拟设——MPS，它是我们寻找的状态的良好容器。但是我们如何找到代表我们哈密顿量基态的那个特定的 MPS 呢？我们使用变分原理，这是物理学中最强大的思想之一。它指出，任何试验态 $|\psi\rangle$ 的能量期望值总是大于或等于真实的基态能量。

DMRG 算法巧妙地将这一点付诸实践。它通过一次优化一个或两个张量来迭代地优化 MPS，以最小化能量。想象一下，像拉拉链一样，沿着张量链来回扫描。在每个格点，你将链的其余部分固定，然后问：“我能放在这里的最好的张量是什么，以降低总能量？”

这个局域优化问题，本可能极其复杂，却奇迹般地简化了。它变得等价于求解一个小型有效哈密顿量的基态，这是一个标准的、可以高效求解的线性代数问题，即本征值问题 [@3018542]。

但即使这样也可能充满数值计算的风险。在计算中，微小的浮点误差会累积并被放大，很快导致结果变得毫无意义。这时，另一个体现了宁静优雅的技巧登场了：MPS 的规范形式。

通过使用一个特定的数学过程（与 QR 和 SVD 分解相关），我们可以将我们的 MPS 置于一个“混合规范”中。这就像为乐器调音。在这种形式下，我们优化位置左侧的张量是“左等距”的，而右侧的张量是“右等距”的。这带来了巨大的实际好处 [@2812372]：

数值稳定性：等距特性确保了由链的大部分缩并而成的环境张量的范数为1。这可以防止在扫描过程中数值误差的灾难性放大。它驯服了野兽。
简洁性：它将局域优化问题从广义本征值问题简化为标准的、条件更好的厄米本征值问题，后者求解起来更快、更稳定。
物理洞察力：最美妙的是，这种规范形式直接揭示了纠缠结构。在左、右正交归一部分之间的键上，会出现一个对角矩阵 $\Lambda$ ，其元素就是该切分下的态的施密特系数 [@3018566]。纠缠熵直接由这些系数计算得出： $S = -\sum_\alpha \lambda_\alpha^2 \ln(\lambda_\alpha^2)$ 。为了保持键维数固定而必须截断的量由被丢弃系数的平方和 $\sum_{\alpha > D} \lambda_\alpha^2$ 来量化。这为我们提供了一个严谨的、内置的仪表盘，用于在每一步监控我们近似的准确性！它还可作为诊断工具；如果我们态的范数（由 $\sum_\alpha \lambda_\alpha^2$ 给出）开始偏离1，我们就知道数值误差正在悄然滋生，并可以采取纠正措施 [@3018566]。

超越线型：向更高维度推广

MPS 在一维的成功引出了一个问题：二维或三维情况如何？当我们想要模拟一层石墨烯或一个复杂的非线性分子时会发生什么？

一个天真的方法是简单地将二维格点映射到一维链上，也许采用“蛇形”排序，然后用 DMRG 去处理。结果是惨败 [@2453948]。原因可以追溯到面积定律。在我们一维蛇形链中间的一次切割，对应于一条横穿原始二维格点的线。穿过这个边界的纠缠与其长度成比例，也就是系统的宽度 $w$ 。要在一个 MPS 键中捕捉到这种 $S \propto w$ 的纠缠，所需的键维数必须随宽度指数增长： $D \ge \exp(cw)$ [@2885153]。我们再次被维度灾难所困，这一次是几何上的。

解决方案既合乎逻辑又优雅：我们的张量网络拟设的几何结构必须与物理系统及其纠缠的几何结构相匹配。

投影纠缠对态 (PEPS)：对于二维系统，我们将 MPS 链推广到二维张量网格。现在每个张量有一个物理腿和四个虚拟腿，连接其东、南、西、北的邻居。这种 PEPS 结构天然地符合二维面积定律 [@2812399]。这是好消息。坏消息是，二维张量图中的闭环使得精确缩并在计算上变得困难（事实上是 #P-难问题）。这个“环路诅咒”意味着即使计算简单的期望值也需要复杂且昂贵的近似方法。因此，虽然 PEPS 是二维基态的正确理论语言，但它们在实践中的应用比一维的 MPS 要困难得多 [@2885153]。
树张量网络 (TTNS)：大自然并不总是一条线或一个网格。有时，纠缠模式更像一棵树，从一个中心点向外分叉。考虑一个过渡金属配合物，其中中心金属原子与周围的几个配体基团强烈纠缠，但配体之间仅微弱纠缠。将这种星形结构强加到线性的 MPS 链上会造成一个“纠缠瓶颈”，需要巨大的键维数。一种更有效的方法是使用树张量网络 (TTNS)，其网络图本身就是一棵模仿分子纠缠图的树 [@2812455]。这使得纠缠可以沿着多个平行的分支流动，从而保持所需的键维数较小，计算也更有效率。

这说明了张量网络的现代哲学：它不是要找到一个万能的灵丹妙药，而是要理解手头问题的纠缠结构，并选择一种能够提供最有效、最自然表示的网络拓扑。从简单的一维链到二维网格和分叉树，张量网络提供了一种强大而直观的语言，来描述复杂量子世界中隐藏的简单性。

应用与跨学科联系

现在，你可能会想，这一整套张量网络——这些由相互连接的张量组成的优雅图示——对于研究抽象量子自旋链的物理学家来说，是一个非常聪明的工具。你说得对。故事就是从那里开始的。但张量网络的故事是科学中那些美妙的实例之一，一个为解决特定深层问题而生的想法，最终被证明具有惊人的普适性。就好像在试图破译一个神秘的句子时，我们无意中发现了一种复杂性本身的基本语言。

在本章中，我们将从量子物理的发源地出发，去看看这种语言如何被用来重新表述和解决化学、计算机科学乃至人工智能等不同领域的问题。这些应用不仅仅是类比；它们是深层次的结构等价，揭示了科学领域间非凡的统一性。

发源地：量子多体物理

量子多体物理学的主要挑战是驯服指数级复杂性这头猛兽。一个包含 $N$ 个粒子的系统的希尔伯特空间随 $N$ 指数增长，使得除了极小的系统外，蛮力描述都变得不可能。张量网络的成功之处在于它甚至不去尝试描述整个空间。相反，它提供了一种语言来描述那个自然界实际栖息的、物理上相关的微小角落。这种相关性是由量子纠缠的结构决定的。

最简单也最成功的张量网络是矩阵乘积态 (MPS)，它是密度矩阵重整化群 (DMRG) 方法的引擎。对于具有“有能隙”能谱（意味着产生一个激发需要有限的能量）的一维量子系统，系统一半与另一半之间的纠缠出人意料地有限——它遵循“面积定律”，即它与边界的大小（在一维中只是一个点）成比例，而不是与体积成比例。MPS 的内在构造正是为了捕捉这种局域纠缠结构。这就是为什么 DMRG 能够以惊人的精度找到一维模型的基态，通过只关注具有物理上现实的纠缠的态来规避指数级的噩梦。这种能力在量子化学中找到了关键应用，它能够捕捉描述拉伸分子时困扰传统方法的“强静态关联”，为旧的近似方法提供了可系统性改进的替代方案。

但对于那些不是简单一维链的系统呢？或者那些处于“临界点”、纠缠是长程且不遵循简单面积定律的系统呢？在这里，MPS 的固定拓扑不再是最佳选择。张量网络框架的美妙之处在于其灵活性。我们可以设计不同的网络架构来匹配不同的纠缠模式。

对于具有分支、非线性几何形状的分子，树张量网络态 (TTNS) 可能远为高效。通过将张量排列成一棵能反映分子结构的树，我们可以比将其强行置于一维线上创建出更忠实、更紧凑的量子态表示。
对于表现出分形般自相似性的临界系统，多尺度纠缠重整化拟设 (MERA) 提供了一个优美的解决方案。其分层、等级的结构是专门为处理标度不变性而设计的。在 MERA 中，计算像长程关联函数这样的物理性质变成了一个系统地将算符“推”过网络各层的过程，每一步都有效地放大到更粗糙的尺度。

该框架甚至超越了对零温基态的探索。对于有限温度下的系统，量子涨落和热涨落混合在一起，又该如何处理？此类系统由混合态或密度算符描述，而非纯波函数。纯化这一绝妙技巧使我们能够处理这种情况。通过引入一个虚构的“辅助”系统——可以看作一个孪生宇宙——我们可以将我们物理系统的混乱混合态表示为这个组合系统中一个纯净、纠缠的纯态的一半。然后，我们可以通过从一个最大纠缠态（代表无限温度）开始，并用算符 $\exp(-\beta H/2)$ 进行虚时演化，来获得所需温度 $\beta$ 下的热态。由此浮现出一个深刻的联系：这个纯化态的范数直接与系统的配分函数有关，后者是统计力学的核心对象。

为了使这些方法真正实用，我们还必须教会我们的张量关于自然界的基本对称性。如果一个系统守恒总粒子数或总自旋，它的哈密顿量就具有对称性。通过将这种对称性直接构建到我们的张量中——使它们成为块稀疏的，只连接具有正确量子数的态——我们可以显著降低计算成本。这就像在开始搭建之前，先把一大堆乐高积木按颜色分类；你只需要处理相关的子集。此外，对于电子和其他费米子系统，还必须教会张量泡利不相容原理。这是通过在张量指标上编码一个“费米子宇称”来完成的，确保每当网络中两条费米子路径交换时，都会出现正确的负号，正如自然所要求的那样。这显示了该框架吸收量子力学最深层规则的强大能力。

通往抽象的桥梁：计算机科学与逻辑学

从量子物理到逻辑谜题的飞跃似乎很大，但张量网络轻松地架起了这座桥梁。思考一下我们熟悉的数独游戏。其核心是一个约束满足问题。你有一个变量网格（空格），每个变量都有一组可能的值，以及它们必须遵守的规则列表。

我们可以将一个数独谜题直接翻译成张量网络的语言。每一条局部规则——“这两个单元格必须不同”，“这个单元格必须是4”——都变成一个小张量，其元素对于允许的赋值为1，对于禁止的赋值为0。整个谜题变成了一个由这些简单的约束张量构成的大型网络。缩并这个网络这一行为，即根据图的连接对所有共享变量求和，会产生一个单一的数字。这个数字并非任意；它是该谜题有效解的总数。无解的谜题会产生0的结果。

这种联系比单纯的谜题要深刻得多。它触及了计算复杂性理论的基础。某些计算问题被认为是“困难的”。其中最著名之一是计算矩阵的积和式 (permanent)，它是行列式一个鲜为人知的表亲。虽然行列式可以被高效计算，但计算积和式是一个所谓的 #P-难问题，据信需要随矩阵大小指数增长的资源。

任何这样的计数问题都可以表示为一次张量网络缩并。缩并的计算成本主要由 $\chi^{tw}$ 决定，其中 $\chi$ 是最大键维数，而 $tw$ 是网络图的“树宽”。这意味着一个根本性的权衡。如果我们被告知一个问题是指数级困难的，那么没有任何神奇的张量网络可以使它变得容易。如果一个聪明的新网络设计降低了树宽 $tw$ ，它的键维数 $\chi$ 必须指数增长来补偿，从而保持总体复杂性不变。这表明，张量网络不仅仅是一种模拟工具；它们是一种计算模型，其结构和成本与其所代表问题的内在复杂性紧密相连。

新前沿：机器学习与数据科学

张量网络故事中最新、或许也是最激动人心的篇章是它们进入了机器学习和人工智能领域。在这里，对应关系同样不是类比，而是数学上的恒等。

对序列数据——如语音、金融时间序列或DNA序列——进行建模的一个基石是隐马尔可夫模型 (HMM)。HMM 假设存在一个未被观测到的隐藏“状态”序列，它生成了我们所看到的数据。一个基本任务是根据观测数据推断这些隐藏状态的概率。

事实证明，用于求解 HMM 的前向-后向算法的数学结构与矩阵乘积态的缩并是相同的。HMM 的转移概率构成一个矩阵乘积算符 (MPO)，而隐藏状态上的概率分布是一个 MPS。物理学家的 MPS 的“键维数”找到了新的含义，即统计模型的“记忆”或信息容量。在物理学中为 DMRG 截断键维数而开发的技术，在创建压缩的、近似的统计模型中有着直接的类比，使我们能够处理那些拥有巨大状态空间、否则将难以处理的 HMM。

这一发现打开了闸门。源于量子世界的张量网络语言，为设计新的机器学习架构提供了一个系统性的、有物理动机的、计算能力强大的框架。目前正在探索使用二维张量网络 (PEPS) 进行图像分析和分类，以及使用网络作为强大的生成模型，能够学习和从复杂的数据分布中采样的想法。

从量子纠缠最深刻的规律，到数独谜题的逻辑，再到我们数据中的模式，张量网络为描述和驾驭复杂性提供了一种统一的图形化语言。这段旅程远未结束，但已经清楚的是，这是科学史上最美丽、最出人意料的成功故事之一。