
量子多体问题是现代科学面临的最大挑战之一。描述几十个相互作用粒子的集体行为,所需存储的信息量就可能超过地球上所有计算机的总容量,这一局限性就是著名的“维度灾难”。为了取得进展,我们需要一种更智能的语言,一种能够抓住物理现实本质而又不会迷失在无关细节海洋中的语言。矩阵乘积态(MPS)就是这样一种语言——一个优雅且具有物理动机的框架,它能够驯服这种复杂性。
本文将对矩阵乘积态进行全面探讨。本文旨在帮助您从头开始建立理解,不仅揭示 MPS 是什么,更阐明其为何如此有效。我们将从第一章“原理与机制”开始,剖析 MPS 的结构,展示一个由简单矩阵构成的链如何编码一个复杂的量子态。我们将揭示 MPS 键维度与量子纠缠之间的深刻联系,并理解为何这种表示方法完美契合一维系统的物理特性。之后,“应用与跨学科联系”一章将带您领略 MPS 已成为不可或缺工具的广阔科学领域。您将看到它如何彻底改变了量子化学,为量子计算开辟了新途径,甚至在人工智能领域找到了令人惊奇的角色,从而展示了一个真正基本思想的统一力量。
那么,我们已经见识了量子多体问题这个奇特的“怪兽”。一个看似不起眼的系统(例如几十个原子组成的链)的状态,存在于一个极其庞大的数学空间中,以至于要写下描述它的所有数字,所需的硬盘驱动器数量将超过宇宙中的原子总数。暴力破解从一开始就注定失败。我们需要一种更巧妙、更物理的方法。矩阵乘积态(MPS)正是这样一种方法。它不仅仅是一个数学技巧,更是一种新的语言,一种专为描述自然规律(至少在一维情况下)而定制的语言。
首先,让我们形象地理解一下 MPS 是什么。想象我们的量子系统是一条由格点组成的链,就像串在绳子上的珍珠。每个珍珠代表一个量子实体——一个量子比特、一个自旋、一个轨道——它可以处于几种局域态中的一种。现在,整条链的完整状态是一个巨大的系数向量,其中每个系数对应所有珍珠所有可能状态组合中的一种。MPS 的思想是将其分解。我们不再使用一个巨大的数值张量,而是将状态表示为一个由更小的张量组成的链,每个格点对应一个张量。
我们可以用图来表示它,这不仅仅是卡通画,而是一张精确的数学地图。每个代表格点的张量是一个“节点”(我们可以画成圆形或方形)。每个张量都有伸出的“腿”,对应其指标。
每个张量上有一条腿指向“下方”(或“外部”)。这是物理指标。它使用真实世界的语言,标记该格点的局域态(例如,自旋向上或自旋向下,轨道占据或未占据)。这些腿是开放的,代表我们系统的物理自由度。
其他的腿是虚拟指标,它们是把我们的链条粘合在一起的“胶水”。链中部的每个张量都有两条虚拟腿,一条连接左边的邻居,一条连接右边的邻居。这些连接不仅仅是线,它们代表一种基本的数学运算,称为张量缩并——对共享的指标求和。链两端的张量比较特殊;因为它们只有一个邻居,所以只需要一条虚拟腿,这使得它们成为二阶张量,而中间的张量是三阶张量。
因此,我们得到的图像是一个由张量组成的线性链,通过虚拟键手拉手地连接在一起,每个张量都悬挂着一条描述量子系统一部分的物理腿。
这个图示链如何让我们得到波函数呢?假设我们想找到系统某个特定构型(比如一个 3 格点链上的 )的具体系数或振幅。MPS 的方法非常简单。
对于每个格点,你都有一组小矩阵,每个可能的物理态对应一个。对于处于 态的格点 1,你选择矩阵 。对于处于 态的格点 2,你选择 。对于处于 态的格点 3,你选择 。那么,态 的系数就是这个选定序列的矩阵乘积:。
请注意,为了得到一个单一的数字(一个标量系数),矩阵的形状必须是兼容的。对于一个开放链,第一个张量 是一组行向量,最后一个张量 是一组列向量。你可以把它想象成从一个向量开始,然后乘以一系列矩阵,最后通过最后一个向量投影回一个数字。
让我们用一个具体的例子来巩固这一点。假设在一个具有周期性边界条件(即两端相连形成一个环)的 3 量子比特链中,矩阵给定为 和 。为了找到 的系数,我们计算乘积 。因为我们有一个环,所以我们取结果的迹。计算很简单:。迹为 。所以,系统处于 态的振幅是 2。整个复杂的振幅张量被编码在这些优雅的、局域的矩阵乘法中。
所以,我们有了这条奇妙的矩阵链。是什么让它成为神来之笔或无用功呢?秘密在于一个我们称之为键维度的数字,通常写作 或 。
回顾我们的图示,键维度是连接我们张量的虚拟腿的“大小”。如果我们有 的矩阵,键维度就是 。这似乎是我们做出的一个简单选择——一个可以转动的旋钮。但它绝非任意。在一个揭示了物理学深刻统一性的奇妙转折中,这个简单的参数直接衡量了量子力学中最神秘、最深刻的特征之一:量子纠缠。
要了解其中的原理,我们必须绕一小段但至关重要的弯路。想象一下,你有一个由两个子系统 A 和 B 共享的量子态。它有多纠缠?有一个叫做施密特分解的优美数学工具可以回答这个问题。它告诉我们,任何这样的共享态都可以写成一个和: 这个和中的项数 就是施密特秩。如果 ,这个态只是一个简单的乘积态——完全没有纠缠。如果 ,它就是纠缠的。施密特秩越大,该态在 A-B 切割面上的纠缠就越“丰富”。
现在是关键所在,也是整个领域的基石:将一个量子态精确表示为 MPS 所需的最小键维度,恰好是你在链中任何切割处所能找到的最大施密特秩。
好好体会一下这句话。程序员为其模拟选择的 不仅仅是一个计算参数;它是一个关于该模拟准备处理的最大纠缠量的物理陈述。
考虑著名的 GHZ 态,。如果我们在第一个和第二个量子比特之间切割它,我们可以写成 。它有两项。施密特秩为 2。这条链中任何地方的最大施密特秩都是 2。因此,完美捕捉此态所需的最小键维度是 。不多不少。这是一种精确的对应关系。
这种键维度和纠缠之间的联系为我们提供了一个优美的解释框架。
键维度 :如果我们所有的“矩阵”都只是 的数字,那么用于计算系数 的大矩阵乘积就变成了标量的简单乘积。一个系数完全可因式分解的波函数代表一个乘积态——一个在格点之间完全没有纠缠的态。在量子化学的世界里,这相当于 Hartree-Fock 或平均场近似的水平,其中每个电子都独立于其他电子运动。这是我们的基准,是最简单的描述。
增加键维度:当我们将 从 1 增加到 2、3 甚至更高时,我们正系统性地允许越来越多的纠缠被构建到我们的描述中。我们正在攀登一个近似的阶梯,从不相关的平均场世界走向量子力学丰富、关联的现实。
最坏情况:我们能用这种方式表示任何态吗?可以!通过一系列奇异值分解(施密特分解的推广),可以证明任何态都可以精确地写成 MPS。但问题在于:对于一个完全泛型、随机的量子态(那种在任何地方都具有最大纠缠的态),所需的键维度将随着系统大小指数增长,其标度关系为 。这是一场灾难!在这种最坏的情况下,我们 MPS 中的参数数量将与原始态向量一样庞大。MPS 就没有为我们带来任何好处。
如果 MPS 只对“非泛型”态有效,为什么它是现代凝聚态物理学中最强大的工具之一?原因在于宇宙中一个深刻而美丽的真理:物理现实并非泛型。
具有局域相互作用的哈密顿量的基态——即事物主要影响其近邻,这对大多数基本力都成立——是非常特殊的、非泛型的态。它们遵循一个称为纠缠面积定律的原理。在一维情况下,链的两部分之间的边界“面积”只是一个点。面积定律表明,对于典型的(有能隙的)系统,穿过此切割面的纠缠熵不会随着子系统的增大而增长;它会饱和到一个恒定值。
这就是魔力所在!由于纠缠被一个常数所限制,所以任何切割面的施密特秩也是有限的。这意味着一个恒定的键维度 足以得到基态的极佳近似,即使链变得无限长也是如此。这就是为什么基于 MPS 的方法,如密度矩阵重整化群(DMRG),在一维问题上取得了惊人的成功。
当我们打破这种一维局域性时会发生什么?考虑像苯这样的分子,它具有环状结构。要使用 MPS,我们必须在概念上“切开”环,并将其展开成一条直线。这一操作在我们 MPS 链的第一个和最后一个格点之间人为地制造了长程相互作用。现在,我们 MPS 链中的一次切割可能需要承载环中两个物理连接的纠缠。纠缠度更高,要达到相同的精度需要大得多的键维度 ,这使得该方法效率降低。这优美地说明了 MPS 拟设是为类一维系统的纠缠结构量身定做的。
最后,MPS 表示不仅仅是一幅漂亮的图画;它还是一个计算的强大工具。因为状态被分解成可管理的部分,我们可以高效地计算物理性质。
交叠:要计算两个不同 MPS 态之间的内积 ,你可以想象将 的 MPS 放在 的 MPS 之上,并缩并所有相应的腿。这个过程将两条链“拉合”在一起,最终得到的数字就是交叠。
期望值:更重要的是,我们可以计算算符的期望值,比如能量或磁化强度。为了求算符 作用在格点 上的期望值 ,我们构成一个“三明治”结构。顶层是 bra ,底层是 ket ,在中间的格点 处,我们插入算符 。缩并这整个张量网络,就能得到我们想要的数字——我们量子系统的一个可测量属性。
本质上,矩阵乘积态提供了一个框架,它不仅对于受局域相互作用支配的物理相关态是紧凑和高效的,而且也是一个可以执行量子力学运算的实用计算画布。它通过利用物理现实的内在结构而成功,将一个不可能规模的问题转化为一系列可处理的、且通常是优雅的矩阵操作。
现在我们已经拆解了这台机器,看清了矩阵乘积态(MPS)的齿轮和弹簧是如何工作的,让我们来驾驭它吧!这个优雅的数学机械究竟在科学技术的世界中出现在哪里?你可能会认为,一个为一维量子粒子链设计的结构会是一个小众工具,一种专家的奇珍。但其应用的故事却出人意料地广博,并充满了智识的乐趣。
我们即将开始的旅程将向我们展示,这个“一维”思想并不仅仅用于描述微观磁体链。我们将看到它在现代化学的核心地带,驯服分子电子那狂野的复杂性。我们会发现它充当着构建新型量子计算机的蓝图,也是一个通过可控耗散来工程化量子世界的巧妙工具。我们甚至会发现它在人工智能的前沿领域学习新技巧。似乎大自然出于节俭,一遍又一遍地使用了同一个优美而简单的思想。那么,让我们开始我们的旅程吧。
对材料的研究,尤其是那些具有强量子效应的材料,是 MPS 的天然家园。它诞生于此,源自卓越的密度矩阵重整化群(DMRG)算法,作为描述一维量子系统基态的一种方式。
MPS 最经典的范例之一是自旋-1 链的 Affleck-Kennedy-Lieb-Tasaki(AKLT)模型。它的美妙之处在于,这是一个我们能精确求解的模型,并且它描述了一种新的量子序——我们现在称之为对称性保护拓扑相。真正非凡的是,它的基态不仅仅是由 MPS 近似的;它本身就是一个完美的 MPS,且键维度极小,仅为 。这不是近似;这是一个精确的恒等式。
这给了我们一个绝佳的实验场。我们可以使用我们学到的 MPS 机制来计算真实的物理性质。例如,AKLT 模型是“有能隙的”,这意味着创造一个最低能量的激发需要有限的能量——即“霍尔丹能隙”(Haldane gap)。我们如何从 MPS 中找到这个能隙?我们查看转移矩阵,。这个矩阵告诉我们关联如何在链上传播。根据归一化,它的最大本征值 总是 1。第二大本征值 告诉我们关联衰减的速度。关联长度 与这些本征值之比的对数成反比。对于有能隙的系统,其能量能隙 与这个关联长度成反比。因此,我们可以直接从定义该态的小矩阵中提取出关于系统能隙的关键信息。在这里,我们看到了从 MPS 的抽象组件到表征物质相的一个可测量数字之间一条华丽而直接的连线。
这是一个巨大的成功,但一个优秀的科学家——就像一个好的机械师——也必须知道他们工具的局限性。如果我们试图用我们的一维 MPS 来描述一个二维系统,比如一个 网格上的原子片层,会发生什么?一个常见的策略是在二维网格中蜿蜒穿行出一条一维路径。但这会产生一个问题。我们一维链中的一次切割现在对应于一条穿过二维晶格的长边界。对于有能隙的系统,一个称为“面积定律”的基本原理告诉我们,穿过一个切口的纠缠熵与其边界的大小成正比。对于蛇形路径,将系统一分为二的切口会产生一个长度与宽度(比如 )成正比的边界。因此,熵 的标度关系为 。现在,致命一击来了:表示一个熵为 的态所需的键维度 随之指数增长,。这意味着我们 MPS 所需的键维度会以 的方式爆炸性增长。通常与 成正比的计算成本变得不可思议地大。我们的一维工具在二维中失效了。
但就在我们准备放弃希望时,一个崭新而美丽的想法出现了。虽然 MPS 不擅长描述二维系统的全部(即“体”),但它们在描述其一维边界方面却非常出色。这是这些量子态“全息”性质的一部分。更高级的张量网络,如投影纠缠对态(PEPS),是为二维系统设计的,但它们的边界实际上是一维的矩阵乘积态。二维体的性质被编码在其边缘的 MPS 中,我们可以通过研究这个边界 MPS 来了解整个系统。所以,即使我们进入更高维度,MPS 仍然是一个基本且不可或缺的构建模块。
让我们离开理想化的自旋链世界,步入量子化学那个杂乱而奇妙的世界。化学家想要理解一个分子的行为——它会稳定吗?它会是什么颜色?它会催化反应吗?所有这些答案都深藏于分子的多电子波函数之中。问题在于,这个波函数是一个复杂到可怕的对象。对于一个有 个活性轨道的分子,在“完全组态相互作用”(FCI)计算中描述状态所需的系数数量呈指数增长。这就是臭名昭著的“维度灾难”,它长期以来一直是精确模拟许多重要分子的障碍。
DMRG算法和矩阵乘积态语言应运而生。关键的洞见在于,虽然真实波函数存在于一个大得离谱的空间中,但它并未探索空间的全部。对于大多数分子,特别是在其低能态下,纠缠结构并非随机和最大的;它遵循着模式。它通常遵循“面积定律”,就像有能隙的自旋链一样。这正是 MPS 让我们得以利用的、打破指数复杂性壁垒的裂缝。通过将巨大的 FCI 系数张量表示为 MPS,我们将指数数量的参数替换为一个与轨道数量成多项式标度关系的数,大约为 ,其中 是我们选择的键维度。
为了在实践中看到这一点,考虑最简单的化学键,即氢分子 中的键。在一个最小模型中,其基态主要由两个主要组态叠加而成:一个组态是两个电子都占据成键轨道,另一个较小的部分是它们都占据反键轨道。一个仅是两项之和的态向量,通过一系列奇异值分解,可以转化为一个键维度仅为 的精确 MPS。可怕的复杂性被驯服为一条由微小矩阵组成的简单链!
当然,对于真实的分子,情况更为复杂。该方法的艺术在于找到巧妙的方法,使 MPS 近似尽可能高效。例如,如何在一维链上排列分子轨道的顺序至关重要。将强纠缠的轨道在 MPS 链中相邻放置,可以“局域化”纠缠,从而用较小的键维度达到相同的精度。此外,MPS 拟设可以与传统的量子化学方法相结合。在 DMRG-SCF(自洽场)方法中,计算变成了一场舞蹈:在一系列“微迭代”中,DMRG 算法为一组固定的轨道优化 MPS。然后,在一次“宏迭代”中,轨道本身被旋转和优化,以降低 MPS 波函数的能量。这个循环不断重复,直到找到波函数和轨道的自洽解。这种强大的组合推动了计算化学可能性的边界,使得一度被认为复杂到无法处理的分子也能得到近乎精确的解。
MPS 的普适结构使其能够从原子和分子的物理世界跃入信息和计算的抽象世界。在这里,它找到了几个令人惊讶而美丽的归宿。
首先,让我们考虑量子计算。一种范式,称为基于测量的量子计算,不使用量子门。相反,你从一个高度纠缠的“资源态”开始,然后对其单个量子比特进行一系列测量。测量的选择决定了你运行的算法。最重要的资源态之一是“纠缠簇态”。这个神奇的态是什么呢?原来,一维纠缠簇态可以由一个键维度为 的简单矩阵乘积态完美表示。这是物理学惊人统一性的又一个例子:一个描述量子磁体的结构也可以作为量子计算机的原材料。
也许更令人惊讶的是 MPS 在开放量子系统领域中的作用。我们通常认为“环境”是反派,是破坏脆弱量子态的噪声和退相干的来源。但是,如果我们能把反派变成英雄呢?这就是耗散态制备的思想。通过精心设计我们的系统(例如,一条自旋链)与环境之间的相互作用,我们可以使系统演化到一个独特的、期望的稳态。我们可以设计局域的“跳跃算符”来描述耗散过程,使得一个特定的、高度纠缠的 MPS 成为这些算符唯一的“暗态”——即它们唯一保持不变的态。因此,系统被主动“冷却”到目标 MPS 中,并且对扰动是稳定的。这是最优雅的量子工程,利用了宇宙趋向耗散的倾向为我们服务。
最后,MPS 的旅程将我们带到现代人工智能的前沿。考虑一个任务,比如对数据序列进行分类——这个像素序列是“猫”还是“狗”?这个股价的时间序列预测是“买入”还是“卖出”?这可以被构建为一个将长输入向量映射到小的类别得分输出向量的函数。这正是 MPS 所做的事情!我们可以将 MPS 解释为一个分类模型,其中每个位置的输入数据选择使用局部张量中的哪个矩阵。整个矩阵链的缩并——一个简单、高效的矩阵乘积——计算出最终的得分。这个视角将 MPS 与其他用于序列的机器学习模型,如循环神经网络(RNNs),联系起来,并开辟了一个新的领域——“张量网络机器学习”。
在所有这些从物理到机器学习的数值应用中,实践智慧是关键。找到一个复杂系统的基态就像在一个广阔、多山的地形中找到最低点。从一个随机点(“冷启动”)开始可能会让你陷入一个高海拔的山谷。一个好得多的策略是“热启动”:首先,解决一个你知道答案的更简单版本的问题,并用该解作为解决更难问题的出发点。用 MPS 的语言来说,我们可以找到一个简单的、无相互作用的哈密顿量的基态 MPS,并将其用作优化程序的初始猜测,以找到完整的、有相互作用系统的基态。这提供了一个好得多的起点,从而实现更快、更可靠的收敛。
我们的旅程结束了。我们从一条量子磁体链开始,以机器学习告终。一路上,我们看到我们的主角——矩阵乘积态——驯服了分子中电子的复杂性,充当了量子计算机的资源,并从量子噪声的巧妙工程中产生。MPS 的故事是关于科学本质的一堂深刻的课。它展示了一个领域中对问题的深刻而正确的表示如何能够向外扩散,为人们从未预料到的领域带来清晰的认识和新的能力。它是一条统一的线索,一个简单而美丽的思想,将科学织锦中迥然不同的角落编织在一起。