多维数组

玻尔百科

定义

多维数组是计算机科学中的一种数据结构，作为数学和物理学中张量这一基本对象的具体计算表示形式。这些数组在计算机内存中以行主序或列主序进行线性存储，并利用步幅概念来实现切片和广播等高效的零拷贝操作。该结构通过张量网络和分解技术，广泛应用于从大数据到量子力学等领域，用于管理和分析复杂的物理量。

核心要点

多维数组使用行主序或列主序在线性计算机内存中存储，这一选择对缓存效率和程序速度有关键影响。
“步幅”的概念统一了内存地址计算，使得现代计算库中能够实现如切片、转置和广播等强大的零拷贝操作。
多维数组是张量的具体计算表示。张量是数学和物理学中的一个基本对象，用于描述像应力和时空曲率这样的复杂量。
张量网络和张量分解利用数组结构来管理和分析从大数据到量子力学等领域中极其复杂的问题。

引言

我们如何组织那些无法整齐地放入单一列表的数据？从电子表格的网格到三维医学扫描，再到四维气候模拟，我们凭直觉就能理解多维数据的概念。然而，计算机的内存虽然广阔，其本质上却是一个一维的地址序列。这在我们在逻辑上的多维数据视图与其物理上的线性现实之间造成了一道关键的鸿沟。本文将填补这道鸿沟，探索多维数组这一简单的数据结构如何成为现代科学与计算的基石。

接下来的章节将引导您深入了解这个引人入胜的主题。首先，“原理与机制”一章将揭示在内存中存储数组的基本技术，解释行主序和列主序布局之间的关键差异，并引入优雅而统一的“步幅”概念。我们将看到这一机制如何实现无需复制数据的高效操作。随后，“应用与跨学科联系”一章将揭示这一切为何重要，我们将从高性能计算和大规模数据管理出发，探索数组作为物理学中张量语言的深远作用，它使我们能够模拟从材料属性到宇宙量子态的一切事物。

原理与机制

想象一下你在整理一个巨大的图书馆。你可以把书排在书架上，每个书架放一排书。通过书架号和书在架上的位置，就可以确定一本书。现在，想象一个更复杂的图书馆，有多个楼层、翼楼和过道。你需要一个坐标系——楼层、翼楼、过道、书架、位置——才能找到任何一本书。这就是多维数组的本质：一种使用多个索引来组织数据的方法。

但是，计算机的内存不是一个多层图书馆，而是一条极长的一维街道。每一个数据，无论其逻辑结构多么复杂，最终都必须在这条街上拥有一个唯一的地址。那么，我们如何将直观的多维数据网格映射到计算机内存严酷的线性现实中呢？这是表示多维数组的根本问题，其解决方案是一件精美的计算艺术品。

两种顺序的故事：行主序与列主序

让我们从一个简单的二维数组开始，比如棋盘或电子表格。我们可以认为它有行和列。要将它排成一条直线，我们有两种自然的选择。

我们可以先排第一行，然后是第二行，第三行，以此类推。这被称为行主序（row-major order）。当我们沿着内存行走时，最后一个索引（列索引）变化得最快。要从元素 A[i][j] 移动到 A[i][j+1]，我们只需移动到下一个内存位置。要从 A[i][j] 移动到 A[i+1][j]，我们必须跳过一整行。这是 C/C++ 语系、Python 和许多其他语言使用的约定。

或者，我们可以先排第一列，然后是第二列，以此类推。这被称为列主序（column-major order）。在这里，第一个索引（行索引）变化得最快。要从 A[i][j] 移动到 A[i+1][j]，我们移动到下一个位置。要跳到下一列 A[i][j+1]，我们必须跳过一整列的元素。这是 Fortran、MATLAB 和 R 使用的约定。

让我们具体来看。考虑一个形状为 $\langle 3, 4, 5 \rangle$ 的三维数组。要找到索引为 $\langle i_0, i_1, i_2 \rangle = \langle 1, 2, 3 \rangle$ 的元素的线性地址，我们需要计算在它之前有多少个元素。

在行主序中（最后索引变化最快）：

我们必须跳过第一个完整的“平面”（索引 $i_0=0$ ）。一个平面有 $4 \times 5 = 20$ 个元素。
在第二个平面（ $i_0=1$ ）内，我们必须跳过前两个完整的“行”（索引 $i_1=0, 1$ ）。一行有 $5$ 个元素，所以我们跳过 $2 \times 5 = 10$ 个元素。
在我们的目标行（ $i_1=2$ ）内，我们必须跳过前三个元素（索引 $i_2=0, 1, 2$ ）。
要跳过的元素总数为 $(1 \times 4 \times 5) + (2 \times 5) + 3 = 20 + 10 + 3 = 33$ 。由于我们使用从零开始的索引，我们的元素位于线性位置 33。

在列主序中（第一索引变化最快）：

我们必须跳过由最后一个索引定义的前三个完整的“超列”（ $i_2=0, 1, 2$ ）。每个“超列”包含前两个维度的所有元素，即 $3 \times 4 = 12$ 个元素。我们跳过 $3 \times 12 = 36$ 个元素。
在第四个超列（ $i_2=3$ ）内，我们必须跳过由第二个索引定义的前两个完整的“列”（ $i_1=0, 1$ ）。每列有 $3$ 个元素。我们跳过 $2 \times 3 = 6$ 个元素。
在我们的目标列（ $i_1=2$ ）内，我们必须跳过第一个元素（索引 $i_0=0$ ）。
总数为 $(3 \times 3 \times 4) + (2 \times 3) + 1 = 36 + 6 + 1 = 43$ 。该元素位于线性位置 43。

如您所见，同一个逻辑元素 $\langle 1, 2, 3 \rangle$ 根据布局约定的不同，最终会存储在内存中两个完全不同的位置。这就是为什么理解内存布局如此关键，尤其是在不同编程语言需要相互通信时。想象一下，一个 C 函数试图读取一个由 Fortran 创建的数组；如果不知道布局差异，它将读到完全无用的数据！

步幅的秘密：一个统一的思想

不断地乘开维度是乏味的，而且似乎针对每种布局都有特定方式。有一种更优雅、更强大的思考方式：步幅（strides） 的概念。对于给定的维度，其步幅就是在线性内存中，为了将该维度的索引加一而必须“跨越”的元素数量。

索引为 $(i_0, i_1, \dots, i_{d-1})$ 的元素的线性地址可以用一个优美的公式表示：

\text{Linear Address} = \text{offset} + \sum_{k=0}^{d-1} i_k \cdot \text{stride}_k

让我们回到我们的 $\langle 3, 4, 5 \rangle$ 数组。对于行主序布局：

要在最后一个维度（ $i_2$ ）上移动一步，你在内存中移动一个位置。所以， $\text{stride}_2 = 1$ 。
要在中间维度（ $i_1$ ）上移动一步，你必须跳过最后一个维度的整整一行。所以， $\text{stride}_1 = 5$ 。
要在第一个维度（ $i_0$ ）上移动一步，你必须跳过中间和最后维度的整个平面。所以， $\text{stride}_0 = 4 \times 5 = 20$ 。步幅向量是 $\langle 20, 5, 1 \rangle$ 。 $\langle 1, 2, 3 \rangle$ 的地址是 $1 \times 20 + 2 \times 5 + 3 \times 1 = 33$ 。

对于列主序布局：

要在第一个维度（ $i_0$ ）上移动一步，你移动一个位置。 $\text{stride}_0 = 1$ 。
要在第二个维度（ $i_1$ ）上移动一步，你跳过第一个维度的整整一列。 $\text{stride}_1 = 3$ 。
要在第三个维度（ $i_2$ ）上移动一步，你跳过前两个维度的整个平面。 $\text{stride}_2 = 3 \times 4 = 12$ 。步幅向量是 $\langle 1, 3, 12 \rangle$ 。 $\langle 1, 2, 3 \rangle$ 的地址是 $1 \times 1 + 2 \times 3 + 3 \times 12 = 43$ 。

基于步幅的公式是解锁任何布局的通用钥匙。它还能优雅地处理像内存填充（memory padding）这样的实际复杂情况。有时，出于性能原因，库可能会在每行末尾分配一些额外的空间。对于一个 $m \times n$ 的数组，每行可能存储在一个大小为 $n+\pi$ 的空间中，其中 $\pi$ 是填充量。基于步幅的计算很自然地处理了这种情况：行索引的步幅就变成了 $n+\pi$ 而不是 $n$ 。

视图的魔力：不动数据而观数据

步幅概念的真正力量在于它将数组的逻辑形状与其物理布局分离开来。通过巧妙地操作形状、步幅和基底偏移量，我们可以创建相同底层数据的不同“视图”，而无需复制任何一个元素。这是现代科学计算库如 NumPy 和 PyTorch 高效性的秘密。保存这些信息——指向原始数据的指针、形状、步幅和偏移量——的数据结构有时被称为胖指针（fat pointer）。

让我们看看这些魔法的实际应用：

转置：假设我们有一个行主序数组 $P$ ，形状为 $\langle 3, 4 \rangle$ ，步幅为 $\langle 4, 1 \rangle$ 。如果我们想将其视为其转置 $Q$ ，形状为 $\langle 4, 3 \rangle$ ，需要复制数据吗？不需要！我们只需交换步幅。新的视图 $Q$ 的形状将是 $\langle 4, 3 \rangle$ ，步幅为 $\langle 1, 4 \rangle$ 。它现在表现得像一个列主序数组，指向完全相同的内存。
切片与反转：只想查看偶数索引的列？我们可以创建一个视图，其中列维度的步幅乘以 2。想反向查看一行？我们可以使用负步幅！负步幅只是告诉索引公式在内存中向后走。
广播：这可能是最令人费解的技巧。想象你有一列数据，想把它加到一个更大矩阵的每一列上。我们不必一遍又一遍地复制那一列，而是可以创建一个视图，其中列维度的步幅设置为零。当该维度的索引变化时，地址计算完全不变（ $i_k \times 0 = 0$ ）。广播视图中的每个“虚拟”列都指向相同的物理数据。这是一种在不同形状的数组之间执行操作的极其高效的方式。

其中一些操作，如广播，是“廉价”的、仅需更改元数据的操作。而另一些操作，比如让转置后的视图再次变得连续，则是“昂贵”的，因为它们需要完整的数据复制和重新排列，这个过程称为重建索引（reindexing）或实体化（materialization）。

当模型失效时：交错的边缘

步幅模型很强大，但它依赖于一个关键假设：数组是一个矩形（或超矩形）网格。每一行都有相同的长度，每一个“平面”都有相同的形状，等等。如果这不成立呢？

考虑一个交错数组（jagged array），它是一个数组的数组，其中每个子数组可以有不同的长度。例如，你可能用它来存储一个段落中的句子，其中每个句子（一个字符子数组）的长度都不同。

交错数组不能用单个连续的数据块和单个步幅向量来表示。步幅模型在这里失效了。取而代之的典型实现是“指针数组”。顶层数组是一个连续的内存地址块。每个地址指向一个独立分配的、包含该行数据的内存块。

在交错数组中访问元素 A[i][j] 是一个两步过程：

前往顶层数组的第 $i$ 个位置以获取一个内存地址。
前往那个新地址并找到第 $j$ 个元素。

这个“额外的间接层级”会带来性能后果。关键是，它会破坏空间局部性（spatial locality）。在一个真正的二维数组中，遍历一列（例如 A[0][j]、A[1][j]、A[2][j]）可能涉及以固定步幅跳跃，但内存访问仍然可能相对集中。而在交错数组中，因为每一行可以位于内存的任何地方，同样的列遍历可能涉及跳到完全随机且遥远的内存位置，导致缓存性能不佳。

伟大的统一：数组作为张量

到目前为止，我们一直将多维数组视为一种巧妙的计算机科学数据结构。但它的意义远不止于此，它统一了计算机科学与物理学和数学。多维数组是张量（tensor）的具体计算表示。

在广义相对论和流体动力学等领域，物理量由张量描述。你可能听说过向量（如速度或力）和标量（如温度或质量）。向量可以看作是一阶张量，标量可以看作是零阶张量。但还有更复杂的对象。材料中的应力，它关联了表面的方向与作用在其上的力，是一个二阶张量。描述时空曲率的黎曼曲率张量（Riemann curvature tensor）是一个四阶张量。

在一个 $n$ 维流形（比如我们的四维时空）上的一点，一个 $(k, l)$ 型张量是一个多线性机器，它接受 $k$ 个协变向量和 $l$ 个向量，然后产生一个数。所有这类张量的集合构成一个向量空间。当我们为我们的空间选择一个基（一个坐标系）时，这个抽象的张量可以用一组数字来表示——它的分量。一个 $(k,l)$ 型张量将有 $k+l$ 个索引，如果底空间是 $n$ 维的，每个索引的取值范围是从 $0$ 到 $n-1$ 。分量的总数是 $n^{k+l}$ 。

这正是我们的多维数组！三维空间中的一个二阶张量有两个索引和 $3^2=9$ 个分量，我们可以将其存储在一个 $3 \times 3$ 的矩阵中。四维时空中的黎曼曲率张量 $R^i{}_{jkl}$ 有四个索引和 $4^4=256$ 个分量，正好可以放入一个 $4 \times 4 \times 4 \times 4$ 的数组中。这个分量数组包含了该张量在特定坐标系下的所有信息。当你改变坐标系时，转换张量分量的规则，正是我们前面看到的那些复杂的、结构化的重建索引和数据重排操作，比如“角点转置”（corner turn）。

更深远的联系也随之浮现。例如，任何二阶张量都可以唯一地分解为一个对称部分和一个反对称部分。在四维空间中，一个普通二阶张量的 16 个分量分解为对称部分的 10 个分量和反对称部分的 6 个分量。这种数学分解具有深刻的物理意义——例如，电磁场就是由一个反对称的二阶张量描述的。

因此，源于在计算机线性内存中组织数据的实际需求而诞生的、不起眼的多维数组，最终竟成为我们用来描述宇宙基本结构的语言。从为一个简单程序安排数据，到编码时空的曲率，形状、步幅和内存布局的原理为探索发现提供了一个强大而统一的框架。

应用与跨学科联系

在上一章中，我们深入幕后，了解了计算机如何在其线性内存中排列多维数组。这可能看起来像是一项巧妙但相当枯燥的计算机工程。你可能会想，仅此而已吗？一个方便的数字归档系统？答案是一个响亮的“不”——我希望你会和我一样，觉得这个答案令人愉悦。

在本章中，我们将踏上一段旅程，看这个简单的想法如何演变成现代科学中最强大、最统一的概念之一。我们将看到它从一个纯粹的数据容器转变为一个高性能引擎，然后成为一种描述物理世界的新语言，最终成为一个解决量子力学中令人难以置信的复杂性的工具。事实证明，不起眼的多维数组是解开自然界一些最深奥秘的钥匙。

数组作为高性能引擎

让我们从最直接的应用开始。选择行主序还是列主序不仅仅是约定俗成的问题，更是速度的问题。现代计算机处理器速度极快，但它们常常因为从内存中获取数据的过程相对缓慢而被迫等待。为了加快速度，它们使用“缓存”——一种小而快的内存库，用于存储处理器可能很快需要的数据。使用缓存最有效的方法是一次性读取一块连续的内存。

想象一下，你有一个大的二维数组，一个数字网格。如果它以行主序存储，那么第一行的所有元素在内存中是相邻的，然后是第二行的所有元素，以此类推。如果你编写一个程序逐行遍历该网格，处理器可以用几次高效的“大口吞咽”来获取整行数据。但如果你的程序决定逐列访问数据，它就必须为每一个数字在内存中跳来跳去。每一次跳跃都有“缓存未命中”（cache miss）的风险，迫使处理器等待一次缓慢的主内存访问。这种差异可能是惊人的——相同的计算可能需要十倍甚至一百倍的时间！

这就是为什么理解底层内存布局是高性能计算的基石。几十年来，科学程序员都知道，要让他们的 Fortran 代码（使用列主序数组）飞速运行，他们应该在最内层循环中遍历第一个索引。对于 C、C++ 和 Python 程序员（使用行主序数组）来说，情况正好相反。优化从天气预报、视频游戏图形到大型金融模型的各种代码的全部艺术，都始于这个基本原则：顺应内存布局工作，而不是与之对抗。计算“步幅”（即沿着给定维度移动所需跨越的内存步数）的公式，正是实现这种高效访问的引擎。

驯服科学数据的洪流

尽管性能至关重要，但数组在科学中的作用早已超越了仅仅加速循环。现代科学正被数据淹没。大型强子对撞机从粒子碰撞中产生 PB 级的数据。气候模拟在一个四维网格（纬度、经度、高度和时间）上产生 TB 级的气象数据。神经科学家通过高分辨率扫描绘制大脑图谱，创建了巨大的三维数据集。

你如何组织这股洪流？你不能只是把十亿个文件扔进一个名为“实验”的文件夹。你需要结构。这时，多维数组就站了出来，它不再是一个孤立的对象，而是作为一个更大系统的基本构建块。

于是，层次化数据格式应运而生，例如被广泛使用的 HDF5（Hierarchical Data Format 5）。你可以把 HDF5 文件看作一个包含在单个文件内的复杂文件系统。在这个文件内部，有类似文件夹的“组”，这些组可以包含其他组，形成树状结构。在这棵树的叶子节点上，就是我们熟悉的、带类型的多维数组——“数据集”。

因此，一位气候科学家可以将他们的模拟结果存储在一个单一的、自描述的文件中。他们可能有一个组 /run_08/，其中包含像 temperature（一个 $4D$ 数组）和 pressure（另一个 $4D$ 数组）这样的数据集，以及 station_locations（一个经纬度的 $2D$ 数组）。这种方法将相关数据放在一起，使其易于移植，并允许强大的操作，如“切片”——例如，提取特定高度和时间的二维温度图。这种支撑着现代数据驱动科学大部分工作的强大结构化数据管理范式，完全建立在多维数组的基础之上。

一种新的自然语言：张量的兴起

到目前为止，我们一直将数组视为容器。但现在，我们进行一次改变一切的抽象飞跃。我们开始将多维数组不仅仅看作一种数据结构，而是一个几何对象——一个张量。

你已经熟悉了前几阶的张量：

一个单独的数字，即标量，是零阶张量。
一个数字列表，即向量，是一阶张量。
一个数字网格，即矩阵，是二阶张量。
我们带有 $N$ 个索引的多维数组，你猜对了，就是一个N阶张量。

这可能看起来只是换了个名字，但它带来了一种强大的新思维方式，通常通过张量网络图来可视化。在这种图形语言中，一个张量是一个形状或“节点”，它的每个索引都是一个伸出的“腿”或“边”。一个矩阵 $M_{ij}$ 是一个有两条腿 $i$ 和 $j$ 的节点。

真正的魔力发生在我们组合张量时。最常见的运算——矩阵乘法——变得异常直观。要计算 $C_{ik} = \sum_j A_{ij} B_{jk}$ ，我们只需将张量 $A$ 的 $j$ 腿连接到张量 $B$ 的 $j$ 腿。对共享索引求和称为缩并（contraction），它通过连接腿来表示。剩下的“开放”的腿， $i$ 和 $k$ ，成为结果张量 $C$ 的腿。

即使是像奇异值分解（SVD）这样的基本工具，它表明任何矩阵 $M$ 都可以写成三个特殊矩阵的乘积 $M=USV^T$ ，也呈现出一种简单、优雅的形式。在索引表示法中，这是 $M_{ab} = \sum_c U_{ac} S_{cc} V_{bc}$ （使用一种常见的物理学约定）。作为一个张量网络，这只是一个简单的链条：张量 $U$ 连接到张量 $S$ ，后者又连接到张量 $V$ 。曾经一整页的线性代数变成了一幅连孩子都能画出的图画。这种图形语言将我们从索引的暴政中解放出来，让我们能够看到复杂方程的底层结构。

形状、形态与结构的物理学

这种新的张量语言不仅仅是一种符号上的便利；事实证明，它是物理学的母语。张量对于描述同时具有大小和方向（通常是多个方向）的属性至关重要。

考虑固体材料的弹性。如果你拉伸一块橡胶，它会伸长。应力（内力，一个二阶张量）和应变（形变，另一个二阶张量）之间的关系由材料的刚度来描述。这个刚度不是一个单一的数字，它是一个四阶张量， $\mathbb{C}$ ，有四个索引。方程是 $\sigma_{ij} = \sum_{k,l} C_{ijkl} \varepsilon_{kl}$ 。

在三维空间中，一个普通的四阶张量有 $3^4 = 81$ 个分量。描述一种材料的变形真的需要 81 个数字吗？幸运的是，物理学强加的对称性极大地简化了问题。因为应力张量和应变张量本身是对称的，所以 $\mathbb{C}$ 必须具有“次对称性”（ $C_{ijkl} = C_{jikl} = C_{ijlk}$ ），这将独立分量的数量减少到 36 个。此外，如果材料能量守恒（一个非常合理的假设！），则会出现额外的“主对称性”（ $C_{ijkl} = C_{klij}$ ）。这使得对于最一般的各向异性（方向依赖）晶体，独立分量的数量减少到仅 21 个。这是一个深刻的洞见：深层的物理定律以描述世界的张量中的简单数学对称性形式表现出来。

对于各向同性材料——在所有方向上表现相同的材料，如玻璃或钢——简化甚至更为显著。21 个分量塌缩为仅仅两个！（通常表示为体积模量和剪切模量）。刚度张量本身可以进行谱分解，分为两个不同的部分：一个控制体积变化阻力的“静水”投影算子，和一个控制形状变化（剪切）阻力的“偏”投影算子。

这个框架也为我们提供了设计新材料的工具。在微观力学领域，张量被用来预测复合材料的性能。如何找到碳纤维增强聚合物的有效刚度？你从碳纤维和聚合物的刚度张量开始，然后使用另一组称为“定位张量”的张量，就可以计算出整个复合材料的有效刚度张量。张量提供了从微观组分到宏观行为的桥梁所需的数学机制。

驯服巨大的复杂性

当我们面对无论是大数据还是量子物理学中极其复杂的系统时，张量视角的真正威力就显现出来了。

首先，让我们来思考数据。就像 SVD 可以在矩阵（二维数据集）中找到最重要的特征一样，像 Tucker 分解这样的张量分解可以在高维数据中找到基本结构。一个视频片段可以被看作是一个三阶张量（高 $\times$ 宽 $\times$ 时间）。张量分解可以通过找到一个小的“核心”张量和一组捕获最重要空间和时间模式的因子矩阵来压缩这些数据。这是现代数据分析、信号处理和机器学习中的一个关键思想。

然而，张量也带来了一些意外。它们比矩阵要“狂野”得多。例如，秩的概念就出了名的棘手。对于矩阵，如果你有一系列秩为 2 的矩阵，它们越来越接近某个极限矩阵，那么这个极限矩阵的秩必须是 2 或更小。但这对张量不成立！可以构造一个由简单的秩为 2 的张量组成的序列，其极限是一个更复杂的秩为 3 的张量。这种被称为边界秩（border rank）的现象表明，张量空间的几何结构比矩阵空间要丰富得多，也更违反直觉。这是一个数学上的警告：高维是一个奇异的地方。

这种复杂性有实际的后果。还记得我们的张量网络图吗？它们代表了真实的计算。缩并一个网络意味着对所有连接的腿求和以得到最终答案。但是，你执行缩并的顺序可能会对计算成本产生天文数字般的影响。对于一个由四个张量组成的简单网络，选择错误的顺序可能会使所需的乘法次数从几百次增加到数千次。对于物理学中使用的大型网络，找到最优的缩并路径，可能是一个小时内完成计算与在宇宙热寂前都无法完成计算之间的区别。

量子前沿

也许这整个框架最深远的应用是在量子物理学的前沿。单个粒子的量子态可以用一个数字向量来描述。两个纠缠粒子的组合态用一个矩阵来描述。 $N$ 个相互作用粒子的状态是一个 N 阶张量。

问题在于尺度。对于一个仅有 50 个相互作用的“自旋”（量子世界里微小磁铁的等价物）的系统，其状态张量将有 $2^{50}$ 个分量。要存储这一个张量，你需要一台内存比有史以来建造的任何计算机都大的计算机。这种指数级增长就是“维度灾难”，在很长一段时间里，它似乎使得模拟量子系统成为不可能。

突破来自于人们意识到，物理上相关的状态——比如材料的低能基态——并非任何随机的张量。它们占据了那个大得不可思议的状态空间中一个微小且高度结构化的角落。这种结构可以被张量网络所捕获。

在一维中，许多量子态可以被精确地表示为矩阵乘积态（Matrix Product State, MPS），它将单个巨型张量分解为一长串许多小的、可管理的张量。这是获得诺贝尔奖的密度矩阵重整化群（DMRG）方法背后的数学语言。计算物理性质变成了一个优雅的、拉链式的过程，其中定义了从左侧和右侧扫入的“环境张量”，以高效地计算中心位置的结果。

在二维中，问题要困难得多。MPS 链变成了一个二维的张量网格，称为投影纠缠对态（Projected Entangled Pair State, PEPS）。缩并这个网格是一个更严峻的挑战。在这里，像角转移矩阵重整化群（CTMRG）这样的巧妙算法就派上了用场。为了理解一个无限二维晶格中某个位置发生了什么，CTMRG 通过一组有限的边界张量——四个“角”和四个“边”——来近似整个无限环境的影响，这些张量在感兴趣的位置周围形成一个盒子。这就像剥一个无限大的洋葱以到达中心，这是一个优美的迭代方案，让我们能够探测复杂的二维量子材料的秘密。

从一个简单的编程构造，我们已经走到了现代物理学的边缘。多维数组，当通过正确的视角看待时，提供了一种描述物理定律的语言，一种压缩复杂数据的工具，以及一个模拟量子宇宙的计算框架。它远不止是一个存放数字的文件柜；它是窥探现实结构的一扇窗户。