CP秩与典范多项分解

玻尔百科

定义

CP秩与典范多项分解指将张量分解为重建该张量所需的最少数量的一阶张量的数学框架。这一多重线性代数概念受克鲁斯卡尔定理（Kruskal's theorem）约束以保证其唯一性，并表现出边界秩和对数系的依赖性等复杂特征。它被广泛应用于量子纠缠分类、盲源分离和数据特征提取等领域，但计算其精确秩属于NP困难问题。

核心要点

一个张量的CP秩是完美重构该张量所需的最少简单秩一张量的数量，代表了其最基本的构成单元。
与矩阵秩不同，CP秩表现出复杂的行为，例如存在“边界秩”以及对数域（实数 vs. 复数）的依赖性。
Kruskal定理提供了保证CP分解基本唯一的关键条件，这使其在揭示数据中有意义的内在特征方面具有不可估量的价值。
CP秩是跨学科的统一概念，它定义了矩阵乘法的复杂性，实现了盲源分离，并对多体量子纠缠进行分类。
尽管理论上十分优雅，但计算CP秩是一个NP难问题，这在模型的解释能力和计算可行性之间造成了根本性的权衡。

引言

在数据复杂性日益增长的时代，过去的简单表格和列表已不再足够。从视频数据、脑电信号到量子态，信息自然地排列成被称为张量的高维结构。但我们如何从如此复杂的对象中提炼出意义呢？答案通常在于将它们分解为其最简单、最基本的组成部分。这就是典范多项(CP)分解的核心思想，这是一种强大的张量分析技术，旨在寻找这些基本的构成单元。

然而，将我们从二维矩阵中获得的直觉扩展到多维的张量世界，会发现一个令人惊讶且错综复杂的景象。“秩”这一概念本身变得更加复杂，并产生了挑战传统观念的意外性质。本文旨在通过深入探讨CP秩——此分解的基石——来填补这一知识鸿沟。我们将首先探索其基本原理和机制，揭示为什么张量不仅仅是“大矩阵”，并考察诸如边界秩和由Kruskal定理保证的关键唯一性条件等奇特现象。

在这次理论之旅之后，我们将在探索的第二部分“应用与跨学科联系”中，转向这些思想所带来的非凡影响。我们将看到，CP秩这一抽象概念如何提供一种统一的语言，以解决看似无关领域中的具体问题，从为计算机科学中的计算设定速度极限，到在数据分析中分离混合信号，甚至在量子力学中对现实的基本结构进行分类。通过这次探索，您将全面理解CP秩，它既是一个优美的数学概念，也是现代科学与工程的变革性工具。

原理与机制

想象你是一位试图理解一个复杂分子的化学家。你的第一直觉不是去描述每一个原子的位置，而是尝试识别构成它的基本化学基团——这里是一个醇基，那里是一个苯环。分子的本质并非由其完整的原子列表所捕捉，而是由其组成的功能部分的简短列表所捕捉。

这正是典范多项(CP)分解的精神所在。它旨在寻找张量的基本构成单元。但什么是张量？为我们的目的，我们可以将其视为一个多维数字数组。一个数字列表是一阶张量（向量）。一个数字电子表格是二阶张量（矩阵）。一个数字立方体，比如彩色视频随时间变化的像素值（ $height \times width \times time$ ），是一个三阶张量。

最简单的成分：秩一张量

张量最基本的构成单元是秩一张量。正如一个秩一矩阵可以由两个向量的“外积”（一个列向量乘以一个行向量）形成一样，一个三阶秩一张量是由三个向量的外积形成的，写作 $\mathcal{X} = a \otimes b \otimes c$ 。如果 $a$ 有 $I$ 个元素， $b$ 有 $J$ 个， $c$ 有 $K$ 个，结果就是一个 $I \times J \times K$ 的数字块，其中位置 $(i, j, k)$ 处的元素就是对应向量元素的乘积： $\mathcal{X}_{ijk} = a_i b_j c_k$ 。

可以把这看作是一种分离原则。例如，一个秩一视频可能是一个静态图像（由空间向量 $a$ 和 $b$ 表示），其亮度随时间闪烁（由时间向量 $c$ 表示）。空间模式和时间模式是完全独立的。这是张量可能拥有的最简单的结构。

CP分解（也称为CANDECOMP或PARAFAC）的目标是将任意给定的张量 $\mathcal{X}$ 表示为这些简单的、秩一的构成单元之和：

\mathcal{X} = \sum_{r=1}^{R} a_r \otimes b_r \otimes c_r

$\mathcal{X}$ 的CP秩，记作 $\operatorname{rank}_{\mathrm{CP}}(\mathcal{X})$ ，是实现这一分解所需的最小数量 $R$ 。它是完美重构原始张量所需的“成分”的绝对最小数量。

让我们来看一个实际例子。考虑一个在 $2 \times 2 \times 2$ 空间中的简单张量，定义为 $\mathcal{X} = e_1 \otimes e_1 \otimes e_1 + e_2 \otimes e_2 \otimes e_2$ ，其中 $e_1 = \begin{pmatrix} 1 \\ 0 \end{pmatrix}$ 和 $e_2 = \begin{pmatrix} 0 \\ 1 \end{pmatrix}$ 是标准基向量。直观上看，这是一个数字立方体，在左下角的前方（位置1,1,1）有一个'1'，在右上角的后方（位置2,2,2）有一个'1'，其他位置都是零。

根据其定义，我们已将 $\mathcal{X}$ 写成了两个秩一张量之和，所以它的CP秩最多为2。但它能是1吗？如果秩为1，我们可以将 $\mathcal{X}$ 写成 $\mathcal{X} = a \otimes b \otimes c$ 的形式，对于某些向量 $a, b, c$ 。这意味着位置 $(i,j,k)$ 处的元素是 $a_i b_j c_k$ 。

(1,1,1) 处的元素是1，所以 $a_1 b_1 c_1 = 1$ 。这意味着 $a_1, b_1, c_1$ 都必须非零。
(2,2,2) 处的元素是1，所以 $a_2 b_2 c_2 = 1$ 。这意味着 $a_2, b_2, c_2$ 都必须非零。
现在，(1,1,2) 处的元素是什么呢？它是0。所以， $a_1 b_1 c_2 = 0$ 。因为我们知道 $a_1$ 和 $b_1$ 是非零的，所以必须有 $c_2 = 0$ 。

我们得到了一个矛盾！ $c_2$ 必须非零，但它又必须为零。秩为1的假设导致了荒谬的结果。因此，秩必须大于1。既然我们知道它最多为2，那么这个张量的CP秩就恰好是2。这种排除法是确定秩的本质：找到一个明确的分解来设定一个上界，然后证明没有更小数目的项能行得通。

秩的丛林：张量不只是大矩阵

对于矩阵而言，秩的概念简单而明确。线性无关的列数、线性无关的行数、非零奇异值的数量——它们都给出相同的数字。很自然地，人们会尝试将这些思想扩展到张量。

一种常见的方法是展开（unfolding），或矩阵化（matricization）。我们可以将张量“压平”成一个矩阵。对于一个 $I \times J \times K$ 的张量，我们可以通过将张量的所有“列”（或模-1纤维）并排排列，来创建一个 $I \times (JK)$ 的矩阵。类似地，我们可以创建一个 $J \times (IK)$ 的矩阵或一个 $K \times (IJ)$ 的矩阵。这些展开后矩阵的秩构成了张量的Tucker秩，即一个数字数组 $(r_1, r_2, r_3)$ 。

人们可能希望CP秩就是这些展开秩中的最大值。如果真是这样，世界将会美好而简单。但张量的世界远比这有趣得多。

考虑一个由两个秩一分量构成的张量，其中第一个向量是共享的：

\mathcal{X} = a_1 \otimes b_1 \otimes c_1 + a_1 \otimes b_2 \otimes c_2

我们用两个部分构建了它，所以它的CP秩最多为2（我们假设它恰好是2）。当我们沿第一个模展开这个张量时，所有得到的矩阵列都将是单个向量 $a_1$ 的倍数。因此，这个展开的秩 $r_1$ 将是1！。这里我们有一个CP秩为2的张量，但它的第一个Tucker秩是1。CP秩并未被展开的秩所捕捉。

情况甚至更奇怪。CP秩可以严格大于所有的Tucker秩。在 $\mathbb{R}^{2 \times 2 \times 2}$ 空间中有一个著名的张量，其CP秩为3，但它的所有三个展开的秩都是2。这打破了任何认为张量只是美化了的矩阵的残存直觉。CP秩捕捉了一种内在的复杂性，这种复杂性在展开过程中是完全不可见的。它是一个真正全新的、更高维度的概念。

机器中的幽灵：边界秩

如果这还不够奇怪的话，CP秩还有一种近乎幽灵般的特质。在矩阵的世界里，如果你取一个秩为2的矩阵序列，并发现这个序列收敛于某个极限矩阵，那么那个极限矩阵的秩可以是2或1，但绝不可能是3。低秩矩阵的集合是“闭合的”——你无法通过取极限来逃离它。

张量再次颠覆了这种直觉。考虑以下由一个小数 $\epsilon > 0$ 索引的张量序列：

\mathcal{X}_\epsilon = \frac{1}{\epsilon} \left[ (u_1+\epsilon u_2) \otimes (v_1+\epsilon v_2) \otimes (w_1+\epsilon w_2) - u_1 \otimes v_1 \otimes w_1 \right]

对于任何非零的 $\epsilon$ ， $\mathcal{X}_\epsilon$ 显然是两个秩一张量之和（被 $1/\epsilon$ 缩放）。所以，对于每个 $\epsilon$ ，它的CP秩最多为2。但当我们让 $\epsilon$ 趋于零时会发生什么？ $(u_1+\epsilon u_2) \otimes (v_1+\epsilon v_2) \otimes (w_1+\epsilon w_2)$ 这一项越来越接近 $u_1 \otimes v_1 \otimes w_1$ 。这个表达式看起来像是 $\frac{1}{\epsilon}$ 乘以一个趋于零的项。为了看清结果，我们必须展开第一项：

(u_1+\epsilon u_2) \otimes \dots = (u_1 \otimes v_1 \otimes w_1) + \epsilon(u_2 \otimes v_1 \otimes w_1 + u_1 \otimes v_2 \otimes w_1 + u_1 \otimes v_1 \otimes w_2) + \mathcal{O}(\epsilon^2)

当我们减去 $u_1 \otimes v_1 \otimes w_1$ 并除以 $\epsilon$ 时，主导项完美抵消，在 $\epsilon \to 0$ 的极限下，我们得到：

\lim_{\epsilon \to 0} \mathcal{X}_\epsilon = u_2 \otimes v_1 \otimes w_1 + u_1 \otimes v_2 \otimes w_1 + u_1 \otimes v_1 \otimes w_2

极限张量是三个秩一张量之和。事实上，可以证明它的CP秩恰好是3。这太惊人了！我们有一个秩为2的张量序列，它可以任意接近一个秩为3的张量。这个秩为3的张量位于秩为2的张量集合的“边界”上。这引出了一个新概念：一个张量的边界秩是最小的秩 $k$ ，使得该张量是一系列秩为 $k$ 的张量的极限。对于这个例子，CP秩是3，但边界秩是2。这揭示了一个深刻而复杂的几何结构；张量空间并不像矩阵空间那样被秩整齐地划分。

Kruskal的奇迹：一线秩序之光

在经历了这趟奇异之旅后，人们可能会怀疑张量分解是否太过狂野以至于无法使用。如果秩的行为如此不端，那么我们还有希望得到唯一且有意义的分解吗？值得注意的是，答案常常是肯定的。

虽然某些特定的低秩张量可以有多种分解方式，但事实证明，对于一个泛型张量，CP分解是基本唯一的。这个深刻的结果主要归功于Joseph Kruskal。Kruskal定理提供了一个惊人简单的条件来保证这种唯一性。

要理解它，我们需要一个更强的矩阵秩概念，称为k-秩。一个因子矩阵（例如，列为向量 $a_1, \dots, a_R$ 的矩阵 $A$ ）的k-秩是最大的数 $k$ ，使得任何 $k$ 列的集合都是线性无关的。对于一个秩为 $R$ 的三阶张量分解 $\mathcal{X} = \sum_{r=1}^R a_r \otimes b_r \otimes c_r$ ，Kruskal定理指出，如果因子矩阵 $A, B, C$ 的k-秩满足：

k(A) + k(B) + k(C) \ge 2R + 2

那么该分解是基本唯一的。这意味着分量向量 $a_r, b_r, c_r$ 是唯一的，只差一个项的置换和每项内部向量的缩放（例如，我们可以用 $2a_r$ 替换 $a_r$ ，只要我们用 $\frac{1}{2}b_r$ 替换 $b_r$ ）。

直观上，k-秩衡量了分解中向量的“多样性”或“一般位置”程度。如果构成单元彼此之间都足够不同，那么只有一种方式可以组合它们来形成目标张量。该定理是使CP分解成为信号处理、神经科学和数据分析中强大工具的基石；它告诉我们，在合理的条件下，我们找到的分量不是任意的，而是数据内在的、有意义的特征。

实数与复数

最后一个转折在等待着我们。在矩阵理论中，一个实矩阵的秩，无论你将其视为实矩阵还是允许使用复数，都是相同的。对于张量，情况并非如此。一个实张量的秩可能会因我们是允许使用实向量还是复向量进行分解而有所不同。

考虑一个实的 $2 \times 2 \times 2$ 张量，其切片是单位矩阵 $I_2$ 和斜对称矩阵 $J = \begin{pmatrix} 0 1 \\ -1 0 \end{pmatrix}$ 。 $J$ 的特征值是 $\pm i$ 。因此，不可能只用实向量来对角化 $J$ 。可以证明，由 $I_2$ 和 $J$ 张成的矩阵平面中不包含任何实的秩一矩阵（除了零矩阵）。任何两个实的秩一矩阵必须张成一个确实包含其他秩一矩阵的平面。这种不匹配证明了你不能仅用两个实的秩一分量来表示这个张量。它的实CP秩是3。

然而，如果你允许使用复向量，你可以同时对角化 $I_2$ 和 $J$ 。这立即产生了一个仅含两个复秩一分量的分解。复CP秩是2。张量的秩竟然取决于你使用的数系！这种差异不仅仅是一个数学上的奇闻；它对张量的几何形状以及可以表示的结构类型有着深远的影响。

美的代价

CP分解在概念上是优美的，它将一个复杂的对象表示为其最简单部分的和。那么为什么它不被用于所有事情呢？问题在于，这种优美是以惊人的计算成本为代价的。找到一个一般张量的CP秩是NP难的。这意味着可能没有高效的算法可以解决大型张量的问题；所需时间可能会随着张量的大小呈指数级增长。

更糟糕的是，该问题最自然的“凸松弛”——一种在优化中将困难的离散问题转化为易于处理的连续问题的标准技术——也是NP难的。张量核范数，作为非常成功的矩阵核范数的直接类比，其本身也是难以计算的。

这就是为什么在许多实际应用中，人们会转向其他计算上更友好的张量分解，如Tucker分解。虽然Tucker分解不那么基础——它将一个张量分解为一个稠密的“核心”张量和周围的因子矩阵——但其相关的优化问题是可解的。它代表了科学与工程中的一个经典权衡：在优美基础的模型和实际可计算的模型之间做出选择。穿越CP秩原理的旅程向我们展示，在高维数据的世界里，最简单的问题可以引出最令人惊讶、最优雅也最具挑战性的答案。

应用与跨学科联系

在经历了典范多项(CP)分解错综复杂的定义和性质之后，我们现在来到了探索中最激动人心的部分。这个看似抽象的数学概念为何如此重要？答案既深刻又令人惊讶。CP秩不仅仅是多维数组的一个形式属性；它是一个在众多科学和工程学科中以不同名称浮现的基础概念。它充当一种统一的语言，描述了系统的内在复杂性，从计算的速度、混合信号的解码到量子纠缠的本质。在本章中，我们将见证这一个单一思想如何提供一个强大的视角，来审视和解决整个知识领域的各种问题。

计算的引擎：张量与算法速度

CP秩最惊人的应用或许在于计算机科学的核心：一个像“我们能多快地将两个矩阵相乘？”这样基本的问题。乍一看，这个操作似乎与张量无关。但任何双线性运算——即在两个不同输入中均为线性的运算——都可以用一个三阶张量来表示。两个 $2 \times 2$ 矩阵的乘法就是这样一种运算，它可以被编码在一个 $\mathcal{M}_{2,2,2} \in \mathbb{R}^{4 \times 4 \times 4}$ 的张量中。

惊人的联系在于：这个矩阵乘法张量的CP秩，恰好是执行该矩阵乘法所需标量乘法的最小次数。标准的教科书算法涉及8次乘法和4次加法，这对应于 $\mathcal{M}_{2,2,2}$ 的一个含8项的CP分解。几个世纪以来，这被认为是最佳的。然而，在1969年，Volker Strassen 发现了一种仅用7次乘法的新方法。用张量的语言来说，他找到了 $\mathcal{M}_{2,2,2}$ 的一个CP秩为7的分解。

这不仅仅是一个数学上的奇闻。通过递归地应用这个秩为7的分解，Strassen 设计出了一种用于乘以大型 $n \times n$ 矩阵的算法，其复杂度为 $\mathcal{O}(n^{\log_2 7}) \approx \mathcal{O}(n^{2.807})$ ，打破了长期存在的 $\mathcal{O}(n^3)$ 壁垒。寻找矩阵乘法张量的真实CP秩（即“矩阵乘法指数”）仍然是计算机科学中最深刻的开放问题之一。这个单一的例子揭示了CP分解的巨大威力：理解张量秩直接转化为为科学计算的基石设计更快的算法。一个更简单相关问题的乘法复杂度，即计算乘积的迹 $\mathrm{tr}(AB)$ ，同样可以被证明对应于一个CP秩为4的张量，这个数字你可以直接从公式 $\sum_{i,j} a_{ij}b_{ji}$ 的四个乘积中推导出来。

解码宇宙：信号、数据与盲源分离

让我们从计算机的数字世界转向信号的物理世界。想象一下，你身处一个拥挤的派对，几场对话同时进行。你的大脑有一种非凡的能力，可以专注于一个声音并过滤掉其他声音。计算机如何做到同样的事情？这就是“鸡尾酒会问题”，一个盲源分离（BSS）的经典例子。其目标是从一组观察到的混合信号中恢复出一组原始的、未被观察到的“源”信号。

张量和CP分解提供了一个异常优雅的解决方案。如果我们假设源信号在统计上是独立的且非高斯的，我们可以计算我们观察到的混合信号的高阶统计量。例如，观测信号的三阶互累积量构成一个三阶张量。奇迹就在此刻发生：这个累积量张量拥有一个自然的CP分解。这个分解的秩 $R$ 是底层源信号的数量。此外，构成该分解的因子向量恰好是描述源信号如何被组合的“混合矩阵”的列。

因此，通过计算数据张量的CP分解，我们实际上可以“解混”信号，分离出独立的源。CP分解的数学唯一性，在特定条件下由像Kruskal这样的定理所保证，确保了这种分离不是任意的，而是恢复了真实的底层源和混合系统。这种技术，通常被称为独立分量分析（ICA），是现代数据分析的基石，被用于从生物医学信号处理（从母亲的心跳中分离出胎儿的心跳）到电信和金融分析等领域。源信号的线性无关性，例如多维信号中不同的正弦波，是确保分解中分量数量与源数量相匹配的关键属性。

现实的织物：量子纠缠与张量秩

CP秩的影响力超越了经典应用，延伸到奇异而美妙的量子力学世界。一个复合量子系统（例如由多个粒子组成的系统）的状态由一个张量积空间中的向量来描述。例如，三个量子比特（qubits）的状态可以用一个 $2 \times 2 \times 2$ 的张量来表示。

与物理学的联系是直接而深刻的。一个量子态是可分的，或者说没有纠缠，当且仅当它可以写成其各个组成粒子状态的乘积。用张量的语言来说，这意味着状态张量是一个秩一张量。因此，如果一个态的CP秩大于一，那么它就是纠缠的——这个曾让爱因斯坦大惑不解的鬼魅现象。CP秩作为一种自然的、可计算的纠缠度量而出现。

但故事还有更精彩的部分。并非所有纠缠都是生而平等的。考虑两个著名的三量子比特纠缠态：Greenberger-Horne-Zeilinger (GHZ) 态， $\lvert \mathrm{GHZ} \rangle = \lvert 000 \rangle + \lvert 111 \rangle$ ，和 W 态， $\lvert W \rangle = \lvert 001 \rangle + \lvert 010 \rangle + \lvert 100 \rangle$ 。在物理上，它们代表了根本不同种类的三体纠缠。GHZ态是最大纠缠的，但很脆弱——如果测量一个量子比特，另外两个的纠缠就会被摧毁。W态的纠缠程度较低，但更稳健。值得注意的是，这种物理上的区别被CP秩完美地捕捉了。GHZ态对应于一个CP秩为2的张量，而W态对应于一个CP秩为3的张量。因此，CP秩不仅为纠缠提供了二元测试，而且提供了一个更精细的分类方案，用以区分物理上不同的多体纠缠类别。

抽象之美：多项式、几何与对称性的极限

CP秩在纯数学中也有着深厚的根基，特别是在代数几何这一经典领域。一个对称张量——其元素在排列其索引时保持不变——等价于一个齐次多项式。对于一个对称的三阶张量，其对应关系为 $\mathcal{A} \leftrightarrow p(\mathbf{x}) = \sum_{i,j,k} \mathcal{A}_{ijk} x_i x_j x_k$ 。

在这种对应关系下，对称CP分解——将张量写为秩一对称张量之和 $\sum_r \mathbf{v}_r \otimes \mathbf{v}_r \otimes \mathbf{v}_r$ ——转化为将多项式表示为线性型幂次之和 $\sum_r (\mathbf{v}_r^T \mathbf{x})^3$ 。这就是经典的多项式Waring问题：表示一个给定的多项式所需的最少 $k$ 次幂的数量是多少？答案就是相关张量的对称CP秩。

这种联系使我们能够将代数几何的强大工具应用于张量问题。例如，多项式 $p(x, y, z) = (x+y+z)^3 - (x^3+y^3+z^3)$ 似乎是四个立方之和，表明其秩最多为4。更深入的代数分析揭示，它不能被写成三个或更少个立方的和，从而确认其秩恰好为4。一个更微妙的例子是多项式 $f(x_1, x_2) = x_1^2 x_2$ 。极化理论，一个源自19世纪不变量理论的优美理论，可以用来证明其对称秩为3。人们可能会想，是否允许一个非对称分解可以降低秩。在这里，可以巧妙地引用CP分[解的唯一性定理](@entry_id:166861)来表明，任何假设的非对称秩2分解都会因张量的对称性而被强制成为对称分解，从而导致矛盾。因此，对于这个张量，对称和非对称CP秩都是3。

概览全局

最后，必须理解CP分解只是表示张量的众多方法之一。不同的分解捕捉不同种类的结构。一个很好的例证是由离散拉普拉斯算子的逆构成的张量。这样的张量可能具有非常大的CP秩，随问题规模呈二次方增长，比如说 $R_{\mathrm{CP}} = n^2$ 。这表示其所有索引之间存在高度的全局纠缠。然而，同一个张量可能具有非常低的张量链(TT)秩，该秩衡量连续索引组之间的可分性。可能的情况是，跨越中心分区的TT秩仅为1。这意味着，虽然该张量在全局上是复杂的，但它具有非常简单的、“链状”的局部结构。这突显了一个关键的教训：选择正确的张量分解就是要将工具与手头问题内在的结构相匹配。

此外，CP秩的理论优雅性在实践中遇到了重大的挑战。计算CP秩通常是一个NP难问题。为给定的张量寻找分解通常依赖于迭代算法，如交替最小二乘法（ALS），其成功与否可能关键性地取决于一个好的初始猜测。像高阶奇异值分解（HOSVD）这样的技术常被用来提供这种初始化，通过寻找数据所在的主要子空间。然而，这种方法的准确性对噪声、真实因子的条件数以及数据中的谱隙都很敏感。抽象理论与数值现实之间的这种相互作用正是该领域许多活跃研究的所在。

从加速计算到解码脑信号，从分类量子现实到探索纯数学之美，典范多项分解提供了一条统一的线索。它提醒我们，一个单一的、定义良好的数学思想可以照亮一个广阔而多样的领域，揭示出以前隐藏在眼前的联系。