try ai
科普
编辑
分享
反馈
  • 二次型

二次型

SciencePedia玻尔百科
核心要点
  • 每个二次型都可以由一个对称矩阵唯一表示,从而可以利用线性代数的强大工具对其进行分析。
  • 二次型的定性(正定、负定或不定)描述了其几何形状,对于确定物理系统的稳定性至关重要。
  • 二次型特征值的符号为其分类提供了明确的检验方法,而 Sylvester 惯性定理(Sylvester's Law of Inertia)则揭示了一个不随坐标系改变的不变“符号差”。
  • 二次型是一个具有广泛应用的统一概念,从相对论中定义时空的几何结构,到统计学中描述多元正态分布,再到数论中研究整数解。

引言

二次型是数学中的一个基本概念,它在抽象的代数世界与直观的几何世界之间架起了一座强大的桥梁。最简单地说,它们是每一项次数都为二的多项式,例如 x2+2xy+y2x^2 + 2xy + y^2x2+2xy+y2。然而,在这个简单的定义背后隐藏着丰富的结构,可以描述从曲面曲率到物理系统稳定性的万事万物。核心的挑战在于,如何超越繁琐的多项式表达式,以把握其本质的几何与代数性质。本文通过对其核心原理和多样化应用进行结构化探索,为二次型祛魅。

第一部分“原理与机制”将引导您学习如何通过其唯一的对称矩阵,将任何二次型转换成线性代数的语言。您将学到矩阵的特征值如何揭示二次型的真实形状——无论是碗形、穹顶形还是鞍形——并发现其符号差所蕴含的深刻而不变之真理。随后的“应用与跨学科联系”部分将展示二次型的非凡多功能性,阐明其在几何学中塑造圆锥曲线、在统计学中为数据建模、在数论中揭示整数奥秘,甚至在现代物理学中定义时空结构的关键作用。

原理与机制

想象一下,你在一片漆黑中于丘陵地带行走。为了弄清你周围的环境,你可能会向每个方向迈出一小步。是不是每一步都是上坡?那么你一定在山谷的底部。是不是每一步都是下坡?那么你正身处山顶。如果有些步子向上,有些向下,那么你就在一个鞍点上,比如一个山口。二次型就是我们用来描述这类地貌形状的数学语言,不仅在二维或三维空间,而且在你所能想象的任何维度中。

多项式背后的矩阵:一种新语言

乍一看,二次型就像一个熟悉但略显杂乱的高中代数表达式。它是一个每一项总次数都为二的多项式。例如,在三维空间中,你可能会遇到涉及 x2x^2x2、y2y^2y2、z2z^2z2 以及“交叉项”xyxyxy、xzxzxz 和 yzyzyz 的表达式。

考虑一个只包含平方项的简单情况,如 q(x,y,z)=4x2−y2q(x, y, z) = 4x^2 - y^2q(x,y,z)=4x2−y2。这足够直观。但对于一个更复杂的表达式,如 q(x,y,z)=xy+yz+zxq(x, y, z) = xy + yz + zxq(x,y,z)=xy+yz+zx 呢?我们如何把握它的“形状”?

第一个巨大的飞跃是将这种多项式代数转化为矩阵的语言——线性代数的语言。任何二次型 q(v)q(\mathbf{v})q(v) 都可以被优雅地写成 vTAv\mathbf{v}^T A \mathbf{v}vTAv,其中 v\mathbf{v}v 是变量的列向量,而 AAA 是一个特殊的对称矩阵,它蕴含着二次型的“遗传密码”。

我们如何构建这个矩阵?过程非常简单。

  1. 平方项的系数,如 4x24x^24x2 中的 444 和 −y2-y^2−y2 中的 −1-1−1,直接放在矩阵的主对角线上。如果某个变量缺少其平方项(如此例中的 z2z^2z2),其对应的对角线元素就是零。所以,对于 q(x,y,z)=4x2−y2q(x, y, z) = 4x^2 - y^2q(x,y,z)=4x2−y2,矩阵只是一个对角矩阵。
  2. 交叉项的系数,如 xyxyxy 中的 111,被一分为二,对称地放置在非对角线位置。对于二次型 q(x,y,z)=xy+yz+zxq(x, y, z) = xy + yz + zxq(x,y,z)=xy+yz+zx,没有 x2x^2x2、y2y^2y2 或 z2z^2z2 项,所以对角线全为零。xyxyxy 的系数是 111,所以我们在矩阵的 (x,y)(x,y)(x,y) 位置和 (y,x)(y,x)(y,x) 位置各放上 12\frac{1}{2}21​。对所有项都这样做,我们就能得到完整的矩阵。

这种表示法 q(v)=vTAvq(\mathbf{v}) = \mathbf{v}^T A \mathbf{v}q(v)=vTAv 不仅仅是一个巧妙的技巧,更是一次深刻的视角转变。我们将一个繁琐的多项式,将其全部结构编码进一个单一的对象——矩阵 AAA 中。二次型的所有性质现在都成了其矩阵的性质。这使我们能够使用线性代数的强大工具——特征值、行列式和基变换——来理解二次型深层的几何本质。即使一个二次型以伪装的、因式分解的形式出现,比如 (x−y+z)(x+y−z)(x - y + z)(x + y - z)(x−y+z)(x+y−z),我们也可以简单地将其展开为多项式形式(x2−y2−z2+2yzx^2 - y^2 - z^2 + 2yzx2−y2−z2+2yz),然后像之前一样构建其对称矩阵。

这种对应关系是双向的。给定一个对称矩阵,我们可以立即写出其多项式。更根本的是,我们可以定义二次型在标准基向量上的值。对于一个二维二次型 q(x,y)q(x,y)q(x,y),值 q(1,0)q(1,0)q(1,0) 和 q(0,1)q(0,1)q(0,1) 分别给出了 x2x^2x2 和 y2y^2y2 的系数。坐标轴之间的“混合”相互作用由一个相关的对象——​​双线性型​​ B(u,v)B(\mathbf{u}, \mathbf{v})B(u,v) 捕获,其在基向量 (1,0)(1,0)(1,0) 和 (0,1)(0,1)(0,1) 上的值给出了 xyxyxy 项系数的一半。这表明矩阵系数并非任意;它们恰恰是描述二次型沿其基本轴向行为所必需的数字。

能量的形状:定性与稳定性

我们为什么关心这些函数的“形状”?最重要的应用之一是在物理学和工程学中,特别是在理解稳定性方面。想象一个静止在碗底的弹珠。它的势能处于最小值。如果你轻轻推它一下,它会滚回碗底。这是一个稳定平衡。现在想象弹珠完美地平衡在一个穹顶的顶部。它的势能处于最大值。最轻微的推动都会导致它滚落。这是一个不稳定平衡。

在平衡点附近,任何平滑的势能函数 V(x)V(\mathbf{x})V(x) 都可以用一个二次型来近似。为了使系统稳定,该二次型必须是一个“碗”——它必须是​​正定的​​。这意味着对于任何偏离平衡点的非零位移 x\mathbf{x}x,势能 V(x)V(\mathbf{x})V(x) 都必须为正。

一个二次型是:

  • ​​正定​​ (positive definite),如果对所有 x≠0\mathbf{x} \neq \mathbf{0}x=0 都有 q(x)>0q(\mathbf{x}) > 0q(x)>0。(一个 N 维的碗)
  • ​​负定​​ (negative definite),如果对所有 x≠0\mathbf{x} \neq \mathbf{0}x=0 都有 q(x)0q(\mathbf{x}) 0q(x)0。(一个 N 维的穹顶)
  • ​​不定​​ (indefinite),如果它既能取正值也能取负值。(一个 N 维的马鞍)
  • ​​半正定​​ (positive semi-definite),如果对所有 x\mathbf{x}x 都有 q(x)≥0q(\mathbf{x}) \ge 0q(x)≥0。(一个带有平坦方向的碗,像一个槽)
  • ​​半负定​​ (negative semi-definite),如果对所有 x\mathbf{x}x 都有 q(x)≤0q(\mathbf{x}) \le 0q(x)≤0。(一个带有平坦山脊的穹顶)

考虑一个假设的机械系统势能函数,V(x1,x2)=x12−3x1x2+3x22V(x_1, x_2) = x_1^2 - 3x_1x_2 + 3x_2^2V(x1​,x2​)=x12​−3x1​x2​+3x22​。这代表一个稳定的系统吗?它是正定的吗?我们可以测试一下。如果我们取一些值,它似乎是正的。但我们如何确保对所有值都如此?相比之下,像 V(x1,x2)=2x12+8x1x2+x22V(x_1, x_2) = 2x_1^2 + 8x_1x_2 + x_2^2V(x1​,x2​)=2x12​+8x1​x2​+x22​ 这样的二次型,如果 x1x_1x1​ 很大而 x2x_2x2​ 为零,它显然是正的,但如果我们选择 x1=−2x_1 = -2x1​=−2 和 x2=1x_2 = 1x2​=1,它的值是 2(4)+8(−2)+1=8−16+1=−72(4) + 8(-2) + 1 = 8 - 16 + 1 = -72(4)+8(−2)+1=8−16+1=−7。由于它既可以为正也可以为负,所以它是不定的,对应于一个不稳定的鞍点。稳定性的问题就是定性的问题。

改变视角:特征值的力量

仅仅看着像 q(x,y)=x2+4xy+y2q(x, y) = x^2 + 4xy + y^2q(x,y)=x2+4xy+y2 这样的二次型的系数,并不能立刻告诉你它的形状。交叉项 4xy4xy4xy 使变量耦合在一起,模糊了图像。这就像看着一个倾斜的椭圆;它真正的主轴和次轴与你的 xxx 和 yyy 轴并不对齐。

线性代数的魔力提供了一种“扶正”我们视角的方法。​​主轴定理​​告诉我们,对于任何二次型,都存在一组特殊的相互垂直的轴——其矩阵 AAA 的​​特征向量​​——沿着这些轴,二次型具有更简单的结构。如果我们将坐标系重新定向以与这些特征向量对齐,所有混乱的交叉项都会消失!

在这个新的坐标系中(我们称变量为 y1,y2,…,yny_1, y_2, \dots, y_ny1​,y2​,…,yn​),二次型变成了一个简单的平方和: q(y1,y2,…,yn)=λ1y12+λ2y22+⋯+λnyn2q(y_1, y_2, \dots, y_n) = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \dots + \lambda_n y_n^2q(y1​,y2​,…,yn​)=λ1​y12​+λ2​y22​+⋯+λn​yn2​ 而这些系数,λ1,λ2,…,λn\lambda_1, \lambda_2, \dots, \lambda_nλ1​,λ2​,…,λn​,正是原始矩阵 AAA 的​​特征值​​。

这是一个极其强大的结果。它意味着二次型的整个几何性质都编码在其特征值的符号中。

  • 所有特征值都为正 (λi>0)(\lambda_i > 0)(λi​>0)?二次型是正定的。它是一组正数的平方和,所以不可能是负的。
  • 所有特征值都为负 (λi0)(\lambda_i 0)(λi​0)?二次型是负定的。
  • 正负特征值混合存在?二次型是不定的。

让我们回到 q(x,y)=x2+4xy+y2q(x, y) = x^2 + 4xy + y^2q(x,y)=x2+4xy+y2。它的矩阵是 A=(1221)A = \begin{pmatrix} 1 2 \\ 2 1 \end{pmatrix}A=(1221​)。快速计算表明其特征值为 λ1=3\lambda_1 = 3λ1​=3 和 λ2=−1\lambda_2 = -1λ2​=−1。符号混合!这立刻告诉我们该二次型是不定的——它是一个鞍形。同样,问题 中的二次型 Q=2x1x2+2x1x3+2x2x3Q = 2x_1x_2 + 2x_1x_3 + 2x_2x_3Q=2x1​x2​+2x1​x3​+2x2​x3​ 的特征值为 2,−1,−12, -1, -12,−1,−1。它也是不定的。特征值穿透了复杂性,揭示了本质的真相。

不变的真理:Sylvester 惯性定理与符号差

我们看到可以找到一个特殊的基(特征向量)来对角化一个二次型。但这个基不是唯一的。例如,你可以拉伸它。如果你将坐标从 y1y_1y1​ 变为 z1=1λ1y1z_1 = \frac{1}{\sqrt{\lambda_1}} y_1z1​=λ1​​1​y1​(对于 λ1>0\lambda_1 > 0λ1​>0),那么项 λ1y12\lambda_1 y_1^2λ1​y12​ 就变成了简单的 z12z_1^2z12​。通过重新缩放所有新坐标,我们可以将二次型转化为一个更简单的标准型,一个只由 +1+1+1、−1-1−1 或 000 作为系数的平方和。 q(z1,z2,…,zn)=z12+⋯+zn+2−zn++12−⋯−zn++n−2q(z_1, z_2, \dots, z_n) = z_1^2 + \dots + z_{n_+}^2 - z_{n_++1}^2 - \dots - z_{n_++n_-}^2q(z1​,z2​,…,zn​)=z12​+⋯+zn+​2​−zn+​+12​−⋯−zn+​+n−​2​

现在,一件非凡的事情发生了。无论你对原始变量施加何种疯狂的(可逆的)线性变换——无论你如何旋转、拉伸或错切你的坐标系——正平方项的数量(n+n_+n+​)、负平方项的数量(n−n_-n−​)以及零系数项的数量(n0n_0n0​)将永远保持不变。这就是 ​​Sylvester 惯性定理​​ (Sylvester's Law of Inertia)。

三元组 (n+,n−,n0)(n_+, n_-, n_0)(n+​,n−​,n0​) 被称为二次型的​​符号差​​ (signature)。它是二次型最根本、不可改变的 DNA。它告诉你二次型的本质特征,独立于任何坐标系。

这个想法具有深远的物理意义。在 Einstein 的狭义相对论中,时空中两个事件之间的“距离”不是由通常的勾股定理给出的。相反,时空间隔的平方是一个二次型:s2=(Δx0)2−(Δx1)2−(Δx2)2−(Δx3)2s^2 = (\Delta x_0)^2 - (\Delta x_1)^2 - (\Delta x_2)^2 - (\Delta x_3)^2s2=(Δx0​)2−(Δx1​)2−(Δx2​)2−(Δx3​)2,其中 x0x_0x0​ 是时间坐标(乘以光速),而 x1,2,3x_{1,2,3}x1,2,3​ 是空间坐标。这个二次型的符号差是 (1,3,0)(1, 3, 0)(1,3,0)——一个正的(时间)项和三个负的(空间)项。Sylvester 惯性定理保证了这个 (1,3,0)(1,3,0)(1,3,0) 符号差是时空本身的一个不变属性。任何观察者,无论其相对速度如何,都会根据具有相同符号差的二次型来测量间隔。这个不变的符号差决定了我们宇宙中因果关系的基本结构。

找到这个符号差的一个优美而直接的方法是“配方法”,这很可能是你在高中学过的方法。对于一个多变量的二次型,你可以迭代地应用它:先对 x1x_1x1​ 配方,然后用剩余的项对 x2x_2x2​ 配方,以此类推。这个过程系统地将二次型转化为平方和,从而揭示其符号差,而无需计算任何特征值。

常用工具:实用的分类检验方法

虽然求特征值是分类二次型最根本的方法,但计算量可能很大。幸运的是,我们还有其他工具。

其中最有效的方法之一是 ​​Sylvester 判据​​ (Sylvester's Criterion),它专门用于检验正定性。该判据指出,一个对称矩阵对应一个正定二次型,当且仅当它的所有​​顺序主子式​​都为正。顺序主子式是左上角 k×kk \times kk×k 子矩阵的行列式。你检查 1×11 \times 11×1 的行列式(就是左上角的元素),然后是 2×22 \times 22×2 的行列式,接着是 3×33 \times 33×3 的,以此类推。如果它们都为正,那么你就得到了一个“碗”!

这个判据非常适合“设计”问题。假设你正在构建一个系统,其势能为 q(x,y)=3x2+6xy+cy2q(x,y) = 3x^2 + 6xy + cy^2q(x,y)=3x2+6xy+cy2,并且你需要它保持稳定。能满足要求的 ccc 的最小整数值是多少?我们希望这个二次型至少是半正定的(q≥0q \ge 0q≥0)。矩阵是 A=(333c)A = \begin{pmatrix} 3 3 \\ 3 c \end{pmatrix}A=(333c​)。半正定性的主子式检验要求所有主子式都非负。

  1. 1×11 \times 11×1 的主子式是 3≥03 \ge 03≥0 和 c≥0c \ge 0c≥0。
  2. 2×22 \times 22×2 的主子式是 det⁡(A)=3c−9≥0\det(A) = 3c - 9 \ge 0det(A)=3c−9≥0,这意味着 c≥3c \ge 3c≥3。 综合这些条件,保证稳定性的最小整数 ccc 是 333。这个简单的检验使我们能够通过调整参数来设计稳定的系统。

从多项式到矩阵,从稳定性分析到时空结构,二次型提供了一个统一的框架。通过理解它们的原理——矩阵表示、定性的几何意义、特征值的揭示力量以及符号差的深刻真理——我们获得了一个强大的透镜,用以观察和塑造我们周围的世界。

应用与跨学科联系

我们花了一些时间拆解二次型的机械构造,理解了它的矩阵表示、符号差和分类。现在,真正的乐趣开始了。让我们把这台机器重新组装起来,看看我们能用它驶向何方。你会发现,它并非博物馆里的陈列品,而是一辆能够探索几何学、统计学、数论乃至抽象代数本身广阔而相互关联的景观的交通工具。二次型不仅仅是一个数学上的奇珍异品——它是一种基本的模式,一种自然与逻辑似乎都偏爱的、反复出现的主题。

万物的几何学

从最直观的角度看,二次型是一件雕塑家的工具。给它一个空间,它就能雕刻出一个形状。在二维空间中,令二次型等于一个常数,q(x,y)=kq(x, y) = kq(x,y)=k,就能描绘出我们熟悉的圆锥曲线家族:椭圆、抛物线和双曲线。例如,如果你想描述一个半径为 3 的圆,你可能会从方程 x2+y2=9x^2 + y^2 = 9x2+y2=9 开始。这可以改写为 19(x2+y2)=1\frac{1}{9}(x^2+y^2)=191​(x2+y2)=1。左边的表达式,q(x,y)=19(x2+y2)q(x,y) = \frac{1}{9}(x^2 + y^2)q(x,y)=91​(x2+y2),就是一个二次型。它的系数蕴含着这个圆的“遗传密码”。改变它们,圆就可能被拉伸成椭圆,或者断裂成双曲线。二次型关联矩阵的特征值决定了所得图形主轴的长度,为我们提供了代数与几何之间的直接联系。

这个原理并不仅限于二维平面。在三维空间中,二次型的水平集 q(x,y,z)=kq(x, y, z) = kq(x,y,z)=k 绽放成美丽的二次曲面:球面、椭球面、抛物面和奇妙的鞍形双曲抛物面。但是,这些形状中某一个的“真实”本质是什么?如果我们旋转我们的视角,方程会改变,但物体本身不会。是否存在一个保持不变的内在属性?

答案是肯定的,它由 Sylvester 惯性定理给出。该定律告诉我们,对于 Rn\mathbb{R}^nRn 上的任何非退化二次型,我们总能找到一个特殊的视角(一个基),在该视角下,二次型简化为平方和与平方差:u12+⋯+up2−up+12−⋯−un2u_1^2 + \dots + u_p^2 - u_{p+1}^2 - \dots - u_n^2u12​+⋯+up2​−up+12​−⋯−un2​。正项的数量(ppp)和负项的数量(q=n−pq=n-pq=n−p)是不可改变的不变量。这对数字,即​​符号差​​ (p,q)(p,q)(p,q),是二次型的本质特征。例如,对于 R3\mathbb{R}^3R3 上的二次型,符号差 (p,q)(p,q)(p,q) 必须满足 p+q=3p+q=3p+q=3,从而产生四种可能的不同拓扑类型的曲面,分别对应于符号差 (3,0)(3,0)(3,0)、(2,1)(2,1)(2,1)、(1,2)(1,2)(1,2) 和 (0,3)(0,3)(0,3)。

不变符号差这个想法意义深远。在多元微积分中,临界点处的海森矩阵(Hessian matrix)是一个二次型,它决定了你是在谷底(符号差 (n,0)(n,0)(n,0),一个局部最小值)、山峰(符号差 (0,n)(0,n)(0,n),一个局部最大值)还是在鞍点。更引人注目的是,在物理学中,Einstein 的狭义相对论在一个四维时空中展开,其中两个事件之间的“距离”由一个符号差为 (1,3)(1,3)(1,3) 或 (3,1)(3,1)(3,1) 的二次型——闵可夫斯基度规(Minkowski metric)来衡量:ds2=c2dt2−dx2−dy2−dz2ds^2 = c^2 dt^2 - dx^2 - dy^2 - dz^2ds2=c2dt2−dx2−dy2−dz2。这个符号差是时空的基本结构,区分了时间与空间,并规定了因果律。

对称与变换的语言

二次型不仅是对形状的静态描述;它们是可以被变换的动态对象。研究它们在一组变换下的变化规律能揭示深刻的对称性。将所有二次型的集合视为一个其自身的空间,并想象一个矩阵群,比如特殊线性群 SL(n,R)SL(n, \mathbb{R})SL(n,R)(所有行列式为 1 的 n×nn \times nn×n 矩阵),作用于这个空间。如果你取最简单的二次型,即平方和 q0(x)=xTxq_0(x) = x^T xq0​(x)=xTx,并应用这个群中所有可能的变换,你会得到什么?

事实证明,你得到的不仅仅是任意的二次型集合。你生成了一个非常特殊的族:所有其关联[矩阵行列式](@article_id:303413)为 1 的正定二次型的集合。这是一个优美的结果。一个对称群刻画出了一类自然而重要的对象。这种视角是现代几何学和物理学的核心,物理定律通常被表述为在一组变换下的不变量。

群与二次型之间的这种相互作用不仅限于连续的实数世界。同样的想法在有限域上也有着惊人的效果,而有限域是现代密码学、编码理论和计算机科学的基础。通过研究像 GL2(F2)GL_2(\mathbb{F}_2)GL2​(F2​)(元素为 0 或 1 的可逆 2×22 \times 22×2 矩阵构成的群)这样的群在域 F2\mathbb{F}_2F2​ 上的二次型集合上的作用,我们可以将这些离散的二次型分类为少数几个轨道,或称为等价类。这种分类对于构造纠错码和理解有限几何至关重要。

概率、数据与钟形曲线

这可能看起来令人惊讶,但二次型也处于概率和统计学的核心。你肯定见过正态分布的钟形曲线。对于单个变量,其公式在指数部分包含一个简单的平方项。但是对于高维数据,其中每个数据点有多个特征,情况又如何呢?这就是多元正态分布的领域。其概率密度函数由一个二次型控制:

f(x)=1(2π)ndet⁡(Σ)exp⁡(−12(x−μ)TΣ−1(x−μ))f(\mathbf{x}) = \frac{1}{\sqrt{(2\pi)^n \det(\Sigma)}} \exp\left(-\frac{1}{2}(\mathbf{x}-\mathbf{\mu})^T \Sigma^{-1} (\mathbf{x}-\mathbf{\mu})\right)f(x)=(2π)ndet(Σ)​1​exp(−21​(x−μ)TΣ−1(x−μ))

指数中的项,(x−μ)TΣ−1(x−μ)(\mathbf{x}-\mathbf{\mu})^T \Sigma^{-1} (\mathbf{x}-\mathbf{\mu})(x−μ)TΣ−1(x−μ),就是一个二次型!这里,x\mathbf{x}x 是变量向量,μ\mathbf{\mu}μ 是均值向量,Σ\SigmaΣ 是协方差矩阵。这个二次型,被称为马氏距离(Mahalanobis distance)的平方,衡量了一个数据点的“罕见”程度。这个二次型的水平集是等概率密度的椭球。

在统计学中,我们不断分析数据的函数,例如样本均值(一个线性型)和样本方差(与一个二次型相关)。一个关键问题是这些统计量是独立的还是相关的。二次型的代数为精确回答这个问题提供了工具。通过计算一个多元正态向量的线性型和二次型之间的协方差,我们可以推导出它们独立的条件,这是假设检验的基石,例如在方差分析(ANOVA)中。这些正态变量的二次型通常服从卡方分布(chi-squared distribution),这是科学和工程中无数“拟合优度”检验的支柱。

整数的深层奥秘

二次型最古老、最深刻的应用或许在于数论——数学的皇后。自古以来,数学家们就对诸如“哪些整数可以写成两个平方数之和?”这类问题着迷。这是一个关于方程 n=x2+y2n = x^2 + y^2n=x2+y2 整数解的问题,其中涉及一个简单的二次型。

伟大的数学家 Carl Friedrich Gauss 将这项研究提升为一门系统的艺术,他考虑了一般的具有整数系数的​​二元二次型​​,Q(x,y)=ax2+bxy+cy2Q(x, y) = ax^2 + bxy + cy^2Q(x,y)=ax2+bxy+cy2。他发展了一套“约化”理论,为每一类等价的二次型找到一个唯一的、规范的代表,从而实现了系统的分类。例如,通过寻找所有具有特定判别式(比如 D=−20D=-20D=−20)的“约化”型,可以发现恰好存在两种这样的基本形式:x2+5y2x^2+5y^2x2+5y2 和 2x2+2xy+3y22x^2+2xy+3y^22x2+2xy+3y2。这意味着任何能被具有此判别式的二次型表示的整数,都能被这两种形式之一表示。

有些二次型特别“慷慨”。如果一个二次型可以表示每一个正整数,它就被称为​​普适的​​(universal)。1770年,Joseph-Louis Lagrange 证明了著名的四平方和定理,该定理指出任何正整数都可以写成四个整数平方的和。用我们的语言来说,这意味着二次型 Q(x,y,z,w)=x2+y2+z2+w2Q(x,y,z,w) = x^2+y^2+z^2+w^2Q(x,y,z,w)=x2+y2+z2+w2 是普适的。相比之下,三平方和 x2+y2+z2x^2+y^2+z^2x2+y2+z2 却不是,因为它永远不能表示像 7 或 15 这样的数。研究哪些二次型是普适的是一个深刻而活跃的研究领域,其中像 Conway-Schneeberger 15-定理这样强大的结果提供了非凡的判据。

这种联系的真正深度在19世纪被揭示出来。数论学家们发现了一个惊人的对应关系:给定判别式的本原二元二次型的等价类与一个称为二次数域的​​理想类群​​的元素之间存在一一对应关系。这一发现统一了数学中两个看似不相干的领域——二次型的分析/几何理论与数域的抽象代数理论。将整数解视为格点上的点的数之几何,为这两个世界之间架起了一座美丽的视觉桥梁。

这种“局部-全局”的思维方式在现代数论的瑰宝之一——​​Hasse-Minkowski 定理​​中达到了顶峰。它对这样一个问题给出了深刻的答案:像 q(x)=0q(\mathbf{x})=0q(x)=0 这样的方程何时有有理数解?该定理指出,“全局”上(在有理数中)存在解,当且仅当“局部”上处处存在解——也就是说,在实数中和在对应于每个素数 ppp 的每个 ppp-进数系中都存在解。这个原则使我们能够通过将其分解为一系列更易于处理的局部检验,来解决一个单一的、无限复杂的问题。

一个抽象的游乐场

最后,正如数学家们经常做的那样,我们可以将镜头转回自身。如果我们把二次型本身当作对象——当作一个抽象向量空间中的向量,会怎么样?然后我们可以为这个空间配备更多的结构。例如,我们可以通过在一个圆上对两个二次型的乘积进行积分来定义它们之间的内积。一旦有了内积,我们便有了长度、角度和正交性的概念。我们可以取一组简单的二次型基(如 x2x^2x2, xyxyxy 和 y2y^2y2),并应用 Gram-Schmidt 过程来产生一个标准正交基,就像我们对欧几里得空间中的普通向量所做的那样。这种抽象的观点虽然看似深奥,却是在泛函分析和表示论中揭示隐藏结构与联系的强大工具。

从塑造宇宙、描述数据的不确定性,到解开素数的算术奥秘,二次型是一个功能异常多样且具有统一性的概念。它的故事证明了一个简单的数学思想,如何从初等代数中诞生,并成长为描述世界以及我们用以理解世界的抽象结构的基本语言。