try ai
科普
编辑
分享
反馈
  • 牛顿恒等式

牛顿恒等式

SciencePedia玻尔百科
核心要点
  • 牛顿恒等式在多项式的系数(初等对称多项式)和其根的幂次和(幂和)之间建立了直接的代数关系。
  • 在线性代数中,这些恒等式提供了一个强大的捷径,将矩阵特征多项式的系数与易于计算的其各次幂的迹联系起来。
  • 牛顿恒等式的原理具有普适性,在连续介质力学、图论、数论和现代几何学等不同领域均有应用。

引言

当我们面对一组重要数字——例如一个物理系统的特征值或一个方程的根——我们如何捕捉它们的集体本质?我们可以通过它们的相互关系结构来描述它们,即使用构成其母多项式系数的初等对称多项式。或者,我们也可以通过幂和来衡量它们的个体贡献,例如它们的平方和或立方和。这就引出了一个关键问题:这两种截然不同的描述方式——一种关于结构,另一种关于幂——是否相互关联?有没有一种方法可以在两者之间进行转换,而无需费力地找出每一个根?

本文将揭示一条对此问题给出响亮“是”的“秘密通道”:一组被称为牛顿恒等式(Newton's sums)的优美而强大的关系式。这些恒等式在多项式系数的世界和幂和的世界之间架起了一座桥梁,提供了深刻的理论见解和非凡的计算捷径。我们将首先深入探讨这些恒等式的核心“原理与机制”,推导它们并揭示其与线性代数之间令人惊讶的联系。随后,在“应用与跨学科联系”部分,我们将开启一段旅程,见证这个单一的代数概念如何在从工程学、物理学到纯数学的广阔领域中产生共鸣,从而证明其作为科学中一个真正基本模式的地位。

原理与机制

想象你得到了一组数字。它们或许是小提琴弦的共振频率,或许是一个原子的能级,又或许是一位物理学家在黑板上草草写下的某个多项式方程的根。你会如何描述这组数字作为一个整体的特性?你可能会尝试两种截然不同的方法。

同一枚硬币的两面:系数与幂和

一种方法是考察这些数字如何以一种集体的、民主的方式相互作用。你可以将它们全部相加。你可以将所有可能的两两乘积相加。你可以将所有可能的三三乘积相加,以此类推,直到最后得到所有数字的总乘积。如果我们的数字是 α1,α2,…,αn\alpha_1, \alpha_2, \ldots, \alpha_nα1​,α2​,…,αn​,这些和就是数学家所称的​​初等对称多项式​​,记为 eke_kek​。

e1=∑iαie_1 = \sum_i \alpha_ie1​=∑i​αi​ e2=∑i<jαiαje_2 = \sum_{i \lt j} \alpha_i \alpha_je2​=∑i<j​αi​αj​ ... en=α1α2⋯αne_n = \alpha_1 \alpha_2 \cdots \alpha_nen​=α1​α2​⋯αn​

这些 eke_kek​ 作为基本构件,其重要性非同寻常,因为它们正是以这些数字为根的多项式的系数(可能相差一个正负号)。多项式 P(x)=(x−α1)(x−α2)⋯(x−αn)P(x) = (x-\alpha_1)(x-\alpha_2)\cdots(x-\alpha_n)P(x)=(x−α1​)(x−α2​)⋯(x−αn​) 展开后得到 P(x)=xn−e1xn−1+e2xn−2−⋯+(−1)nenP(x) = x^n - e_1 x^{n-1} + e_2 x^{n-2} - \cdots + (-1)^n e_nP(x)=xn−e1​xn−1+e2​xn−2−⋯+(−1)nen​。因此,eke_kek​ 为我们提供了关于这组数字的一种“社会性”或“关系性”的视角。

但还有另一种更直接的方法。我们可以不看它们的组合,而是看它们各自的“幂”并求和。我们可以对数字本身求和。我们可以对它们的平方求和。我们可以对它们的立方求和。这些被称为​​幂和​​,记为 pkp_kpk​。

p1=∑iαip_1 = \sum_i \alpha_ip1​=∑i​αi​ p2=∑iαi2p_2 = \sum_i \alpha_i^2p2​=∑i​αi2​ p3=∑iαi3p_3 = \sum_i \alpha_i^3p3​=∑i​αi3​ ... 以此类推。

幂和为我们提供了另一种信息,它关注的是我们这组数字内部“量值”或“强度”的分布。

现在,一个物理学家,或者任何一个有好奇心的人,都应该立刻发问:这两种描述有关联吗?它们似乎在衡量同一组数字的不同方面。初等多项式(eke_kek​)关乎组合与结构,而幂和(pkp_kpk​)关乎原始的幂。它们之间是否存在一条秘密通道?如果我知道多项式的系数,我能算出其根的立方和吗? 反之,如果我测量了前几个幂和,我能重构出多项式的系数吗?

答案是响亮的“是”,而这条秘密通道就是一组极其优美而强大的关系式,称为​​牛顿求和​​(Newton's sums)或​​牛顿恒等式​​(Newton's identities)。

罗塞塔石碑:推导牛顿恒等式

这些恒等式并非凭空出现的神秘启示;它们源于一个简单而优美的观察。让我们试着自己发现前几个恒等式。

第一个幂和 p1=∑αip_1 = \sum \alpha_ip1​=∑αi​ 根据定义就与第一个初等对称多项式 e1e_1e1​ 相同。所以,我们的第一个恒等式是平凡的:

p1=e1p_1 = e_1p1​=e1​

现在来看第二个。我们如何将 p2=∑αi2p_2 = \sum \alpha_i^2p2​=∑αi2​ 与 e1e_1e1​ 和 e2e_2e2​ 联系起来?让我们试着玩弄一下已知的东西。如果我们对 e1e_1e1​ 平方会发生什么?

e12=(α1+α2+⋯+αn)2e_1^2 = (\alpha_1 + \alpha_2 + \cdots + \alpha_n)^2e12​=(α1​+α2​+⋯+αn​)2

当你展开这个式子,你会得到两类项:一类是一个根与自身相乘的项(αi2\alpha_i^2αi2​),另一类是两个不同根相乘的项(αiαj\alpha_i \alpha_jαi​αj​,其中 i≠ji \neq ji=j)。

e12=(α12+α22+⋯+αn2)+2(α1α2+α1α3+⋯ )e_1^2 = (\alpha_1^2 + \alpha_2^2 + \cdots + \alpha_n^2) + 2(\alpha_1 \alpha_2 + \alpha_1 \alpha_3 + \cdots)e12​=(α12​+α22​+⋯+αn2​)+2(α1​α2​+α1​α3​+⋯)

仔细看!第一部分正是我们的幂和 p2p_2p2​。第二部分恰好是第二个初等对称多项式的两倍,即 2e22e_22e2​。所以我们发现了:

e12=p2+2e2e_1^2 = p_2 + 2e_2e12​=p2​+2e2​

重新整理这个式子,我们得到第二个牛顿恒等式:p2−e1p1+2e2=0p_2 - e_1 p_1 + 2e_2 = 0p2​−e1​p1​+2e2​=0。我们已经架起了一座桥梁!如果你知道 e1e_1e1​ 和 e2e_2e2​(从多项式系数中得知),你就能求出 p2p_2p2​。如果你知道 p1p_1p1​ 和 p2p_2p2​(从某些测量中得知),你就能求出 e2e_2e2​。

这个模式会继续下去。人们可以推导出一整套这样的恒等式,每一个都将下一个幂和 pkp_kpk​ 与之前的幂和及初等多项式联系起来:

p1−e1=0p_1 - e_1 = 0p1​−e1​=0 p2−e1p1+2e2=0p_2 - e_1 p_1 + 2e_2 = 0p2​−e1​p1​+2e2​=0 p3−e1p2+e2p1−3e3=0p_3 - e_1 p_2 + e_2 p_1 - 3e_3 = 0p3​−e1​p2​+e2​p1​−3e3​=0 ...以此类推。

它们的显著特点是其​​递归​​性。你可以利用它们像爬梯子一样,仅凭多项式的系数,一步一步地计算出越来越高阶的幂和。这使得计算诸如多项式根的六次方和之类的量变得异常迅速,而如果通过先求出所有根再计算,这项任务将是噩梦般的。

一个惊人的联系:从代数到矩阵

作为代数的一部分,这已经非常巧妙了,但它在现实世界中又出现在哪里呢?在这里,我们偶然发现了一个让科学如此令人着迷的惊喜时刻。多项式根的抽象世界在非常具体的​​线性代数​​和物理学世界中有着惊人直接的体现。

考虑一个 n×nn \times nn×n 矩阵 AAA。在量子力学中,这类矩阵可能代表像能量或动量这样的物理可观测量。表征这样一个矩阵的基本数字是它的​​特征值​​,我们称之为 λ1,λ2,…,λn\lambda_1, \lambda_2, \ldots, \lambda_nλ1​,λ2​,…,λn​。这些特征值本质上是矩阵的“根”。它们回答了这样一个问题:矩阵在哪些方向上的作用仅仅是拉伸或收缩向量?

这些特征值的初等对称多项式 eke_kek​ 作为矩阵的​​特征多项式​​ P(λ)=det⁡(λI−A)P(\lambda) = \det(\lambda I - A)P(λ)=det(λI−A) 的系数出现。这个多项式是基础性的;它的根就是特征值。

那么幂和 pk=∑iλikp_k = \sum_i \lambda_i^kpk​=∑i​λik​ 呢?事实证明,它们对应于一个非常容易计算的东西:矩阵幂的​​迹​​!矩阵的迹是其对角线元素之和,一个简单的记账工作。线性代数中一个基本的事实是:

tr⁡(Ak)=∑i=1nλik=pk\operatorname{tr}(A^k) = \sum_{i=1}^n \lambda_i^k = p_ktr(Ak)=∑i=1n​λik​=pk​

突然之间,我们抽象的代数恒等式转变成了一个强大的计算工具。我们硬币的两面现在是:

  • ​​初等多项式 (eke_kek​)​​:特征多项式的系数。通常难以计算,因为它们涉及行列式。
  • ​​幂和 (pkp_kpk​)​​:矩阵幂的迹,tr⁡(Ak)\operatorname{tr}(A^k)tr(Ak)。易于计算;只需进行矩阵乘法并对几个数字求和。

牛顿恒等式就是那座桥梁!它们告诉我们,你可以仅通过计算矩阵前几次幂的迹来确定一个矩阵的特征多项式——一个关于其几何的深刻事实。反之,如果一位理论家给了你某个系统的特征多项式,你可以立即告诉他该矩阵任何次幂的迹,比如 A4A^4A4 的迹,而根本不需要写出矩阵本身! 这是一个令人难以置信的捷径,证明了不同数学概念之间隐藏的统一性。

看不见的架构:普适性与更深层结构

故事并未就此结束。牛顿恒等式的稳健性暗示着一个更深、更普遍的结构。

首先,这些恒等式对数字的类型并不挑剔。它们对复数和实数同样适用。更令人惊讶的是,它们甚至在被称为​​有限域​​的奇怪、有限的数系中也成立,而有限域是现代密码学和编码理论的基石。这表明 eke_kek​ 和 pkp_kpk​ 之间的关系是代数的基本定律,而不仅仅是我们熟悉的数轴的一个性质。

此外,初等多项式并非唯一的选择。还存在其他对称多项式族,如​​完全齐次对称函数​​(hkh_khk​),它们是特定次数的所有单项式的和。事实证明,它们也通过一组几乎相同的类牛顿恒等式与幂和相联系。这仿佛我们发现了一个相关物种的家族,它们都拥有一个共同的祖先。这暗示着存在一个由这些优美定律支配的、广阔且相互关联的数学对象大陆——对称函数环。

这个关系网是如此严格和具有预测性,以至于可以用一个行列式写出任何 eke_kek​ 关于幂和 p1,…,pkp_1, \ldots, p_kp1​,…,pk​ 的单一、显式公式。我们不需要逐一进行递归步骤;原则上,我们可以一蹴而就地写出答案。这个​​行列式公式​​有点像牛顿的万有引力定律——一个单一、紧凑的陈述,所有繁琐的、一步步的行星轨道计算都可以从中推导出来。它终极地证明了,在复杂计算的表象之下,存在着一个简单、强大而美丽的组织原则。

应用与跨学科联系

我们已经玩味了这些卓越的恒等式——牛顿恒等式,并看到了它们如何施展魔法,将一组数字的幂和与这些数字的对称组合联系起来。乍一看,这似乎只是一个巧妙但小众的代数技巧,一个给数学家的有趣谜题。但事实远比这奇妙得多。这种关系不仅仅是一种巧合;它是一种在整个科学和数学领域中回响的深层模式。这仿佛我们找到了一个普适的音叉,敲击它,我们便能在人类知识最意想不到的角落听到它的共鸣。让我们踏上旅程,聆听这些回响。

我们的第一站是有形的世界,一个充满变化系统和可拉伸材料的世界。在物理学和工程学中,我们常常使用一个排成方阵的数字集合,即矩阵,来描述一个系统的状态。这个矩阵可以代表任何东西,从电路中的连接到钢梁内部的应力。一个关键问题总是:这个系统的基本模式是什么?这些就是它的“特征值”,一组如同系统DNA的特殊数字。一个特殊多项式,“特征多项式”的系数,是由这些特征值的简单组合构成的——比如它们的和、两两乘积的和等等。这些就是我们之前讨论过的初等对称多项式 eke_kek​。

现在,假设我们想了解系统随时间演变的行为,或其对能量的响应。这通常涉及计算矩阵的某个次幂的“迹”,比如 tr⁡(A2)\operatorname{tr}(A^2)tr(A2) 或 tr⁡(A3)\operatorname{tr}(A^3)tr(A3)。迹就是矩阵主对角线上元素的和,但它有更深的含义:它也是所有特征值的和。所以,tr⁡(Ak)\operatorname{tr}(A^k)tr(Ak) 就是特征值的 kkk 次幂之和——我们的老朋友,幂和 pkp_kpk​。就在这里,联系豁然开朗!牛顿恒等式提供了一座直接而优美的桥梁。如果我们知道系统的特征多项式(即 eke_kek​),我们就能立即计算出其矩阵任何次幂的迹(即 pkp_kpk​),而无需进行将矩阵反复自乘的繁重劳动。这是一个惊人的捷径,一段用洞察力取代汗水的数学魔法。

这不仅适用于抽象矩阵。让我们亲自动手。想象你是一名工程师,正在研究一块橡胶在拉伸时的形变。形变由一个张量——一种物理学家使用的矩阵——描述,称为柯西-格林张量 (Cauchy-Green tensor),C\boldsymbol{C}C。它的特征值告诉你三个主方向上拉伸量的平方。材料对形变响应的基本属性由“不变量”捕捉,这些量无论你如何旋转材料都不会改变。其中两个,I1I_1I1​ 和 I2I_2I2​,正是特征值的初等对称多项式。然而,其他重要的物理量可能依赖于特征值的平方和,也就是张量平方的迹,tr⁡(C2)\operatorname{tr}(\boldsymbol{C}^2)tr(C2)。这些不同的应变量度之间有何关系?你猜对了。牛顿恒等式提供了这块罗塞塔石碑,给出了一个简单的公式,如 tr⁡(C2)=I12−2I2\operatorname{tr}(\boldsymbol{C}^2) = I_1^2 - 2I_2tr(C2)=I12​−2I2​,直接将这些基本物理量联系起来。事实证明,多项式根的抽象代数,被写进了弹性定律之中。

让我们暂时离开物理世界,漫步到更纯粹、更晶莹的数学世界。这种模式肯定会在这里失效吧?恰恰相反,它变得更加响亮。思考著名的斐波那契数列:1, 1, 2, 3, 5, 8... 一个相关的数列是卢卡斯数:1, 3, 4, 7, 11... 它遵循同样的“将最后两项相加”的规则,但起始不同。这些数列似乎由它们的历史定义,每个数都由其前两项生成。但还有另一种隐藏的看待方式。事实证明,卢卡斯数恰好是简单多项式 x2−x−1=0x^2 - x - 1 = 0x2−x−1=0 的根的幂和 (pkp_kpk​)。我们怎么可能知道这一点?通过反向运行牛顿恒等式!给定幂和序列(卢卡斯数 p1=1,p2=3,…p_1=1, p_2=3, \dotsp1​=1,p2​=3,…),这些恒等式使我们能够解出其母多项式的系数。这就像找到了该序列的遗传密码。

这曲调在其他领域继续奏响。以图论为例,即网络的研究。一个朋友关系网、一个分子、或互联网都可以被画成一个由节点和边组成的图。我们可以将这个图编码成一个邻接矩阵 AAA。幂和 pk=tr⁡(Ak)p_k = \operatorname{tr}(A^k)pk​=tr(Ak) 在这里有一个非常直观的含义:它们计算了在网络边上行走 kkk 步并最终回到起点的路径数量。牛顿恒等式于是就在这种“在图上行走”的具体行为与图的基本代数属性之间建立了一座桥梁,后者由其特征值的初等对称多项式表达。

这个普遍主题在特殊函数的研究中也同样上演,这些函数是数学物理学中的明星函数。以 Legendre 和 Chebyshev 等巨擘命名的多项式,在求解引力、电磁和波动方程时会出现。它们的根的位置并非随机;它们具有深刻的内部结构。例如,Legendre 多项式的根是用于一种称为高斯求积的强大数值积分技术的最佳点。要了解这些重要根的集体属性,我们必须计算出每一个吗?不。我们可以使用牛顿恒等式直接从多项式的系数计算出它们的平方和、立方和或任何其他次幂的和,从而轻松地深入了解它们的分布和平均行为。

至此,你可能已经感受到了这个思想的力量。但我们还只是在山麓中行走。真正的高峰还在前方,在现代科学最抽象和最基本的领域。在量子力学和粒子物理学中,对称性就是一切。对称性的语言是一个美丽的学科,称为表示论。它研究如何将抽象的对称性表示为矩阵。一个表示的“特征标”是其本质指纹,通过取这些矩阵的迹来计算。如果你知道一个基本对称操作 ggg 的特征标,那么由它构建的更复杂对称性,比如它的“三阶外幂”,其特征标是什么?这听起来无比抽象,但事实证明,答案由牛顿恒等式如银盘奉上。一个操作的幂 (g,g2,g3,…g, g^2, g^3, \dotsg,g2,g3,…) 的特征标是幂和 pkp_kpk​。其外幂的特征标是初等对称函数 eke_kek​。这些恒等式提供了一个直接的公式来从一组推导出另一组,成为物理学家和数学家构建我们宇宙模型的工具箱的核心部分。

让我们做最后一次攀登。在现代几何学的顶峰,数学家们研究着被称为“向量丛”的奇特而美丽的对象。想象地球的表面。在每一点上,都有一个“切平面”,即你可以行进的可能方向构成的平坦空间。向量丛就是将这个想法推广到更抽象的空间。一个基本问题是:这个丛有多“扭曲”?它像桌面上一叠平坦的平面,还是像莫比乌斯带上扭曲的方向?为了测量这种扭曲度,几何学家发明了“陈类”,它们在这个新语言中就是 eke_kek​。他们还发明了“陈特征”,结果发现它基于幂和 pkp_kpk​。而它们之间普适的、字典般的关系呢?再一次,是我们的老朋友,牛顿恒等式。支配矩阵迹和多项式根的同样简单的代数规则,也描述了这些抽象几何空间的基本形状。即使在代数数论中,这些恒等式也是不可或缺的,它们将定义一个数的数多项式的系数与其“迹”联系起来,而“迹”是研究数域的一个关键概念。

于是,我们从橡胶的拉伸之旅到了时空的结构。在每个领域,我们都听到了同一首歌。牛顿恒等式所捕捉的关系,是关于整体与其部分本性的一个深刻真理。它向我们展示了,如果我们知道一个系统的基本构件,我们就能推断出大量关于其集体行为的信息,反之亦然。这是数学统一性的一个惊人范例,一首简单、优雅的旋律,在科学的宏大交响乐中回荡。