根式扩张

玻尔百科

核心要点

根式扩张是一个域塔，通过依次添加先前构造的域中元素的根作为新元素而构建。
一个多项式是根式可解的，当且仅当其伽罗瓦群——其根的对称群——是一个可解群。
一般五次多项式不是根式可解的，因为其伽罗瓦群，即对称群 $S_5$ ，不是一个可解群。
根式扩张理论将“公式”这一直观概念形式化，并解释了为何次数为 2、3、4 的方程存在这样的公式，而次数为 5 及更高的方程则不存在。

引言

数个世纪以来，寻求多项式方程的求根公式一直是数学的核心主题。继二次、三次和四次方程的解法被发现之后，寻找一般五次方程的求根公式——一个仅使用基本算术运算和开方运算的公式——成为了一项著名而棘手的挑战。然而，这一探索是基于一个未经形式化的“公式”概念。这个长期存在的问题的解决方案并非来自更强的计算技巧，而是源于一种革命性的视角转变，它将方程的可解性与抽象的对称性概念联系起来。

本文深入探讨了这种联系的核心：根式扩张。它旨在弥合“根式求解”的直观概念与其严格的代数定义之间的知识鸿沟。您将学习到将通过根式逐步构造数的过程与多项式伽罗瓦群的深层结构特性联系起来的精确机制。接下来的章节将首先剖析基本概念，探索用根式构建的域塔如何反映可解群的分解。然后，我们将审视该理论的深远应用和后果，从解释经典求解方法到证明求解一般五次方程的著名不可能性，从而重新绘制了数学可能性的版图。

原理与机制

“数”的配方：什么是根式？

几个世纪以来，数学家们一直在寻找解多项式方程的“公式”。高中代数的瑰宝——二次方程求根公式——告诉我们，仅使用系数 $a, b, c$ 和一组运算工具：加、减、乘、除以及开平方，就能找到任何 $ax^2+bx+c=0$ 的根。他们也为三次和四次方程找到了类似但极其复杂的公式。于是，对五次方程的探索开始了。

这一探索迫使人们思考一个深刻的问题：仅用基本算术和开方运算写出一个公式，这究竟意味着什么？让我们试着像物理学家定义测量那样精确。我们从一个基础数集开始，比如有理数 $\mathbb{Q}$ （所有分数）。我们能用它们构造出什么？

显然，我们可以随心所欲地进行加、减、乘、除运算。用现代代数的语言来说，这意味着我们在域 $\mathbb{Q}$ 内工作。但关键在于增加一个新工具：开 $n$ 次方。

想象一下，我们从域 $\mathbb{Q}$ 中取出数字 $2$ ，并对它开平方，得到 $\sqrt{2}$ 。现在我们有了一个新的数集，它不仅包含 $\mathbb{Q}$ ，还包括所有形如 $a+b\sqrt{2}$ 的数，其中 $a$ 和 $b$ 是有理数。这个新的、更大的数系也是一个域，我们称之为 $\mathbb{Q}(\sqrt{2})$ 。我们已经建好了塔的第一层。

但为什么要停在这里？我们现在可以从新域 $\mathbb{Q}(\sqrt{2})$ 中取任何数，并对它开方。例如，数 $1+\sqrt{2}$ 就在我们的新域中。如果我们对它开平方，得到 $\sqrt{1+\sqrt{2}}$ 呢？这会给我们一个更大的域。

这种一步步的构造过程，正是数学家们所说的根式扩张的核心。一个域扩张 $K/F$ 是一个根式扩张，如果我们能从“底层” $F$ 到达“顶层” $K$ ，通过建造一个有限的域塔：

$F = F_0 \subseteq F_1 \subseteq \dots \subseteq F_m = K$

其中，每一新层 $F_{i+1}$ 都是在其下一层 $F_i$ 的基础上，通过添加一个新元素 $\alpha_i$ 而构建的，这个 $\alpha_i$ 是形如 $x^{n_i} = a_i$ 的方程的根。关键细节是，我们开方的那个数 $a_i$ 必须是我们刚刚建好的域 $F_i$ 中的一个元素。这允许了嵌套地创造像 $\sqrt{1+\sqrt{2}}$ 或 $\sqrt{7 + \sqrt[3]{5}}$ 这样的数。过程中的每一步都像是在一个配方中增加一条指令：“现在，把你刚计算出的数开立方根。”

从配方到根：伟大的联系

所以，我们有了一种精确的方式来描述“可用根式表示”的数：它们是存在于我们基域 $\mathbb{Q}$ 的某个根式扩张中的数。这如何与解一个像 $x^5 - 4x + 2 = 0$ 这样的多项式方程联系起来呢？

一个多项式被称为根式可解，如果它的所有根都可以用根式表示。用域的语言来说，这意味着该多项式的分裂域——包含其所有根的最小域——必须被包含在某个根式扩张之内。注意这里的微妙之处：分裂域不必是域塔的最后一层，它只需要能被容纳在塔内即可。这给了我们一些方便的灵活性，我们将会看到这一点非常重要。

这个定义在两个世界之间架起了一座桥梁。一边是一个具体的、构造性的过程：一个通过开方建立的域塔。另一边是一个多项式的抽象性质，由其根和对称性所概括。Évariste Galois 的天才之处在于，他证明了这两个世界实际上是同一个。他发现，根的对称群——即伽罗瓦群——的可解性，完美地反映在根式塔的存在性上。

一个多项式是根式可解的，当且仅当其伽罗瓦群是一个可解群。

机制：为何根式意味着可解群

这是一个惊人的论断。为什么一个名为“可解性”（指群可以被分解为一系列阿贝尔群，即交换群）的群论性质，会与我们一步步开方的配方有任何关系？

当我们仔细审视根式塔中的单一步骤时，奇迹发生了：添加 $\alpha = \sqrt[n]{a}$ 。假设我们在域 $K$ 上工作，并形成新域 $K(\alpha)$ 。关于这个扩张的对称性，即它的伽罗瓦群 $\text{Gal}(K(\alpha)/K)$ ，我们能说些什么？

你可能希望这个基本步骤总是简单且“行为良好”的。但自然界更为微妙。考虑在 $\mathbb{Q}$ 上的扩张 $\mathbb{Q}(\sqrt[3]{7})$ 。其最小多项式是 $x^3 - 7$ 。它的根是 $\sqrt[3]{7}$ 、 $\omega\sqrt[3]{7}$ 和 $\omega^2\sqrt[3]{7}$ ，其中 $\omega = \exp(2\pi i/3)$ 是一个复数单位立方根。我们的域 $\mathbb{Q}(\sqrt[3]{7})$ 只包含第一个实数根。它不包含另外两个复数根。这意味着它不是完全的分裂域；它不是一个“正规”扩张，其伽罗瓦群也不如我们期望的那样直截了当。对称性被破坏了。

为了解决这个问题，我们需要一个聪明的技巧。问题在于缺失了单位根。如果我们从一开始就把它们加进来会怎样？让我们取基域 $K$ ，首先添加我们可能需要的所有 $n$ 次单位根。我们称这个新的、更大的域为 $K'$ 。这一步本身就是一个根式扩张，因为一个单位根 $\zeta_n$ 只是方程 $x^n-1=0$ 的一个根。

现在，在这个准备好的域 $K'$ 上，让我们再试一次根式步骤：添加 $\alpha = \sqrt[n]{a}$ 。因为 $K'$ 已经包含了所有 $n$ 次单位根，所以 $x^n-a$ 的所有根（即 $\alpha, \zeta_n\alpha, \zeta_n^2\alpha, \dots$ ）只需将 $\alpha$ 与 $K'$ 中已有的元素相乘即可得到。这使得扩张 $K'(\alpha)/K'$ 成为一个伽罗瓦扩张，并且它的伽罗瓦群结果非常优美和简单：它是一个循环群。

而循环群是阿贝尔群的典型例子。

所以，完整的推理链如下：

任何根式扩张都可以通过稍微扩大它（主要是通过加入必要的单位根）来变成一个伽罗瓦扩张。
一旦单位根存在，塔中每一个单独的“开方”步骤都对应于伽罗瓦群序列中的一个循环（因此是阿贝尔）商群。
一个可以被分解为一系列阿贝尔商群链的群，正是一个可解群的定义。

构建根式塔的构造过程，与将一个群分解为简单的阿贝尔部分这一代数过程完美对应。这就是核心机制，是连接公式世界与抽象群世界的齿轮。

威力与局限

这种强大的联系立即赋予了我们预测能力。如果你给我一个明确由根式构造的数，比如 $\alpha = \sqrt{7 + \sqrt[3]{5}}$ ，我无需大量计算就能告诉你一些深刻的事情： $\alpha$ 的最小多项式的伽罗瓦群必定是可解的。这个数的配方保证了其对称性的性质。

但一个科学原理的真正力量不仅在于它能解释什么，还在于它禁止什么。在这里，该理论给出了它最著名的结果。一般五次多项式的伽罗瓦群是五个元素上的对称群 $S_5$ 。而事实证明， $S_5$ 不是一个可解群。它包含一个复杂性的“核心”，即单群 $A_5$ ，这个核心无法被分解为阿贝尔部分。

因此，伽罗瓦的宏伟定理宣告，伽罗瓦群为 $S_5$ 的多项式（如具体例子 $x^5 - 4x + 2 = 0$ ）的根不可能被包含在任何根式扩张中。没有配方。无论多么巧妙，都不存在仅用算术和根式来解一般五次方程的公式。探索结束了，不是因为数学家不够聪明，而是因为对称性的结构本身禁止了它。

该理论也定义了“根式”世界的边界。根式扩张中的任何数都必须在 $\mathbb{Q}$ 上是代数的——它必须是某个有理系数多项式的根。这意味着像 $\pi$ 这样的超越数，它们不是任何此类多项式的根，永远无法用根式表示。

更令人惊讶的是，“是根式扩张”这一性质并不像看起来那么简单。一个根式扩张的子扩张不一定本身也是一个根式扩张。此外，一个多项式根式可解，精确地说是指其分裂域包含于一个根式扩张中，但这并不意味着该分裂域本身就是通过根式添加直接构造出来的。例如，分圆域 $\mathbb{Q}(\zeta_9)$ 是一个简单的根式扩张，因为 $\zeta_9^9 = 1$ 。它的三次实子域 $\mathbb{Q}(\cos(2\pi/9))$ 的伽罗瓦群是可解的，因此其元素可以用根式表达。然而，这个域本身不能表示为 $\mathbb{Q}(\sqrt[3]{d})$ 这种形式的简单根式扩张，并且要用根式表达其元素需要借助复数（此即“不可约情形”）。同样， $\mathbb{Q}(\cos(2\pi/7))$ 的情况也类似，它也体现了这种复杂性。这些例子是一个美妙的警示：数学世界错综复杂的结构常常挑战我们最简单的直觉，揭示出一个具有惊人深度和复杂性的景观。

应用与跨学科联系

“解”一个方程到底意味着什么？对古巴比伦人和希腊人来说，解一个像 $ax^2 + bx + c = 0$ 这样的二次方程意味着找到一个几何构造。对文艺复兴时期的数学家来说，这意味着找到一个普适的配方——一个公式——能仅用熟悉的算术运算和开方运算，从系数中产生根。这个配方，即著名的二次方程求根公式，是代数艺术的一大胜利。它预示着一个世界，其中任何多项式方程都可能被一把类似但更复杂的钥匙解开。

这一希望持续了一段时间。意大利数学家们为三次和四次方程找到了繁复而精彩的公式。但五次方程却顽固地保持着它的挑战性。几个世纪以来，最伟大的数学家们与之搏斗，寻找那难以捉摸的根式公式。这场斗争似乎是智力的较量。当然，一个足够聪明的数学家总能找到正确的立方根和五次方根的组合来破解密码。

Niels Henrik Abel 和 Évariste Galois 的革命性洞见是彻底重构了这个问题。他们指出，问题不在于缺乏巧思，而在于基本的结构。他们揭示，一个方程的可解性，无关计算，而关乎对称性。描述这种对称性的语言是群论，而将其与方程联系起来的桥梁就是根式扩张的概念。一个多项式是根式可解的，当且仅当其对应的伽罗瓦群是“可解的”——也就是说，其对称性可以被分解为一系列简单的、行为良好的步骤。

逐步构建解

让我们看看这个“一步一步”的过程是怎样的。想象我们想要构建一个方程的解。我们从基本材料，即有理数 $\mathbb{Q}$ 开始。一个“根式扩张”就是向我们的集合中添加一个新数，一个像 $\sqrt[n]{a}$ 这样的根式，其中 $a$ 是我们已有的数。一个多项式是根式可解的，如果我们能构造一个这样的扩张塔，每一层都建立在前一层之上，直到我们到达一个包含该多项式所有根的域。

考虑在有理数域上的简单三次方程 $x^3 - 7 = 0$ 。它的根不仅仅是 $\sqrt[3]{7}$ ，还有 $\sqrt[3]{7}\omega$ 和 $\sqrt[3]{7}\omega^2$ ，其中 $\omega$ 是一个复数单位立方根。为了捕捉所有这些根，我们需要两种新成分。首先，我们需要 $\omega$ ，它本身是 $x^2 + x + 1 = 0$ 的根。由于这是一个二次方程，它的解涉及一个平方根（ $\omega = \frac{-1+i\sqrt{3}}{2}$ ），这是一个合法的根式。所以我们的第一步是构建域 $\mathbb{Q}(\omega)$ 。然后，我们进行第二步：我们添加 $\sqrt[3]{7}$ 。得到的域 $\mathbb{Q}(\omega, \sqrt[3]{7})$ 现在包含了所有的根。我们已经构建了一个两层的塔， $\mathbb{Q} \subset \mathbb{Q}(\omega) \subset \mathbb{Q}(\omega, \sqrt[3]{7})$ ，每一步都是一个简单的根式扩张。这就是可解性的具体含义。

对于更复杂的例子，比如 $x^4 - 2 = 0$ ，伽罗瓦群是二面体群 $D_4$ ，即一个正方形的对称群。一个正方形有相当多的对称性，但它不是不可分解的。我们可以分解它的对称性：例如，我们可以区分出180度旋转群，或沿对角线的反射。群 $D_4$ 的这种一步步可分解性，完美地反映在域扩张中。我们发现解可以通过一个纯二次扩张塔来构建，例如 $\mathbb{Q} \subset \mathbb{Q}(i) \subset \mathbb{Q}(i, \sqrt{2}) \subset \mathbb{Q}(i, \sqrt[4]{2})$ 。由于每一步都是可解的，整个结构也是可解的。解方程的故事就是耐心解开其伽罗瓦群对称性的故事。

对于一般四次方程，其伽罗瓦群是完全对称群 $S_4$ ，古代大师们的第一个关键洞见是构造一个“预解三次式”。这是一个绝妙的技巧。不是直接处理高度对称的 $S_4$ 群（有24个元素），而是首先构造一个相关的三次方程，其根是原始四次方程根的组合。这个新多项式的伽罗瓦群是更小的、可解的群 $S_3$ 。通过首先解这个更简单的三次方程，我们将问题的对称性从 $S_4$ “打破”到更易于管理的状态，之后剩余的问题就坍缩为一系列二次方程。这是一个寻找问题对称性中结构弱点的优美例证。

五次方程大分水岭

对于2、3、4次方程，这种分解对称性的策略总是奏效。伽罗瓦群（ $S_2, S_3, S_4$ ）都是可解的。但到了五次方程，一切都变了。阿贝尔-鲁菲尼定理宣告，不存在仅用算术和根式来解五次或更高次多项式方程的通用公式。其原因深刻：一个典型的五次方程的伽罗瓦群是对称群 $S_5$ ，而 $S_5$ 不是一个可解群。

理解这意味着什么和不意味着什么至关重要。它不意味着没有五次方程是可解的。例如，方程 $x^5 - c = 0$ 显然是根式可解的。它的解需要找到5次单位根（来自可解的分圆多项式 $\Phi_5(x) = x^4+x^3+x^2+x+1$ ），然后添加简单的根式 $\sqrt[5]{c}$ 。它的伽罗瓦群是一个可解群，而不是完整的 $S_5$ 。同样，一个看似复杂的多项式 $x^{10} - 4x^5 + 2 = 0$ 也是可解的。通过令 $y=x^5$ ，方程变成一个简单的二次方程 $y^2 - 4y + 2 = 0$ 。我们用二次公式解出 $y$ ，剩下两个形如 $x^5 = \text{常数}$ 的方程，我们已经知道它们是可解的。可解性这个性质是行为良好的；如果你能解部分，你就能解整体。事实上，如果你有两个根式可解的多项式 $f(x)$ 和 $g(x)$ ，它们的乘积 $h(x) = f(x)g(x)$ 也保证是可解的。

那么怪物在哪里？怪物在于一般的五次方程，一个没有任何特殊结构简化的方程。它的伽罗瓦群 $S_5$ 包含一个子群，即交错群 $A_5$ ，它是“单群”。这不意味着简单；它意味着它是一个不可分割的单位。它没有非平凡的正规子群。它不能被分解为一系列更简单的循环群。它是一个单一的、坚如磐石的对称结，无法用根式工具解开。

不可解性的深层结构

有人可能会想，这种不可能性是否只是一个表面的障碍。我们难道不能将五次方程简化到可解的程度吗？例如，通过一系列巧妙的代数变换，即所谓的契恩豪斯变换，任何五次方程都可以被简化为看似更简单的 Bring-Jerrard 范式 $x^5 + ax + b = 0$ 。这能解决问题吗？惊人的是，不能。这个论证既优雅又有力。用于简化五次方程的变换本身只需要解四次或更低次的辅助方程——也就是说，简化过程本身是“根式可解的”。如果得到的 Bring-Jerrard 方程是根式可解的，那么就可以将其解法配方与变换的配方结合，从而为原始的一般五次方程产生一个解。但这正是 Abel 和 Galois 证明为不可能的。这是一个优美的反证法：你不能用一个可解的过程来逃脱一个不可解的结构。

这种不可解性的稳固性是惊人的。如果我们给自己一个先机呢？假设我们不是从有理数开始，而是从一个已经包含根式的域开始，比如 $L = \mathbb{Q}(\sqrt[n]{a})$ 。现在我们肯定能在这个更大的域上解一般五次方程了吧？答案仍然是“不”。伽罗瓦理论表明，新的伽罗瓦群要么保持为 $S_5$ ，要么至多缩减为其单子群 $A_5$ 。两者都是不可解的。这种不可能性并非我们出发点的偶然产物；它是多项式对称群的内在属性。

可解群与不可解群之间的这种区别是问题的核心。像循环群、二面体群 $D_4$ 等许多群，都属于一个庞大的“可解群”家族。一个包含其中许多群的更一般的类别是亚循环群家族，其定义是拥有一个循环正规子群，且其商群也是循环的。这种结构特性——由循环部分构成——正是保证可解性的原因。伽罗瓦判据是一本完美的字典：一个多项式是根式可解的，当且仅当其对称群具有这种可分解的结构。

超越根式：新的数学视界

那么，这就是故事的结局吗？一个伟大的不可能性定理，一堵我们无法逾越的墙？恰恰相反。在数学中，不可能性定理很少是死胡同；它们是指路牌，指向更新、更丰富的领域。

阿贝尔-鲁菲尼定理只说明五次方程不能*用根式*求解。这是关于一个特定工具箱的陈述。如果我们允许自己使用新工具呢？这正是 Charles Hermite 在19世纪所走的道路。他证明了一般五次方程可以被解，前提是你将你的工具箱扩展到包含一类新对象：椭圆函数。

这并不与阿贝尔-鲁菲尼定理相矛盾，就像钢的存在并不与你不能用木头建造摩天大楼的事实相矛盾一样。它只是意味着问题需要更先进的技术。根式解依赖于对幂函数（ $x \mapsto x^n$ ）求逆。而椭圆函数解依赖于对某些与椭圆弧长相关的积分求逆。这些是超越函数，而非代数函数。Hermite 的工作揭示了求解多项式方程的探索与复分析和模形式理论紧密相连，而这些数学领域似乎相距甚远。

长达数个世纪的求解五次方程的斗争并没有以失败告终。它催生了群论的诞生，伽罗瓦理论的深刻洞见，以及一个指向贯穿所有数学的深邃、统一联系的指路牌。最终，这个不可解的方程带给我们的奖赏远比一个单纯的公式所能提供的要伟大得多：它给了我们一种看待世界的新方式。