抽象代数（八）：Galois 理论 —— 域与群之间的桥梁

1832 年 5 月 29 日的深夜，巴黎的一间阁楼里，20 岁的 Évariste Galois 知道自己活不过明天。决斗的约定已经写下，对手是当时法国枪法最好的军官之一。在蜡烛快要燃尽的时候，他没有写遗书，而是抓起一叠草稿纸，疯狂地把自己脑子里关于多项式根的所有想法往外倒。他在页边匆匆写下“我没有时间了”，然后把这叠纸寄给了朋友。这些手稿在抽屉里躺了十几年才被数学界真正读懂，但它们彻底改写了代数的走向。

我第一次读到这段历史时，心里冒出的第一个问题不是“他证明了什么”，而是“他到底在躲什么”。为什么一个研究多项式求根的人，会突然抛开根的具体数值，跑去研究一堆抽象的置换？后来我自己推导了几次才猛然醒悟：Galois 根本不是在做计算，他是在做“对称性普查”。他意识到，死磕根的数值是一条死胡同，但如果你把目光从“根等于几”转移到“根之间有哪些代数关系”，整个问题就会从一团乱麻变成一张清晰的地图。这就是 Galois 理论（Galois theory）的核心直觉：不要盯着数字看，去盯着数字背后的对称结构看。

这篇文章是我自学这段内容时的完整复盘。我会先问“为什么需要这个概念”，再用日常类比铺路，最后才给出正式定义。每一个公式后面，我都会紧跟一句大白话解释。如果你曾经被“正规子群（normal subgroup）”或“Galois 对应（Galois correspondence）”这些词绕晕过，这篇就是为你写的。

Galois 群：固定基域的自同构#

我们先从一个最朴素的困惑开始。假设你有一个域扩张（field extension） $$L/K$$ ，比如把有理数域 $\mathbb{Q}$ 扩大成 $\mathbb{Q}(\sqrt{2})$ 。在这个更大的域里，多了很多新元素。如果我们想研究这个扩张的“内部结构”，最直接的办法是什么？不是去列元素清单，而是去找那些“保持结构不变的变换”。在域的世界里，这种变换叫自同构（automorphism）。

但这里有个关键限制：我们只关心那些不动基域 $$K$$ 的自同构。为什么？因为 $$K$$ 是我们的“地基”，地基要是跟着一起动，我们就失去了参照系。正式写出来就是：

\mathrm{Gal}(L/K) = \mathrm{Aut}_K(L) = \{\sigma : L \to L \mid \sigma \text{ 是一个域自同构},\ \sigma|_K = \mathrm{id}\}.

这句话的意思是，Galois 群（Galois group）专门收集那些把 $$K$$ 里每个数原封不动留下，只在上层域 $$L$$ 里做“合法洗牌”的映射，并且这些映射复合起来刚好构成一个群。

这个定义的威力在哪里？在于它自动抓住了多项式的根。假设 $f(x) \in K[x]$ 是一个系数全在 $$K$$ 里的多项式， $\alpha \in L$ 是它的一个根。如果你把群里的任意一个映射 $\sigma$ 作用在等式 $f(\alpha)=0$ 两边，会发生什么？

0 = \sigma(0) = \sigma(f(\alpha)) = f(\sigma(\alpha)).

因为 $\sigma$ 不动 $$f$$ 的系数，它只能把根 $\alpha$ 挪到另一个根的位置，等式依然成立。这句话翻译成人话就是：Galois 群里的每一个操作，都必然把多项式的根置换成另一个根，绝不可能把根变成非根。

这就引出了群作用（group action）的直觉。想象你在玩一个三阶魔方。群作用就像你转动魔方的某一面：色块的位置变了，但魔方“每个面九宫格、颜色互斥”的底层规则纹丝不动。Galois 群作用在多项式的根上，逻辑完全一样：根的位置被置换，但它们满足的代数方程和运算关系绝对不破裂。当 $$L$$ 恰好是 $$f$$ 的分裂域（splitting field）时，这种作用是忠实的（faithful）——只要你知道了 $\sigma$ 怎么置换根，你就知道了 $\sigma$ 在整个域 $$L$$ 上怎么作用，没有任何盲区。

\sigma(\sqrt{2}) \in \{\sqrt{2}, -\sqrt{2}\}.

\sigma(a + b\sqrt{2}) = a + b\sigma(\sqrt{2}).

(a+b\sqrt{2})(a-b\sqrt{2}) = a^2 - 2b^2.

这句话的意思是，两个共轭元素相乘会消掉无理部分，结果自动落回 $\mathbb{Q}$ ，这正是 Galois 不变量的典型构造。

\sigma(\sqrt{2}) = \pm\sqrt{2}, \quad \sigma(\sqrt{3}) = \pm\sqrt{3}.

|\mathrm{Gal}(L/\mathbb{Q})| = 4 = [L:\mathbb{Q}].

这句话的意思是，自同构的个数刚好等于域扩张的次数，这是 Galois 扩张（Galois extension）的标志性特征。

\sigma(\sqrt[3]{2}) \in L \cap \{\text{roots of } x^3-2\} = \{\sqrt[3]{2}\}.

|\mathrm{Gal}(\mathbb{Q}(\sqrt[3]{2})/\mathbb{Q})| = 1 \neq 3 = [\mathbb{Q}(\sqrt[3]{2}):\mathbb{Q}].

这句话的意思是，自同构个数严格小于扩张次数，因为扩张“漏掉”了另外两个复根，破坏了正规性（normality）。

这就是上一篇可分性与正规性铺垫的伏笔：等式 $|\mathrm{Gal}(L/K)| = [L:K]$ 只在 Galois 扩张里成立。 $\mathbb{Q}(\sqrt[3]{2})/\mathbb{Q}$ 不是分裂域，群直接坍缩了。

L/K \text{ 是有限 Galois 扩张} \iff |\mathrm{Gal}(L/K)| = [L:K].

这句话的意思是，你可以用“数自同构个数”这种纯操作性的办法，来检验一个扩张是不是 Galois 的，两边完全等价。

这个等价命题的两半都极其好用。正向：数出自同构个数等于次数，立刻断定是 Galois 扩张。反向：已知是 Galois 扩张，如果你只找到了 $$[L:K]$$ 个自同构，就可以停手了，绝对没有漏网之鱼。它也和“可分+正规”的抽象定义严丝合缝：可分保证最多有 $$[L:K]$$ 个嵌入，正规保证这些嵌入全部落回 $$L$$ 内部，加起来就是恰好 $$[L:K]$$ 个自同构。“嵌入数等于次数”只是 $|\mathrm{Gal}(L/K)| = [L:K]$ 的另一种说法。

Galois 群虽然是个有限的小群，但它把整个域扩张的骨架全抽出来了。群论已经积累了两百年的结构定理（Sylow 定理、单群分类、表示论），Galois 理论等于开了一条隧道，把这些现成的武器全部搬进多项式求根的问题里。我们在第 7 篇搭的所有脚手架，就是为了换这张门票。

\mathrm{Gal}(f) = \{\pi \in S_n \mid \pi \text{ 尊重根之间的所有代数关系}\}.

这句话的意思是，不是所有根的排列都合法，只有那些不破坏根之间加减乘除恒等式的排列，才能升级成域自同构。 “尊重代数关系”这个条件是整个定义的命门。如果没有它，任何置换都合法，Galois 群永远是 $$S_n$$ ，理论就废了。有些置换之所以不能扩张成域自同构，正是因为它们会撕碎某些隐藏的代数等式。你在计算群的时候，利用的正是这些“被撕碎的等式”。

\zeta_8^3 = \zeta_8 \cdot \zeta_8^2 = \zeta_8 \cdot i, \quad \zeta_8 + \zeta_8^7 = \sqrt{2}.

|\mathrm{Gal}(x^4+1)| = 4 \ll 24 = 4!.

这句话的意思是，代数关系像滤网一样筛掉了 20 个非法置换，剩下的 4 个才是真正合法的 Galois 群。

固定域和 Galois 对应#

在正式翻开固定域的字典之前，我想先补一个极其接地气的直觉：为什么“不动点”能拼成一个域？你可以把自同构想象成一面镜子。如果你手里拿着一个不对称的物件（比如 $\sqrt{2}$ ），照镜子它会变成 $-\sqrt{2}$ ；但如果你把物件和它的镜像绑在一起（比如算和 $\sqrt{2} + (-\sqrt{2}) = 0$ ，或者算积 $\sqrt{2} \cdot (-\sqrt{2}) = -2$ ），结果就彻底对称了，镜子再也照不出区别。在代数里，这叫“对称化操作”。随便取 $$L$$ 里的一个元素 $\alpha$ ，把它在所有 $\sigma \in G$ 作用下的像加起来得到迹（trace） $\mathrm{Tr}_{L/K}(\alpha) = \sum_{\sigma \in G} \sigma(\alpha)$ ，乘起来得到范数（norm） $\mathrm{N}_{L/K}(\alpha) = \prod_{\sigma \in G} \sigma(\alpha)$ 。因为群作用只是把求和/求积的顺序打乱，结果纹丝不动，所以迹和范数自动掉进固定域 $$K$$ 里。拿 $\mathbb{Q}(\sqrt{2})$ 试一下： $\alpha = 3 + 5\sqrt{2}$ ， $\sigma(\alpha) = 3 - 5\sqrt{2}$ 。迹是 $$6$$ ，范数是 $$9 - 50 = -41$$ ，全是有理数。这不是巧合，而是群作用强行“榨干”了无理部分。固定域的本质，就是收集所有被这种对称化操作保护下来的量。

群拿到了，怎么用它反推域的结构？这里有一个极其漂亮的“反向字典”。

L^H = \{\alpha \in L : \sigma(\alpha) = \alpha \text{ 对所有 } \sigma \in H\}.

这句话的意思是， $$L^H$$ 专门收集那些在 $$H$$ 里所有映射折腾下都“岿然不动”的元素，它们自己刚好能拼成 $$L$$ 的一个子域，叫作 $$H$$ 的固定域（fixed field）。

固定域一定包含 $$K$$ ，因为 $$K$$ 里的元素被整个 $$G$$ 固定，自然也被子群 $$H$$ 固定。于是我们手里有了两张地图，可以来回翻译：

$\Phi$ ：子群 $\to$ 中间域， $H \mapsto L^H$ 。
$\Psi$ ：中间域 $\to$ 子群， $M \mapsto \mathrm{Gal}(L/M)$ 。

L/K \text{ 有限 Galois} \implies \Phi, \Psi \text{ 是互逆、序反向的双射。}

这句话的意思是，子群和中间域是一一对应的，但方向是反的：子群越大，施加的“不动”约束越多，能幸存下来的元素就越少，固定域就越小。符号写出来就是 $H_1 \leq H_2 \implies L^{H_1} \supseteq L^{H_2}$ 。第一次见这个“序反向”的人都会愣一下，但想通“约束越多，地盘越小”就极其自然。

$$[L : L^H] = |H|.$$

[L^H : K] = [\mathrm{Gal}(L/K) : H].

这句话的意思是，从地基 $$K$$ 往上走到固定域 $$L^H$$ 的次数，刚好等于子群 $$H$$ 在全群里的指数（陪集个数）。把两式相乘，直接得到 $|\mathrm{Gal}(L/K)| = [L:K]$ ，完美闭环。

对应关系的证明靠在两块基石上：

Artin 引理（Artin’s Lemma）：如果 $$G$$ 是 $$L$$ 的有限自同构群，则 $$[L : L^G] = |G|$$ 。 $[L : L^G] = |G| \text{ 说明任何有限群作用在域上，都能把该域变成其固定域的 Galois 扩张。}$ 这句话的意思是，群作用不是被动观察，它能主动“生成”域扩张结构。
Galois 定理：如果 $$L/K$$ 有限 Galois，则 $L^{\mathrm{Gal}(L/K)} = K$ 。 $L^{\mathrm{Gal}(L/K)} = K \text{ 说明 } K \text{ 之外的任何元素，都至少会被某个自同构挪动。}$ 这句话的意思是，自同构的“视力”极好，没有任何非基域元素能躲过所有对称变换的审查。

把两块石头拼起来：从 Galois 扩张出发，全群的固定域是 $$K$$ ；对任意子群 $$H$$ 用 Artin 引理，得到 $$[L:L^H]=|H|$$ 。双射的齿轮就此咬合。

为什么这很重要？ 这是把域论难题翻译成群论计算的跨海大桥。想知道 $$K$$ 和 $$L$$ 之间藏了多少个中间域？去数 $\mathrm{Gal}(L/K)$ 的子群。想知道哪些中间域自己也是 Galois 扩张？去挑正规子群。域里需要硬算元素关系的问题，在群这边全变成了画格子、数指数的组合游戏。

L^{H_1 \cap H_2} = M_1 \cdot M_2.

L^{\langle H_1, H_2 \rangle} = M_1 \cap M_2.

这句话的意思是，两个子群生成的更大子群对应的固定域，是原来两个域的交集，因为约束变多了，幸存元素自然变少。子群格上的交与并，完美反转为子域格上的并与交。内化这一点后，画任何具体扩张的子域图，都变成纯粹的群论填空题。

\sigma \in \mathrm{Gal}(L/K) \text{ 在每个中间域上作用平凡} \implies \sigma = \mathrm{id}.

这句话的意思是，如果一个自同构在所有子域上都装死，那它在整个大域上也只能是恒等映射，子域格加上群作用已经榨干了扩张的全部信息。

Galois 理论基本定理#

把前面的齿轮全部组装起来，就得到整个理论的核心引擎。

设 $$L/K$$ 是有限 Galois 扩张，Galois 群为 $G = \mathrm{Gal}(L/K)$ 。则：

$H \leftrightarrow M \text{ 是一一对应且方向相反的，子群越大，对应的中间域越小。}$
$\text{扩张次数被精准拆分成子群阶数与指数，群的大小直接量出了域的厚度。}$
$M/K \text{ 正规} \iff \mathrm{Gal}(L/M) \trianglelefteq G, \text{ 且商群正好是下层扩张的 Galois 群。}$

第三部分是整条定理最锋利的地方。“正规”这个词在域和群两边同时出现，但初学时总觉得是巧合。其实根本不是。域那边的“正规”指“某个多项式的分裂域”，群那边的“正规”指“对共轭封闭（ $gHg^{-1}=H$ ）”。定理说这是一回事。

为什么不是所有子群都正规？ 直觉在于“对称性是否均匀”。想象一个长方形和一个正方形。正方形的旋转对称群是正规的，因为你从哪个角度切入，旋转操作都彼此兼容；但长方形的某些翻转操作就不正规，因为“先翻转再旋转”和“先旋转再翻转”会落到不同的状态上。在群论里，正规意味着子群的结构在整体群的“视角切换”（共轭）下保持不变。如果子群不正规，说明它在某些共轭操作下会“歪掉”，对应的中间域也就无法在基域上保持对称（不是分裂域）。

\text{限制映射良定义，因为正规性保证 } \sigma(L^H) = L^H \text{，元素不会跑出固定域。}

G/H \cong \mathrm{Gal}(L^H/K) \text{ 说明把大群模掉固定子群，剩下的商群完美描述了底层域的对称性。}

\sigma(M) \subseteq M \implies \sigma(M) = M \text{，说明 } M \text{ 在所有自同构下整体稳定。}

限制映射 $G \to \mathrm{Aut}_K(M)$ 良定义，核是 $\mathrm{Gal}(L/M)$ ，核自动正规。

“在 $\sigma$ 下稳定”这一步值得多看两眼。设 $M = K(\alpha_1, \ldots, \alpha_r)$ 是 $f \in K[x]$ 的分裂域。 $\sigma$ 固定 $$f$$ 的系数，所以必然把根 $\alpha_i$ 送到另一个根 $\alpha_j$ 。其他根本来就在 $$M$$ 里，所以 $\sigma(\alpha_i) \in M$ 。生成元跑不出 $$M$$ ，整个域就跑不出 $$M$$ 。维数一卡， $\sigma(M)=M$ 。限制映射顺理成章。

基本定理是 Galois 理论里所有具体计算的发动机。想找 $$L$$ 的子域？画 $$G$$ 的子群格，两张图一模一样。想知道哪个子域是 Galois 的？在子群格上圈出正规子群。整个问题从“必须死算元素”的域论，平移到了“可以画图数格子”的群论。

FTGT 还有三个极其实用的结构红利，值得单列：

数中间域： $$L$$ 里包含 $$K$$ 的子域个数 $$=$$ $$G$$ 的子群个数。 $G \cong S_3$ 有 6 个子群，所以有 6 个中间域。 $G \cong (\mathbb{Z}/p)^n$ 时，子域个数等于有限向量空间的子空间个数，直接套高斯二项式系数。 $\#\{\text{中间域}\} = \#\{\text{子群}\} \text{，域的结构复杂度被群的组合结构完全接管。}$
找 Galois 闭包：包含给定 $M \subseteq L$ 的最小 Galois 扩张，对应 $$G$$ 中包含 $\mathrm{Gal}(L/M)$ 的最大正规子群（正规核）。当你手里只有一个非 Galois 扩张却硬要做 Galois 理论时，这招能一键补全缺失的对称性。 $\text{Galois 闭包} \leftrightarrow \text{正规核} \text{，补全域的过程等价于在群里找最大的正规碎片。}$
商群耦合：只要 $H \trianglelefteq G$ ，商群 $$G/H$$ 就会在 $$L^H$$ 上诱导一个作用，这个作用就是 $\mathrm{Gal}(L^H/K)$ 。大群的计算经常被拆成“算 $$H$$ ”和“算 $$G/H$$ ”两步，分而治之。 $\mathrm{Gal}(L^H/K) \cong G/H \text{，高层对称性模掉底层对称性，刚好露出中间层的对称结构。}$

计算 Galois 群：具体例子#

理论再漂亮，不动手算一遍永远是空中楼阁。我们直接下场地，把几个经典扩张的 Galois 群和对应关系完整扒开。

例子 1： $\mathbb{Q}(\sqrt{2}, \sqrt{3})/\mathbb{Q}$ 的完整对应#

前面已经看出 $G \cong V_4 = \mathbb{Z}/2 \times \mathbb{Z}/2$ 。我们把子群和固定域一对一算清楚。 $$V_4$$ 有 5 个子群，对应 5 个中间域：

$\{e\}$ ：不施加任何约束，固定域是 $L = \mathbb{Q}(\sqrt{2}, \sqrt{3})$ 。次数 $[L:\mathbb{Q}] = 4$ ，匹配 $|G|/|\{e\}| = 4/1 = 4$ 。 $[L:L^{\{e\}}] = 4 = |\{e\}|^{-1}|G| \text{，恒等子群对应最大的域。}$
$\langle \sigma_2 \rangle$ （ $\sigma_2: \sqrt{2} \mapsto -\sqrt{2}, \sqrt{3} \mapsto \sqrt{3}$ ）：只允许 $\sqrt{3}$ 存活。固定域 $\mathbb{Q}(\sqrt{3})$ 。次数 2。 $\sigma_2(a+b\sqrt{2}+c\sqrt{3}+d\sqrt{6}) = a-b\sqrt{2}+c\sqrt{3}-d\sqrt{6} \text{，令其不变推出 } b=d=0。$ 这句话的意思是，把一般元素展开作用一遍，系数对比直接筛出固定域基底。
$\langle \sigma_3 \rangle$ （ $\sigma_3: \sqrt{2} \mapsto \sqrt{2}, \sqrt{3} \mapsto -\sqrt{3}$ ）：固定域 $\mathbb{Q}(\sqrt{2})$ 。次数 2。
$\langle \sigma_2 \sigma_3 \rangle$ （同时翻转 $\sqrt{2}, \sqrt{3}$ ）：注意 $\sqrt{6} = \sqrt{2}\sqrt{3}$ 的符号是 $(-1)\times(-1)=1$ ，不变！固定域 $\mathbb{Q}(\sqrt{6})$ 。次数 2。 $\sigma_2\sigma_3(\sqrt{6}) = (-\sqrt{2})(-\sqrt{3}) = \sqrt{6} \text{，双负得正让乘积意外幸存。}$
$$G$$ ：所有自同构一起上，只有有理数能活下来。固定域 $\mathbb{Q}$ 。次数 1。

五个子群，五个中间域，次数全部严丝合缝。 $$V_4$$ 是交换群，所有子群自动正规，所以每个中间域都是 $\mathbb{Q}$ 的 Galois 扩张。直接验证也很容易： $\mathbb{Q}(\sqrt{2})$ 是 $$x^2-2$$ 的分裂域， $\mathbb{Q}(\sqrt{3})$ 是 $$x^2-3$$ 的分裂域， $\mathbb{Q}(\sqrt{6})$ 是 $$x^2-6$$ 的分裂域。这是最标准的“双二次扩张”。它也解释了为什么 $\sqrt{6}$ 会凭空冒出来：对角自同构同时翻转两个根，乘积的符号抵消， $\sqrt{6}$ 成为新的不变量。这个技巧在代数数论里反复出现，比如 Pell 方程的整数环 $\mathbb{Z}[\sqrt{6}]$ 就干净地嵌在 $\mathbb{Z}[\sqrt{2}, \sqrt{3}]$ 里。

例子 2： $$x^3 - 2$$ 在 $\mathbb{Q}$ 上的分裂域#

G \hookrightarrow S_3 \text{ 且 } |G|=6 \implies G \cong S_3 \text{，群的大小填满了对称群，说明所有置换都合法。}

写出生成元的具体作用：

$\sigma$ （3 阶）： $\sqrt[3]{2} \mapsto \sqrt[3]{2}\omega$ ， $\omega \mapsto \omega$ 。它循环置换三个根 $(\alpha_1 \alpha_2 \alpha_3)$ 。
$\tau$ （2 阶）： $\sqrt[3]{2} \mapsto \sqrt[3]{2}$ ， $\omega \mapsto \omega^2$ （复共轭）。它交换 $\alpha_2, \alpha_3$ ，固定 $\alpha_1$ 。对应置换 $$(23)$$ 。

$$S_3$$ 的子群格非常经典，我们逐个算固定域：

$\{e\}$ → $$L$$ 。
$\langle \tau \rangle$ （固定 $\sqrt[3]{2}$ ）→ $\mathbb{Q}(\sqrt[3]{2})$ 。次数 3。
$\langle \sigma\tau \rangle$ → 固定 $\sqrt[3]{2}\omega^2$ → $\mathbb{Q}(\sqrt[3]{2}\omega^2)$ 。次数 3。
$\langle \sigma^2\tau \rangle$ → 固定 $\sqrt[3]{2}\omega$ → $\mathbb{Q}(\sqrt[3]{2}\omega)$ 。次数 3。 $\text{三个 2 阶子群彼此共轭，对应的三个三次域同构但互不相等。}$ 这句话的意思是，群里的共轭关系完美翻译成了域的“同构嵌入不同位置”现象。
$\langle \sigma \rangle = A_3$ （3 阶循环）：固定 $\omega$ 。因为 $\sigma$ 不动 $\omega$ ，而 $\tau$ 会把 $\omega$ 翻成 $\omega^2$ 。固定域 $\mathbb{Q}(\omega)$ 。次数 2。
$$S_3$$ → $\mathbb{Q}$ 。

H \trianglelefteq G \iff M/K \text{ 是 Galois 扩张，正规性在群和域两侧同步出现或同步消失。}

数值检查 FTGT：取 $\langle \tau \rangle$ ，阶 2，固定域次数 $$6/2=3$$ ，匹配。取 $$A_3$$ ，阶 3，固定域次数 $$6/3=2$$ ，匹配。数字本身很平凡，震撼的是 $$S_3$$ 的每一个子群都在域那边有一个专属的“影子域”，一一对应，绝无错漏。

例子 3： $$x^4 - 2$$ 在 $\mathbb{Q}$ 上的分裂域#

设 $L = \mathbb{Q}(\sqrt[4]{2}, i)$ 。 $[L:\mathbb{Q}] = 8$ 。四个根是 $\pm\sqrt[4]{2}, \pm i\sqrt[4]{2}$ 。生成元：

$$r$$ （4 阶）： $\sqrt[4]{2} \mapsto i\sqrt[4]{2}$ ， $i \mapsto i$ 。循环四个根。
$$s$$ （2 阶）： $\sqrt[4]{2} \mapsto \sqrt[4]{2}$ ， $i \mapsto -i$ 。复共轭。关系式： $$r^4 = s^2 = 1$$ ， $srs = r^{-1}$ 。 $G \cong D_4 \text{，八阶二面体群，正是正方形的对称群。}$ 这句话的意思是，四个根在复平面上刚好构成正方形，Galois 群就是旋转和翻转正方形的所有操作。

\text{群论共轭类} \leftrightarrow \text{域的同构嵌入类，FTGT 连“长得一样但位置不同”的域都能精准分类。}

每次看到这个对应我都觉得极其舒适：Galois 对应不只是匹配集合，它连结构的“对称等价类”都一并翻译了。

例子 4：分圆域（Cyclotomic Fields）#

\mathrm{Gal}(\mathbb{Q}(\zeta_n)/\mathbb{Q}) \cong (\mathbb{Z}/n\mathbb{Z})^\times.

这句话的意思是，分圆扩张的 Galois 群同构于模 $$n$$ 的乘法单位群，结构完全由数论决定。同构映射把 $\sigma$ 送到唯一的 $a \in (\mathbb{Z}/n)^\times$ ，满足 $\sigma(\zeta_n) = \zeta_n^a$ 。证明核心是两点：(i) $\Phi_n$ 在 $\mathbb{Q}$ 上不可约（Gauss 定理）；(ii) $\varphi(n)$ 个本原根正好是 $\zeta_n^a$ （ $\gcd(a,n)=1$ ），每个自同构就是选一个合法的 $$a$$ 。

\mathbb{Q} \text{ 的每个有限 Abel 扩张都包含在某个分圆域里。}

这句话的意思是，分圆域是 $\mathbb{Q}$ 上所有交换对称性的“万能容器”，类域论（class field theory）的雏形就在这里。

\zeta_8 + \zeta_8^{-1} = \sqrt{2}.

这句话的意思是，左边是分圆域元素在复共轭下的迹（trace），自动掉进指数 2 的固定域 $\mathbb{Q}(\sqrt{2})$ 里。

例子 5：有限域（Finite Fields）#

\mathrm{Gal}(\mathbb{F}_{p^n}/\mathbb{F}_p) = \langle \mathrm{Frob}_p \rangle \cong \mathbb{Z}/n\mathbb{Z}, \quad \mathrm{Frob}_p(x) = x^p.

x \mapsto x^p \text{ 保持加法和乘法，且不动 } \mathbb{F}_p \text{，是有限域世界里唯一且最强的对称操作。}

为什么算 Galois 群不是纸上谈兵？ 它是代数数论和现代密码学的算法底座。判断多项式根能否闭式表达、计算类数、构造互反律、椭圆曲线密码学，底层全在跑 Galois 群计算。任何计算机代数系统（SageMath, PARI/GP）的数域模块，本质都是一个披着因式分解外衣的 Galois 群计算器。

实战技巧三条：

对 $\mathbb{Q}[x]$ 里 $$n$$ 次不可约多项式，Galois 群是 $$S_n$$ 的传递子群。 $$S_4$$ 有 5 个， $$S_5$$ 有 5 个， $$S_6$$ 有 16 个。用 polgalois 或 galois_group() 一键识别。 $\text{传递性保证群能把任意根送到任意根，对应多项式不可约。}$
模 $$p$$ 分解模式暴露 Frobenius 的循环结构。Chebotarev 密度定理保证，跑遍素数 $$p$$ ，群里的每种循环型都会按正确比例出现。因式分解 $f \bmod p$ 是猜 Galois 群的最强启发式。 $f \bmod p \text{ 的不可约因子次数} = \mathrm{Frob}_p \text{ 在 } \mathrm{Gal}(f) \text{ 中的轮换长度。}$
判别式 $\mathrm{disc}(f)$ 是 $\mathbb{Q}$ 中的平方 $\iff \mathrm{Gal}(f) \subseteq A_n$ 。看判别式直接砍掉一半候选群。 $\sqrt{\mathrm{disc}(f)} \text{ 在奇置换下变号，平方性正好检测群是否全为偶置换。}$

根式可解性与可解群#

现在回到那个折磨了数学家三百年的原始问题：这个多项式到底能不能用根号解出来？ Galois 的绝杀在于，他把“能不能开根号”翻译成了“群能不能一层层剥开”。

K = K_0 \subseteq K_1 \subseteq \cdots \subseteq K_r

K_{i+1} = K_i(\sqrt[n_i]{a_i}) \text{，且 } f \text{ 的分裂域包含在 } K_r \text{ 中。}

这句话的意思是，你可以从基域出发，通过有限次“添加 $$n$$ 次根”的操作，最终把多项式的所有根都装进来。换句话说：只用 $+,-,\times,\div$ 和 $\sqrt[n]{\cdot}$ ，你能写出根的表达式。

\{e\} = G_0 \trianglelefteq G_1 \trianglelefteq \cdots \trianglelefteq G_n = G

G_{i+1}/G_i \text{ 是 Abel 群。}

这句话的意思是，复杂的群可以像剥洋葱一样一层层拆开，每一层剥下来的“商”都是交换群，也就是结构最简单、最听话的那类群。

为了把“根式塔”和“可解链”真正焊死，我们亲手算一层最典型的根式扩张（radical extension）。假设基域 $$K$$ 已经包含了 $$n$$ 次单位根 $\zeta_n$ （比如 $K=\mathbb{C}$ 或适当扩域），我们添加一个 $$n$$ 次根 $\alpha = \sqrt[n]{a}$ 得到 $L = K(\alpha)$ 。 $$L/K$$ 的 Galois 群长什么样？任何 $\sigma \in \mathrm{Gal}(L/K)$ 必须把 $\alpha$ 送到 $$x^n - a$$ 的另一个根上，也就是 $\zeta_n^k \alpha$ 。所以 $\sigma$ 完全由指数 $k \in \mathbb{Z}/n\mathbb{Z}$ 决定。复合两个自同构 $\sigma_k \circ \sigma_m$ 作用在 $\alpha$ 上： $\sigma_k(\zeta_n^m \alpha) = \zeta_n^m \sigma_k(\alpha) = \zeta_n^m \zeta_n^k \alpha = \zeta_n^{k+m} \alpha$ 。指数直接相加！这说明 $\mathrm{Gal}(L/K)$ 同构于加法群 $\mathbb{Z}/n\mathbb{Z}$ ，是绝对的交换群（Abelian group）。现在回头看可解群的定义 $G_{i+1}/G_i$ 是 Abel 群，它翻译回域语言就是：每一层扩张 $K_{i+1}/K_i$ 的对称群都是交换的。开根号之所以能“解”方程，正是因为根号扩张的对称性足够简单（循环/交换），允许我们把高维的纠缠一层层拆解成低维的线性叠加。当对称群复杂到像 $$A_5$$ 那样没有正规子群可切时，这根“拆解链条”就断了，根号也就无能为力了。

为什么叫“可解”？因为历史上人们解方程就是一层层降次：二次配方、三次卡丹公式、四次费拉里法，每一步都在做根式扩张，而根式扩张对应的 Galois 群商恰好是交换的（循环群）。可解群的定义就是把这个操作流程抽象成了纯群论语言。

哪些群可解？

所有 Abel 群（链长 1）。
所有阶 $$<60$$ 的群。
$$S_n$$ 对 $n \leq 4$ 。 $$S_3$$ 有 $\{e\} \trianglelefteq A_3 \trianglelefteq S_3$ ，商是 $\mathbb{Z}/3, \mathbb{Z}/2$ 。 $$S_4$$ 有 $\{e\} \trianglelefteq V_4 \trianglelefteq A_4 \trianglelefteq S_4$ ，商是 $V_4, \mathbb{Z}/3, \mathbb{Z}/2$ 。全交换。 $S_4 \text{ 的可解链解释了为什么四次方程还有求根公式，对称性还没复杂到失控。}$
所有 $$p$$ -群（中心非平凡，归纳即得）。

n \geq 5 \implies A_n \text{ 是单群（simple group）且非 Abel。}

这句话的意思是， $$A_5$$ 就像一块实心的铁球，你找不到任何非平凡的正规子群把它切开。既然切不开，就没法构造出交换商，可解链在第一步就彻底断裂。

f \in \mathbb{Q}[x] \text{ 根式可解} \iff \mathrm{Gal}(f/\mathbb{Q}) \text{ 是可解群。}

这句话的意思是，“能不能用根号写出来”的代数难题，被精准等价成了“对应的对称群能不能一层层剥成交换群”的结构问题。

$$f(x) = x^5 - 4x + 2.$$

验证步骤完整走一遍：

不可约：用 Eisenstein 准则（素数 $$p=2$$ 整除 $$-4, 2$$ ，不整除首项 $$1$$ ， $$2^2=4$$ 不整除常数项 $$2$$ ）。 $$f$$ 在 $\mathbb{Q}$ 上不可约。 $\text{不可约} \implies \mathrm{Gal}(f) \text{ 在 5 个根上作用是传递的。}$
实根个数：求导 $$f'(x) = 5x^4 - 4$$ 。令导数为 0 得 $x = \pm \sqrt[4]{4/5} \approx \pm 0.945$ 。代入原函数算极值： $$f(-0.945) > 0$$ ， $$f(0.945) < 0$$ 。函数图像穿 x 轴三次。所以 $$f$$ 有 3 个实根，2 个共轭复根。 $\text{复共轭置换恰好交换那 2 个复根，在 } S_5 \text{ 中是一个对换（transposition）。}$
群生成：传递子群包含一个 5-循环（由不可约性保证 Frobenius 元素或 Cauchy 定理）和一个对换。在 $$S_5$$ 里，一个 5-循环加一个对换直接生成整个 $$S_5$$ 。 $\langle (12345), (ij) \rangle = S_5 \implies \mathrm{Gal}(f) \cong S_5.$ 这句话的意思是，多项式的具体分析直接锁定了最大可能的对称群，没有任何缩小余地。
结论： $$S_5$$ 不可解 $\implies x^5 - 4x + 2 = 0$ 没有根式求根公式。

“五次方程没有求根公式”从来不是一句模糊的哲学感叹，而是写在纸上的某一个具体方程 $$x^5 - 4x + 2 = 0$$ 绝对无法用根号表达。Abel 在 1824 年证明了不可解性，Galois 在 1832 年把它重写成了群的陈述。这是数学史上最早、也最漂亮的“把计算问题翻译成结构问题”的范例。对称性太复杂，公式就写不出来。结构决定命运。

一般五次方程的不可解性#

Abel-Ruffini 定理的现代证明只需把前面几节的工具串起来。一般五次方程 $$f(x) = x^5 + a_4 x^4 + a_3 x^3 + a_2 x^2 + a_1 x + a_0$$ 把系数当作不定元，构造分裂域 $L = \mathbb{Q}(a_0, \dots, a_4)(\alpha_1, \dots, \alpha_5)$ ，其中 $\alpha_i$ 是 $$f$$ 的根。基本对称多项式定理告诉我们 $\mathbb{Q}(a_0, \dots, a_4) = \mathbb{Q}(e_1, \dots, e_5)^{S_5} \subseteq \mathbb{Q}(\alpha_1, \dots, \alpha_5)$ ，置换根的所有方式都给出自同构，所以 $\mathrm{Gal}(L/K) \cong S_5$ 。

剩下的是纯群论： $$S_5$$ 不可解。证明很短： $$S_5$$ 的换位子群是 $$A_5$$ ，而 $$A_5$$ 单且非阿贝尔（60 阶最小非阿贝尔单群），所以 $$A_5$$ 自身的换位子是 $$A_5$$ ，导出列卡死在 $$A_5$$ 不下降， $$S_5$$ 不可解。配合上一节的根式可解性 $\Leftrightarrow$ Galois 群可解，一般五次方程没有根式解。

我希望你注意一个细节：这是“一般”五次方程不可解，不是“所有”五次方程不可解。 $$x^5 - 1 = 0$$ 当然可解（分圆扩张，循环群）， $$x^5 - 32 = 0$$ 也可解（根号 32 显然就是 2）。Galois 理论给出的是个体诊断：把具体方程的 Galois 群算出来，看可解不可解。这种“先算群再判结构”的思路，是后面整个抽象代数的工作模式。计算一个具体的 $f \in \mathbb{Q}[x]$ 的 Galois 群是 $$S_5$$ 还是更小的群，本身是个有意思的问题——存在算法（用 resolvent 多项式），但实操起来很复杂。

深入：Galois 理论里的具体计算#

把 $\mathbb{Q}(\sqrt{2}, \sqrt{3})$ 的 Galois 群从头算到尾，这是理解整个理论最干净的入口。第一步定 $L = \mathbb{Q}(\sqrt{2}, \sqrt{3})$ ，由前一篇 $[L : \mathbb{Q}] = 4$ ，基底 $\{1, \sqrt{2}, \sqrt{3}, \sqrt{6}\}$ 。

第二步识别自同构。任一 $\sigma \in \mathrm{Gal}(L/\mathbb{Q})$ 必须固定 $\mathbb{Q}$ ，并把根映到根。 $\sqrt{2}$ 满足 $$x^2 - 2$$ ，根是 $\pm\sqrt{2}$ ，所以 $\sigma(\sqrt{2}) \in \{\sqrt{2}, -\sqrt{2}\}$ 。同理 $\sigma(\sqrt{3}) \in \{\sqrt{3}, -\sqrt{3}\}$ 。两个独立的二选一给出至多 4 个自同构。

第三步验证这 4 个组合都是合法自同构。定义 $\sigma_{\epsilon_1, \epsilon_2}(\sqrt{2}) = \epsilon_1\sqrt{2}$ 、 $\sigma_{\epsilon_1, \epsilon_2}(\sqrt{3}) = \epsilon_2\sqrt{3}$ ， $\epsilon_i \in \{+1, -1\}$ 。逐个验证乘法封闭： $\sigma(\sqrt{6}) = \sigma(\sqrt{2})\sigma(\sqrt{3}) = \epsilon_1 \epsilon_2 \sqrt{6}$ ，自动一致。所以 $|\mathrm{Gal}(L/\mathbb{Q})| = 4$ 。

第四步定群结构。任意 $\sigma$ 满足 $\sigma^2 = \mathrm{id}$ （两次 $\pm$ 翻转回原值），且 $\sigma_{-1,1} \circ \sigma_{1,-1} = \sigma_{-1,-1} = \sigma_{1,-1} \circ \sigma_{-1,1}$ （交换）。所以 $\mathrm{Gal}(L/\mathbb{Q}) \cong \mathbb{Z}/2 \times \mathbb{Z}/2$ ，Klein 四元群 $$V_4$$ 。

第五步用 Galois 对应读子域。三个 2 阶子群 $\langle\sigma_{-1,1}\rangle$ 、 $\langle\sigma_{1,-1}\rangle$ 、 $\langle\sigma_{-1,-1}\rangle$ 分别固定 $\mathbb{Q}(\sqrt{3})$ 、 $\mathbb{Q}(\sqrt{2})$ 、 $\mathbb{Q}(\sqrt{6})$ 。三个中间域恰好是 $$L$$ 和 $\mathbb{Q}$ 之间所有可能。这就是“群子格 $\Leftrightarrow$ 子域格”的完美样本。

初学者常见陷阱#

第一个坑：以为任何域扩张都有 Galois 群可算。Galois 理论只对 Galois 扩张（正规 + 可分）成立。 $\mathbb{Q}(\sqrt[3]{2})/\mathbb{Q}$ 不是 Galois 扩张——它包含 $\sqrt[3]{2}$ 但不包含其他两个复数根，正规性失败。自同构群只有 $\{e\}$ （恒等），但扩张次数是 3，自同构群完全没法描述这个扩张。要补全得加 $\zeta_3$ ，扩到 $\mathbb{Q}(\sqrt[3]{2}, \zeta_3)$ ，6 阶 $$S_3$$ Galois 群才浮现。

第二个坑：把 Galois 对应的反向关系忘了。子群越大，对应的固定域越小。 $\{e\}$ 对应整个 $$L$$ ，全群 $$G$$ 对应基域 $$K$$ 。这跟“包含关系”的直觉相反，初学时容易写反。

第三个坑：以为正规扩张和正规子群是一回事。中间域 $$F$$ 对应正规子群 $H \trianglelefteq G$ 当且仅当 $$F/K$$ 是正规扩张——这是基本定理的关键内容，不是定义。这句话的方向必须背熟：正规子群 $\Leftrightarrow$ 中间域是正规扩张 $\Leftrightarrow$ 中间域对应的 Galois 群是商群 $$G/H$$ 。三件事一起记。

这些概念在哪里冒头#

Galois 理论是数论的发动机。代数数域 $K/\mathbb{Q}$ 的 Galois 群直接控制素数在 $\mathcal{O}_K$ 中的分裂方式（Frobenius 元素、Chebotarev 密度定理）。类域论本质上是阿贝尔扩张的 Galois 群和理想类群之间的对偶。Langlands 纲领把数域 Galois 群表示和自守表示对应起来——Fermat 大定理就是 $\mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q})$ 在椭圆曲线 Tate 模上的作用和某个模形式对应的特例。

物理学里，规范理论的对称性用李群描述，但有限对称的部分（如晶体的点群、分子的对称群）依然用群作用语言。计算机代数系统（Sage、Magma、PARI）实现了 Galois 群算法，能自动判定一个多项式的可解性。在密码学的某些代数攻击里，攻击者会试图在某个有限域扩张里找零点，本质就是在分裂域里搜索。

我希望你带走的东西#

一句话总结这一篇：Galois 理论是把多项式的对称性翻译成群结构的字典。多项式的根之间满足什么代数关系，决定了 Galois 群的结构；Galois 群的结构反过来决定了哪些中间域存在、根能不能用根号写出来、几何作图能不能完成。

第二件事，是养成“先算 Galois 群”的直觉。看到一个具体扩张，不要直接想次数，先问“是不是 Galois 扩张？群是什么？”；这两步定下来，所有性质都被锁死。第三件事，记住根式可解性的等价： $$f$$ 根式可解 $\Leftrightarrow$ Galois 群可解。这条等价把代数史上三百年的“求根公式”问题压缩成一个群论判定。

最后一点：Galois 对应不只是一个定理，是一种思维模式。每当你看到“两个看起来无关的结构之间有完美一一对应”——比如代数拓扑里覆盖空间和基本群的子群、代数几何里仿射簇和坐标环的根理想——背后都是“某种 Galois 对应”的同构母题在重复。下一篇模理论里，你会再次遇到这种对应感：模子结构和环理想结构之间的相互翻译。

补充例子#

下面把 $$x^4 - 2$$ 在 $\mathbb{Q}$ 上的 Galois 群算法走一遍，作为 $$V_4$$ 例子的进阶版。 $$f(x) = x^4 - 2$$ 的根是 $\sqrt[4]{2}, i\sqrt[4]{2}, -\sqrt[4]{2}, -i\sqrt[4]{2}$ ，分裂域 $L = \mathbb{Q}(\sqrt[4]{2}, i)$ 。次数 $[L:\mathbb{Q}] = [\mathbb{Q}(\sqrt[4]{2}):\mathbb{Q}] \cdot [\mathbb{Q}(\sqrt[4]{2}, i) : \mathbb{Q}(\sqrt[4]{2})] = 4 \cdot 2 = 8$ 。

自同构由 $\sqrt[4]{2} \mapsto i^k \sqrt[4]{2}$ （ $$k = 0,1,2,3$$ ）和 $i \mapsto \pm i$ 两个独立选择决定，共 8 个。设 $\sigma$ 是 $\sqrt[4]{2} \mapsto i\sqrt[4]{2}, i \mapsto i$ （4 阶旋转）， $\tau$ 是 $\sqrt[4]{2} \mapsto \sqrt[4]{2}, i \mapsto -i$ （共轭，2 阶）。验证 $\tau\sigma\tau^{-1} = \sigma^{-1}$ （共轭把 $i\sqrt[4]{2}$ 翻成 $-i\sqrt[4]{2}$ ，即 $\sigma^{-1}$ 的作用），所以 $\sigma$ 和 $\tau$ 满足二面体关系。 $\mathrm{Gal}(L/\mathbb{Q}) \cong D_4$ 。

$$D_4$$ 有 10 个子群（含平凡和全群），对应 10 个中间域，包括 $\mathbb{Q}(i)$ 、 $\mathbb{Q}(\sqrt{2})$ 、 $\mathbb{Q}(\sqrt{-2})$ 、 $\mathbb{Q}(\sqrt[4]{2})$ 、 $\mathbb{Q}(i\sqrt[4]{2})$ 等等。具体子群格画出来是个金字塔，很值得自己手画一遍——画完一次，Galois 对应就再也忘不掉了。

下一步#

Galois 理论把“多项式有没有根式解”换成了“它的 Galois 群是不是可解”，把“求出所有中间域”换成了“列出 Galois 群的子群格”，把“三等分角、化圆为方”换成了“扩张次数能不能凑出 $$2^k$$ ”。它用对称性这把手术刀，把三百年的代数难题解剖得清清楚楚。但这只是抽象代数结构观的起点。下一篇，我们要走出“系数必须能除”的舒适区，进入模（module）的世界：把向量空间定义里的“域”换成“环”。这个看似只改了一个词的推广，会同时把 Abel 群分类、 $\mathbb{Z}$ -模结构、线性算子的 Jordan 标准形、群表示论全部装进同一个框架里。在 Galois 理论里，我们看到群作用在域上；在模理论里，我们会看到环作用在 Abel 群上。“作用”这条线索将贯穿始终。当你发现矩阵对角化和整数分解其实是同一套语言的不同方言时，抽象代数的第二层大门就真正打开了。准备好纸笔，我们下一篇见。

抽象代数（八）：Galois 理论 —— 域与群之间的桥梁

Galois 群：固定基域的自同构#

固定域和 Galois 对应#

Galois 理论基本定理#

计算 Galois 群：具体例子#