
抽象代数(八):Galois 理论 —— 域与群之间的桥梁
Galois 理论的基本定理建立了中间域和子群之间的完美对应关系,并解决了古老的根式可解性问题。
1832 年 5 月 29 日的深夜,巴黎的一间阁楼里,20 岁的 Évariste Galois 知道自己活不过明天。决斗的约定已经写下,对手是当时法国枪法最好的军官之一。在蜡烛快要燃尽的时候,他没有写遗书,而是抓起一叠草稿纸,疯狂地把自己脑子里关于多项式根的所有想法往外倒。他在页边匆匆写下“我没有时间了”,然后把这叠纸寄给了朋友。这些手稿在抽屉里躺了十几年才被数学界真正读懂,但它们彻底改写了代数的走向。
我第一次读到这段历史时,心里冒出的第一个问题不是“他证明了什么”,而是“他到底在躲什么”。为什么一个研究多项式求根的人,会突然抛开根的具体数值,跑去研究一堆抽象的置换?后来我自己推导了几次才猛然醒悟:Galois 根本不是在做计算,他是在做“对称性普查”。他意识到,死磕根的数值是一条死胡同,但如果你把目光从“根等于几”转移到“根之间有哪些代数关系”,整个问题就会从一团乱麻变成一张清晰的地图。这就是 Galois 理论(Galois theory)的核心直觉:不要盯着数字看,去盯着数字背后的对称结构看。
这篇文章是我自学这段内容时的完整复盘。我会先问“为什么需要这个概念”,再用日常类比铺路,最后才给出正式定义。每一个公式后面,我都会紧跟一句大白话解释。如果你曾经被“正规子群(normal subgroup)”或“Galois 对应(Galois correspondence)”这些词绕晕过,这篇就是为你写的。

Galois 群:固定基域的自同构#

我们先从一个最朴素的困惑开始。假设你有一个域扩张(field extension)$L/K$ ,比如把有理数域 $\mathbb{Q}$ 扩大成 $\mathbb{Q}(\sqrt{2})$ 。在这个更大的域里,多了很多新元素。如果我们想研究这个扩张的“内部结构”,最直接的办法是什么?不是去列元素清单,而是去找那些“保持结构不变的变换”。在域的世界里,这种变换叫自同构(automorphism)。
但这里有个关键限制:我们只关心那些不动基域 $K$ 的自同构。为什么?因为 $K$ 是我们的“地基”,地基要是跟着一起动,我们就失去了参照系。正式写出来就是:
$$\mathrm{Gal}(L/K) = \mathrm{Aut}_K(L) = \{\sigma : L \to L \mid \sigma \text{ 是一个域自同构},\ \sigma|_K = \mathrm{id}\}.$$这句话的意思是,Galois 群(Galois group)专门收集那些把 $K$ 里每个数原封不动留下,只在上层域 $L$ 里做“合法洗牌”的映射,并且这些映射复合起来刚好构成一个群。
这个定义的威力在哪里?在于它自动抓住了多项式的根。假设 $f(x) \in K[x]$ 是一个系数全在 $K$ 里的多项式,$\alpha \in L$ 是它的一个根。如果你把群里的任意一个映射 $\sigma$ 作用在等式 $f(\alpha)=0$ 两边,会发生什么?
$$0 = \sigma(0) = \sigma(f(\alpha)) = f(\sigma(\alpha)).$$因为 $\sigma$ 不动 $f$ 的系数,它只能把根 $\alpha$ 挪到另一个根的位置,等式依然成立。这句话翻译成人话就是:Galois 群里的每一个操作,都必然把多项式的根置换成另一个根,绝不可能把根变成非根。
这就引出了群作用(group action)的直觉。想象你在玩一个三阶魔方。群作用就像你转动魔方的某一面:色块的位置变了,但魔方“每个面九宫格、颜色互斥”的底层规则纹丝不动。Galois 群作用在多项式的根上,逻辑完全一样:根的位置被置换,但它们满足的代数方程和运算关系绝对不破裂。当 $L$ 恰好是 $f$ 的分裂域(splitting field)时,这种作用是忠实的(faithful)——只要你知道了 $\sigma$ 怎么置换根,你就知道了 $\sigma$ 在整个域 $L$ 上怎么作用,没有任何盲区。

这句话的意思是,两个共轭元素相乘会消掉无理部分,结果自动落回 $\mathbb{Q}$ ,这正是 Galois 不变量的典型构造。
$$\sigma(\sqrt{2}) = \pm\sqrt{2}, \quad \sigma(\sqrt{3}) = \pm\sqrt{3}.$$ $$|\mathrm{Gal}(L/\mathbb{Q})| = 4 = [L:\mathbb{Q}].$$这句话的意思是,自同构的个数刚好等于域扩张的次数,这是 Galois 扩张(Galois extension)的标志性特征。
$$\sigma(\sqrt[3]{2}) \in L \cap \{\text{roots of } x^3-2\} = \{\sqrt[3]{2}\}.$$ $$|\mathrm{Gal}(\mathbb{Q}(\sqrt[3]{2})/\mathbb{Q})| = 1 \neq 3 = [\mathbb{Q}(\sqrt[3]{2}):\mathbb{Q}].$$这句话的意思是,自同构个数严格小于扩张次数,因为扩张“漏掉”了另外两个复根,破坏了正规性(normality)。
这就是上一篇可分性与正规性铺垫的伏笔:等式 $|\mathrm{Gal}(L/K)| = [L:K]$ 只在 Galois 扩张里成立。$\mathbb{Q}(\sqrt[3]{2})/\mathbb{Q}$ 不是分裂域,群直接坍缩了。
$$L/K \text{ 是有限 Galois 扩张} \iff |\mathrm{Gal}(L/K)| = [L:K].$$这句话的意思是,你可以用“数自同构个数”这种纯操作性的办法,来检验一个扩张是不是 Galois 的,两边完全等价。
这个等价命题的两半都极其好用。正向:数出自同构个数等于次数,立刻断定是 Galois 扩张。反向:已知是 Galois 扩张,如果你只找到了 $[L:K]$ 个自同构,就可以停手了,绝对没有漏网之鱼。它也和“可分+正规”的抽象定义严丝合缝:可分保证最多有 $[L:K]$ 个嵌入,正规保证这些嵌入全部落回 $L$ 内部,加起来就是恰好 $[L:K]$ 个自同构。“嵌入数等于次数”只是 $|\mathrm{Gal}(L/K)| = [L:K]$ 的另一种说法。
Galois 群虽然是个有限的小群,但它把整个域扩张的骨架全抽出来了。群论已经积累了两百年的结构定理(Sylow 定理、单群分类、表示论),Galois 理论等于开了一条隧道,把这些现成的武器全部搬进多项式求根的问题里。我们在第 7 篇搭的所有脚手架,就是为了换这张门票。
$$\mathrm{Gal}(f) = \{\pi \in S_n \mid \pi \text{ 尊重根之间的所有代数关系}\}.$$这句话的意思是,不是所有根的排列都合法,只有那些不破坏根之间加减乘除恒等式的排列,才能升级成域自同构。 “尊重代数关系”这个条件是整个定义的命门。如果没有它,任何置换都合法,Galois 群永远是 $S_n$ ,理论就废了。有些置换之所以不能扩张成域自同构,正是因为它们会撕碎某些隐藏的代数等式。你在计算群的时候,利用的正是这些“被撕碎的等式”。
$$\zeta_8^3 = \zeta_8 \cdot \zeta_8^2 = \zeta_8 \cdot i, \quad \zeta_8 + \zeta_8^7 = \sqrt{2}.$$ $$|\mathrm{Gal}(x^4+1)| = 4 \ll 24 = 4!.$$这句话的意思是,代数关系像滤网一样筛掉了 20 个非法置换,剩下的 4 个才是真正合法的 Galois 群。

固定域和 Galois 对应#

在正式翻开固定域的字典之前,我想先补一个极其接地气的直觉:为什么“不动点”能拼成一个域?你可以把自同构想象成一面镜子。如果你手里拿着一个不对称的物件(比如 $\sqrt{2}$ ),照镜子它会变成 $-\sqrt{2}$ ;但如果你把物件和它的镜像绑在一起(比如算和 $\sqrt{2} + (-\sqrt{2}) = 0$ ,或者算积 $\sqrt{2} \cdot (-\sqrt{2}) = -2$ ),结果就彻底对称了,镜子再也照不出区别。在代数里,这叫“对称化操作”。随便取 $L$ 里的一个元素 $\alpha$ ,把它在所有 $\sigma \in G$ 作用下的像加起来得到迹(trace)$\mathrm{Tr}_{L/K}(\alpha) = \sum_{\sigma \in G} \sigma(\alpha)$ ,乘起来得到范数(norm)$\mathrm{N}_{L/K}(\alpha) = \prod_{\sigma \in G} \sigma(\alpha)$ 。因为群作用只是把求和/求积的顺序打乱,结果纹丝不动,所以迹和范数自动掉进固定域 $K$ 里。拿 $\mathbb{Q}(\sqrt{2})$ 试一下:$\alpha = 3 + 5\sqrt{2}$ ,$\sigma(\alpha) = 3 - 5\sqrt{2}$ 。迹是 $6$ ,范数是 $9 - 50 = -41$ ,全是有理数。这不是巧合,而是群作用强行“榨干”了无理部分。固定域的本质,就是收集所有被这种对称化操作保护下来的量。
群拿到了,怎么用它反推域的结构?这里有一个极其漂亮的“反向字典”。
$$L^H = \{\alpha \in L : \sigma(\alpha) = \alpha \text{ 对所有 } \sigma \in H\}.$$这句话的意思是,$L^H$ 专门收集那些在 $H$ 里所有映射折腾下都“岿然不动”的元素,它们自己刚好能拼成 $L$ 的一个子域,叫作 $H$ 的固定域(fixed field)。
固定域一定包含 $K$ ,因为 $K$ 里的元素被整个 $G$ 固定,自然也被子群 $H$ 固定。于是我们手里有了两张地图,可以来回翻译:
- $\Phi$ :子群 $\to$ 中间域,$H \mapsto L^H$ 。
- $\Psi$ :中间域 $\to$ 子群,$M \mapsto \mathrm{Gal}(L/M)$ 。
这句话的意思是,子群和中间域是一一对应的,但方向是反的:子群越大,施加的“不动”约束越多,能幸存下来的元素就越少,固定域就越小。 符号写出来就是 $H_1 \leq H_2 \implies L^{H_1} \supseteq L^{H_2}$ 。第一次见这个“序反向”的人都会愣一下,但想通“约束越多,地盘越小”就极其自然。
$$[L : L^H] = |H|.$$ $$[L^H : K] = [\mathrm{Gal}(L/K) : H].$$这句话的意思是,从地基 $K$ 往上走到固定域 $L^H$ 的次数,刚好等于子群 $H$ 在全群里的指数(陪集个数)。 把两式相乘,直接得到 $|\mathrm{Gal}(L/K)| = [L:K]$ ,完美闭环。
对应关系的证明靠在两块基石上:
- Artin 引理(Artin’s Lemma):如果 $G$ 是 $L$ 的有限自同构群,则 $[L : L^G] = |G|$ 。 $[L : L^G] = |G| \text{ 说明任何有限群作用在域上,都能把该域变成其固定域的 Galois 扩张。}$ 这句话的意思是,群作用不是被动观察,它能主动“生成”域扩张结构。
- Galois 定理:如果 $L/K$ 有限 Galois,则 $L^{\mathrm{Gal}(L/K)} = K$ 。 $L^{\mathrm{Gal}(L/K)} = K \text{ 说明 } K \text{ 之外的任何元素,都至少会被某个自同构挪动。}$ 这句话的意思是,自同构的“视力”极好,没有任何非基域元素能躲过所有对称变换的审查。
把两块石头拼起来:从 Galois 扩张出发,全群的固定域是 $K$ ;对任意子群 $H$ 用 Artin 引理,得到 $[L:L^H]=|H|$ 。双射的齿轮就此咬合。
为什么这很重要? 这是把域论难题翻译成群论计算的跨海大桥。想知道 $K$ 和 $L$ 之间藏了多少个中间域?去数 $\mathrm{Gal}(L/K)$ 的子群。想知道哪些中间域自己也是 Galois 扩张?去挑正规子群。域里需要硬算元素关系的问题,在群这边全变成了画格子、数指数的组合游戏。
$$L^{H_1 \cap H_2} = M_1 \cdot M_2.$$ $$L^{\langle H_1, H_2 \rangle} = M_1 \cap M_2.$$这句话的意思是,两个子群生成的更大子群对应的固定域,是原来两个域的交集,因为约束变多了,幸存元素自然变少。 子群格上的交与并,完美反转为子域格上的并与交。内化这一点后,画任何具体扩张的子域图,都变成纯粹的群论填空题。
$$\sigma \in \mathrm{Gal}(L/K) \text{ 在每个中间域上作用平凡} \implies \sigma = \mathrm{id}.$$这句话的意思是,如果一个自同构在所有子域上都装死,那它在整个大域上也只能是恒等映射,子域格加上群作用已经榨干了扩张的全部信息。

Galois 理论基本定理#
把前面的齿轮全部组装起来,就得到整个理论的核心引擎。
设 $L/K$ 是有限 Galois 扩张,Galois 群为 $G = \mathrm{Gal}(L/K)$ 。则:
- $$H \leftrightarrow M \text{ 是一一对应且方向相反的,子群越大,对应的中间域越小。}$$
- $$\text{扩张次数被精准拆分成子群阶数与指数,群的大小直接量出了域的厚度。}$$
- $$M/K \text{ 正规} \iff \mathrm{Gal}(L/M) \trianglelefteq G, \text{ 且商群正好是下层扩张的 Galois 群。}$$
第三部分是整条定理最锋利的地方。“正规”这个词在域和群两边同时出现,但初学时总觉得是巧合。其实根本不是。域那边的“正规”指“某个多项式的分裂域”,群那边的“正规”指“对共轭封闭($gHg^{-1}=H$ )”。定理说这是一回事。
为什么不是所有子群都正规? 直觉在于“对称性是否均匀”。想象一个长方形和一个正方形。正方形的旋转对称群是正规的,因为你从哪个角度切入,旋转操作都彼此兼容;但长方形的某些翻转操作就不正规,因为“先翻转再旋转”和“先旋转再翻转”会落到不同的状态上。在群论里,正规意味着子群的结构在整体群的“视角切换”(共轭)下保持不变。如果子群不正规,说明它在某些共轭操作下会“歪掉”,对应的中间域也就无法在基域上保持对称(不是分裂域)。

限制映射 $G \to \mathrm{Aut}_K(M)$ 良定义,核是 $\mathrm{Gal}(L/M)$ ,核自动正规。
“在 $\sigma$ 下稳定”这一步值得多看两眼。设 $M = K(\alpha_1, \ldots, \alpha_r)$ 是 $f \in K[x]$ 的分裂域。$\sigma$ 固定 $f$ 的系数,所以必然把根 $\alpha_i$ 送到另一个根 $\alpha_j$ 。其他根本来就在 $M$ 里,所以 $\sigma(\alpha_i) \in M$ 。生成元跑不出 $M$ ,整个域就跑不出 $M$ 。维数一卡,$\sigma(M)=M$ 。限制映射顺理成章。
基本定理是 Galois 理论里所有具体计算的发动机。想找 $L$ 的子域?画 $G$ 的子群格,两张图一模一样。想知道哪个子域是 Galois 的?在子群格上圈出正规子群。整个问题从“必须死算元素”的域论,平移到了“可以画图数格子”的群论。
FTGT 还有三个极其实用的结构红利,值得单列:
- 数中间域:$L$ 里包含 $K$ 的子域个数 $=$ $G$ 的子群个数。$G \cong S_3$ 有 6 个子群,所以有 6 个中间域。$G \cong (\mathbb{Z}/p)^n$ 时,子域个数等于有限向量空间的子空间个数,直接套高斯二项式系数。 $\#\{\text{中间域}\} = \#\{\text{子群}\} \text{,域的结构复杂度被群的组合结构完全接管。}$
- 找 Galois 闭包:包含给定 $M \subseteq L$ 的最小 Galois 扩张,对应 $G$ 中包含 $\mathrm{Gal}(L/M)$ 的最大正规子群(正规核)。当你手里只有一个非 Galois 扩张却硬要做 Galois 理论时,这招能一键补全缺失的对称性。 $\text{Galois 闭包} \leftrightarrow \text{正规核} \text{,补全域的过程等价于在群里找最大的正规碎片。}$
- 商群耦合:只要 $H \trianglelefteq G$ ,商群 $G/H$ 就会在 $L^H$ 上诱导一个作用,这个作用就是 $\mathrm{Gal}(L^H/K)$ 。大群的计算经常被拆成“算 $H$ ”和“算 $G/H$ ”两步,分而治之。 $\mathrm{Gal}(L^H/K) \cong G/H \text{,高层对称性模掉底层对称性,刚好露出中间层的对称结构。}$
计算 Galois 群:具体例子#
理论再漂亮,不动手算一遍永远是空中楼阁。我们直接下场地,把几个经典扩张的 Galois 群和对应关系完整扒开。
例子 1:$\mathbb{Q}(\sqrt{2}, \sqrt{3})/\mathbb{Q}$ 的完整对应#
前面已经看出 $G \cong V_4 = \mathbb{Z}/2 \times \mathbb{Z}/2$ 。我们把子群和固定域一对一算清楚。 $V_4$ 有 5 个子群,对应 5 个中间域:
- $\{e\}$ :不施加任何约束,固定域是 $L = \mathbb{Q}(\sqrt{2}, \sqrt{3})$ 。次数 $[L:\mathbb{Q}] = 4$ ,匹配 $|G|/|\{e\}| = 4/1 = 4$ 。 $[L:L^{\{e\}}] = 4 = |\{e\}|^{-1}|G| \text{,恒等子群对应最大的域。}$
- $\langle \sigma_2 \rangle$ ($\sigma_2: \sqrt{2} \mapsto -\sqrt{2}, \sqrt{3} \mapsto \sqrt{3}$ ):只允许 $\sqrt{3}$ 存活。固定域 $\mathbb{Q}(\sqrt{3})$ 。次数 2。 $\sigma_2(a+b\sqrt{2}+c\sqrt{3}+d\sqrt{6}) = a-b\sqrt{2}+c\sqrt{3}-d\sqrt{6} \text{,令其不变推出 } b=d=0。$ 这句话的意思是,把一般元素展开作用一遍,系数对比直接筛出固定域基底。
- $\langle \sigma_3 \rangle$ ($\sigma_3: \sqrt{2} \mapsto \sqrt{2}, \sqrt{3} \mapsto -\sqrt{3}$ ):固定域 $\mathbb{Q}(\sqrt{2})$ 。次数 2。
- $\langle \sigma_2 \sigma_3 \rangle$ (同时翻转 $\sqrt{2}, \sqrt{3}$ ):注意 $\sqrt{6} = \sqrt{2}\sqrt{3}$ 的符号是 $(-1)\times(-1)=1$ ,不变!固定域 $\mathbb{Q}(\sqrt{6})$ 。次数 2。 $\sigma_2\sigma_3(\sqrt{6}) = (-\sqrt{2})(-\sqrt{3}) = \sqrt{6} \text{,双负得正让乘积意外幸存。}$
- $G$ :所有自同构一起上,只有有理数能活下来。固定域 $\mathbb{Q}$ 。次数 1。
五个子群,五个中间域,次数全部严丝合缝。$V_4$ 是交换群,所有子群自动正规,所以每个中间域都是 $\mathbb{Q}$ 的 Galois 扩张。直接验证也很容易:$\mathbb{Q}(\sqrt{2})$ 是 $x^2-2$ 的分裂域,$\mathbb{Q}(\sqrt{3})$ 是 $x^2-3$ 的分裂域,$\mathbb{Q}(\sqrt{6})$ 是 $x^2-6$ 的分裂域。 这是最标准的“双二次扩张”。它也解释了为什么 $\sqrt{6}$ 会凭空冒出来:对角自同构同时翻转两个根,乘积的符号抵消,$\sqrt{6}$ 成为新的不变量。这个技巧在代数数论里反复出现,比如 Pell 方程的整数环 $\mathbb{Z}[\sqrt{6}]$ 就干净地嵌在 $\mathbb{Z}[\sqrt{2}, \sqrt{3}]$ 里。
例子 2:$x^3 - 2$ 在 $\mathbb{Q}$ 上的分裂域#
$$G \hookrightarrow S_3 \text{ 且 } |G|=6 \implies G \cong S_3 \text{,群的大小填满了对称群,说明所有置换都合法。}$$写出生成元的具体作用:
- $\sigma$ (3 阶):$\sqrt[3]{2} \mapsto \sqrt[3]{2}\omega$ ,$\omega \mapsto \omega$ 。它循环置换三个根 $(\alpha_1 \alpha_2 \alpha_3)$ 。
- $\tau$ (2 阶):$\sqrt[3]{2} \mapsto \sqrt[3]{2}$ ,$\omega \mapsto \omega^2$ (复共轭)。它交换 $\alpha_2, \alpha_3$ ,固定 $\alpha_1$ 。对应置换 $(23)$ 。
$S_3$ 的子群格非常经典,我们逐个算固定域:
- $\{e\}$ → $L$ 。
- $\langle \tau \rangle$ (固定 $\sqrt[3]{2}$ )→ $\mathbb{Q}(\sqrt[3]{2})$ 。次数 3。
- $\langle \sigma\tau \rangle$ → 固定 $\sqrt[3]{2}\omega^2$ → $\mathbb{Q}(\sqrt[3]{2}\omega^2)$ 。次数 3。
- $\langle \sigma^2\tau \rangle$ → 固定 $\sqrt[3]{2}\omega$ → $\mathbb{Q}(\sqrt[3]{2}\omega)$ 。次数 3。 $\text{三个 2 阶子群彼此共轭,对应的三个三次域同构但互不相等。}$ 这句话的意思是,群里的共轭关系完美翻译成了域的“同构嵌入不同位置”现象。
- $\langle \sigma \rangle = A_3$ (3 阶循环):固定 $\omega$ 。因为 $\sigma$ 不动 $\omega$ ,而 $\tau$ 会把 $\omega$ 翻成 $\omega^2$ 。固定域 $\mathbb{Q}(\omega)$ 。次数 2。
- $S_3$ → $\mathbb{Q}$ 。
数值检查 FTGT:取 $\langle \tau \rangle$ ,阶 2,固定域次数 $6/2=3$ ,匹配。取 $A_3$ ,阶 3,固定域次数 $6/3=2$ ,匹配。数字本身很平凡,震撼的是 $S_3$ 的每一个子群都在域那边有一个专属的“影子域”,一一对应,绝无错漏。
例子 3:$x^4 - 2$ 在 $\mathbb{Q}$ 上的分裂域#
设 $L = \mathbb{Q}(\sqrt[4]{2}, i)$ 。$[L:\mathbb{Q}] = 8$ 。四个根是 $\pm\sqrt[4]{2}, \pm i\sqrt[4]{2}$ 。 生成元:
- $r$ (4 阶):$\sqrt[4]{2} \mapsto i\sqrt[4]{2}$ ,$i \mapsto i$ 。循环四个根。
- $s$ (2 阶):$\sqrt[4]{2} \mapsto \sqrt[4]{2}$ ,$i \mapsto -i$ 。复共轭。 关系式:$r^4 = s^2 = 1$ ,$srs = r^{-1}$ 。 $G \cong D_4 \text{,八阶二面体群,正是正方形的对称群。}$ 这句话的意思是,四个根在复平面上刚好构成正方形,Galois 群就是旋转和翻转正方形的所有操作。

每次看到这个对应我都觉得极其舒适:Galois 对应不只是匹配集合,它连结构的“对称等价类”都一并翻译了。
例子 4:分圆域(Cyclotomic Fields)#
$$\mathrm{Gal}(\mathbb{Q}(\zeta_n)/\mathbb{Q}) \cong (\mathbb{Z}/n\mathbb{Z})^\times.$$这句话的意思是,分圆扩张的 Galois 群同构于模 $n$ 的乘法单位群,结构完全由数论决定。 同构映射把 $\sigma$ 送到唯一的 $a \in (\mathbb{Z}/n)^\times$ ,满足 $\sigma(\zeta_n) = \zeta_n^a$ 。证明核心是两点:(i) $\Phi_n$ 在 $\mathbb{Q}$ 上不可约(Gauss 定理);(ii) $\varphi(n)$ 个本原根正好是 $\zeta_n^a$ ($\gcd(a,n)=1$ ),每个自同构就是选一个合法的 $a$ 。

这句话的意思是,分圆域是 $\mathbb{Q}$ 上所有交换对称性的“万能容器”,类域论(class field theory)的雏形就在这里。
$$\zeta_8 + \zeta_8^{-1} = \sqrt{2}.$$这句话的意思是,左边是分圆域元素在复共轭下的迹(trace),自动掉进指数 2 的固定域 $\mathbb{Q}(\sqrt{2})$ 里。
例子 5:有限域(Finite Fields)#
$$\mathrm{Gal}(\mathbb{F}_{p^n}/\mathbb{F}_p) = \langle \mathrm{Frob}_p \rangle \cong \mathbb{Z}/n\mathbb{Z}, \quad \mathrm{Frob}_p(x) = x^p.$$ $$x \mapsto x^p \text{ 保持加法和乘法,且不动 } \mathbb{F}_p \text{,是有限域世界里唯一且最强的对称操作。}$$为什么算 Galois 群不是纸上谈兵? 它是代数数论和现代密码学的算法底座。判断多项式根能否闭式表达、计算类数、构造互反律、椭圆曲线密码学,底层全在跑 Galois 群计算。任何计算机代数系统(SageMath, PARI/GP)的数域模块,本质都是一个披着因式分解外衣的 Galois 群计算器。
实战技巧三条:
- 对 $\mathbb{Q}[x]$
里 $n$
次不可约多项式,Galois 群是 $S_n$
的传递子群。$S_4$
有 5 个,$S_5$
有 5 个,$S_6$
有 16 个。用
polgalois或galois_group()一键识别。 $\text{传递性保证群能把任意根送到任意根,对应多项式不可约。}$ - 模 $p$ 分解模式暴露 Frobenius 的循环结构。Chebotarev 密度定理保证,跑遍素数 $p$ ,群里的每种循环型都会按正确比例出现。因式分解 $f \bmod p$ 是猜 Galois 群的最强启发式。 $f \bmod p \text{ 的不可约因子次数} = \mathrm{Frob}_p \text{ 在 } \mathrm{Gal}(f) \text{ 中的轮换长度。}$
- 判别式 $\mathrm{disc}(f)$ 是 $\mathbb{Q}$ 中的平方 $\iff \mathrm{Gal}(f) \subseteq A_n$ 。看判别式直接砍掉一半候选群。 $\sqrt{\mathrm{disc}(f)} \text{ 在奇置换下变号,平方性正好检测群是否全为偶置换。}$
根式可解性与可解群#
现在回到那个折磨了数学家三百年的原始问题:这个多项式到底能不能用根号解出来? Galois 的绝杀在于,他把“能不能开根号”翻译成了“群能不能一层层剥开”。
$$K = K_0 \subseteq K_1 \subseteq \cdots \subseteq K_r$$ $$K_{i+1} = K_i(\sqrt[n_i]{a_i}) \text{,且 } f \text{ 的分裂域包含在 } K_r \text{ 中。}$$这句话的意思是,你可以从基域出发,通过有限次“添加 $n$ 次根”的操作,最终把多项式的所有根都装进来。 换句话说:只用 $+,-,\times,\div$ 和 $\sqrt[n]{\cdot}$ ,你能写出根的表达式。
$$\{e\} = G_0 \trianglelefteq G_1 \trianglelefteq \cdots \trianglelefteq G_n = G$$ $$G_{i+1}/G_i \text{ 是 Abel 群。}$$这句话的意思是,复杂的群可以像剥洋葱一样一层层拆开,每一层剥下来的“商”都是交换群,也就是结构最简单、最听话的那类群。

为了把“根式塔”和“可解链”真正焊死,我们亲手算一层最典型的根式扩张(radical extension)。假设基域 $K$ 已经包含了 $n$ 次单位根 $\zeta_n$ (比如 $K=\mathbb{C}$ 或适当扩域),我们添加一个 $n$ 次根 $\alpha = \sqrt[n]{a}$ 得到 $L = K(\alpha)$ 。$L/K$ 的 Galois 群长什么样?任何 $\sigma \in \mathrm{Gal}(L/K)$ 必须把 $\alpha$ 送到 $x^n - a$ 的另一个根上,也就是 $\zeta_n^k \alpha$ 。所以 $\sigma$ 完全由指数 $k \in \mathbb{Z}/n\mathbb{Z}$ 决定。复合两个自同构 $\sigma_k \circ \sigma_m$ 作用在 $\alpha$ 上:$\sigma_k(\zeta_n^m \alpha) = \zeta_n^m \sigma_k(\alpha) = \zeta_n^m \zeta_n^k \alpha = \zeta_n^{k+m} \alpha$ 。指数直接相加!这说明 $\mathrm{Gal}(L/K)$ 同构于加法群 $\mathbb{Z}/n\mathbb{Z}$ ,是绝对的交换群(Abelian group)。现在回头看可解群的定义 $G_{i+1}/G_i$ 是 Abel 群,它翻译回域语言就是:每一层扩张 $K_{i+1}/K_i$ 的对称群都是交换的。开根号之所以能“解”方程,正是因为根号扩张的对称性足够简单(循环/交换),允许我们把高维的纠缠一层层拆解成低维的线性叠加。当对称群复杂到像 $A_5$ 那样没有正规子群可切时,这根“拆解链条”就断了,根号也就无能为力了。
为什么叫“可解”?因为历史上人们解方程就是一层层降次:二次配方、三次卡丹公式、四次费拉里法,每一步都在做根式扩张,而根式扩张对应的 Galois 群商恰好是交换的(循环群)。可解群的定义就是把这个操作流程抽象成了纯群论语言。
哪些群可解?
- 所有 Abel 群(链长 1)。
- 所有阶 $<60$ 的群。
- $S_n$ 对 $n \leq 4$ 。$S_3$ 有 $\{e\} \trianglelefteq A_3 \trianglelefteq S_3$ ,商是 $\mathbb{Z}/3, \mathbb{Z}/2$ 。$S_4$ 有 $\{e\} \trianglelefteq V_4 \trianglelefteq A_4 \trianglelefteq S_4$ ,商是 $V_4, \mathbb{Z}/3, \mathbb{Z}/2$ 。全交换。 $S_4 \text{ 的可解链解释了为什么四次方程还有求根公式,对称性还没复杂到失控。}$
- 所有 $p$ -群(中心非平凡,归纳即得)。
这句话的意思是,$A_5$ 就像一块实心的铁球,你找不到任何非平凡的正规子群把它切开。既然切不开,就没法构造出交换商,可解链在第一步就彻底断裂。
$$f \in \mathbb{Q}[x] \text{ 根式可解} \iff \mathrm{Gal}(f/\mathbb{Q}) \text{ 是可解群。}$$这句话的意思是,“能不能用根号写出来”的代数难题,被精准等价成了“对应的对称群能不能一层层剥成交换群”的结构问题。

验证步骤完整走一遍:
- 不可约:用 Eisenstein 准则(素数 $p=2$ 整除 $-4, 2$ ,不整除首项 $1$ ,$2^2=4$ 不整除常数项 $2$ )。$f$ 在 $\mathbb{Q}$ 上不可约。 $\text{不可约} \implies \mathrm{Gal}(f) \text{ 在 5 个根上作用是传递的。}$
- 实根个数:求导 $f'(x) = 5x^4 - 4$ 。令导数为 0 得 $x = \pm \sqrt[4]{4/5} \approx \pm 0.945$ 。代入原函数算极值:$f(-0.945) > 0$ ,$f(0.945) < 0$ 。函数图像穿 x 轴三次。所以 $f$ 有 3 个实根,2 个共轭复根。 $\text{复共轭置换恰好交换那 2 个复根,在 } S_5 \text{ 中是一个对换(transposition)。}$
- 群生成:传递子群包含一个 5-循环(由不可约性保证 Frobenius 元素或 Cauchy 定理)和一个对换。在 $S_5$ 里,一个 5-循环加一个对换直接生成整个 $S_5$ 。 $\langle (12345), (ij) \rangle = S_5 \implies \mathrm{Gal}(f) \cong S_5.$ 这句话的意思是,多项式的具体分析直接锁定了最大可能的对称群,没有任何缩小余地。
- 结论:$S_5$ 不可解 $\implies x^5 - 4x + 2 = 0$ 没有根式求根公式。

“五次方程没有求根公式”从来不是一句模糊的哲学感叹,而是写在纸上的某一个具体方程 $x^5 - 4x + 2 = 0$ 绝对无法用根号表达。Abel 在 1824 年证明了不可解性,Galois 在 1832 年把它重写成了群的陈述。这是数学史上最早、也最漂亮的“把计算问题翻译成结构问题”的范例。对称性太复杂,公式就写不出来。结构决定命运。

一般五次方程的不可解性#
Abel-Ruffini 定理的现代证明只需把前面几节的工具串起来。一般五次方程 $f(x) = x^5 + a_4 x^4 + a_3 x^3 + a_2 x^2 + a_1 x + a_0$ 把系数当作不定元,构造分裂域 $L = \mathbb{Q}(a_0, \dots, a_4)(\alpha_1, \dots, \alpha_5)$ ,其中 $\alpha_i$ 是 $f$ 的根。基本对称多项式定理告诉我们 $\mathbb{Q}(a_0, \dots, a_4) = \mathbb{Q}(e_1, \dots, e_5)^{S_5} \subseteq \mathbb{Q}(\alpha_1, \dots, \alpha_5)$ ,置换根的所有方式都给出自同构,所以 $\mathrm{Gal}(L/K) \cong S_5$ 。
剩下的是纯群论:$S_5$ 不可解。证明很短:$S_5$ 的换位子群是 $A_5$ ,而 $A_5$ 单且非阿贝尔(60 阶最小非阿贝尔单群),所以 $A_5$ 自身的换位子是 $A_5$ ,导出列卡死在 $A_5$ 不下降,$S_5$ 不可解。配合上一节的根式可解性 $\Leftrightarrow$ Galois 群可解,一般五次方程没有根式解。
我希望你注意一个细节:这是“一般”五次方程不可解,不是“所有”五次方程不可解。$x^5 - 1 = 0$ 当然可解(分圆扩张,循环群),$x^5 - 32 = 0$ 也可解(根号 32 显然就是 2)。Galois 理论给出的是个体诊断:把具体方程的 Galois 群算出来,看可解不可解。这种“先算群再判结构”的思路,是后面整个抽象代数的工作模式。计算一个具体的 $f \in \mathbb{Q}[x]$ 的 Galois 群是 $S_5$ 还是更小的群,本身是个有意思的问题——存在算法(用 resolvent 多项式),但实操起来很复杂。
深入:Galois 理论里的具体计算#
把 $\mathbb{Q}(\sqrt{2}, \sqrt{3})$ 的 Galois 群从头算到尾,这是理解整个理论最干净的入口。第一步定 $L = \mathbb{Q}(\sqrt{2}, \sqrt{3})$ ,由前一篇 $[L : \mathbb{Q}] = 4$ ,基底 $\{1, \sqrt{2}, \sqrt{3}, \sqrt{6}\}$ 。
第二步识别自同构。任一 $\sigma \in \mathrm{Gal}(L/\mathbb{Q})$ 必须固定 $\mathbb{Q}$ ,并把根映到根。$\sqrt{2}$ 满足 $x^2 - 2$ ,根是 $\pm\sqrt{2}$ ,所以 $\sigma(\sqrt{2}) \in \{\sqrt{2}, -\sqrt{2}\}$ 。同理 $\sigma(\sqrt{3}) \in \{\sqrt{3}, -\sqrt{3}\}$ 。两个独立的二选一给出至多 4 个自同构。
第三步验证这 4 个组合都是合法自同构。定义 $\sigma_{\epsilon_1, \epsilon_2}(\sqrt{2}) = \epsilon_1\sqrt{2}$ 、$\sigma_{\epsilon_1, \epsilon_2}(\sqrt{3}) = \epsilon_2\sqrt{3}$ ,$\epsilon_i \in \{+1, -1\}$ 。逐个验证乘法封闭:$\sigma(\sqrt{6}) = \sigma(\sqrt{2})\sigma(\sqrt{3}) = \epsilon_1 \epsilon_2 \sqrt{6}$ ,自动一致。所以 $|\mathrm{Gal}(L/\mathbb{Q})| = 4$ 。
第四步定群结构。任意 $\sigma$ 满足 $\sigma^2 = \mathrm{id}$ (两次 $\pm$ 翻转回原值),且 $\sigma_{-1,1} \circ \sigma_{1,-1} = \sigma_{-1,-1} = \sigma_{1,-1} \circ \sigma_{-1,1}$ (交换)。所以 $\mathrm{Gal}(L/\mathbb{Q}) \cong \mathbb{Z}/2 \times \mathbb{Z}/2$ ,Klein 四元群 $V_4$ 。
第五步用 Galois 对应读子域。三个 2 阶子群 $\langle\sigma_{-1,1}\rangle$ 、$\langle\sigma_{1,-1}\rangle$ 、$\langle\sigma_{-1,-1}\rangle$ 分别固定 $\mathbb{Q}(\sqrt{3})$ 、$\mathbb{Q}(\sqrt{2})$ 、$\mathbb{Q}(\sqrt{6})$ 。三个中间域恰好是 $L$ 和 $\mathbb{Q}$ 之间所有可能。这就是“群子格 $\Leftrightarrow$ 子域格”的完美样本。
初学者常见陷阱#
第一个坑:以为任何域扩张都有 Galois 群可算。Galois 理论只对 Galois 扩张(正规 + 可分)成立。$\mathbb{Q}(\sqrt[3]{2})/\mathbb{Q}$ 不是 Galois 扩张——它包含 $\sqrt[3]{2}$ 但不包含其他两个复数根,正规性失败。自同构群只有 $\{e\}$ (恒等),但扩张次数是 3,自同构群完全没法描述这个扩张。要补全得加 $\zeta_3$ ,扩到 $\mathbb{Q}(\sqrt[3]{2}, \zeta_3)$ ,6 阶 $S_3$ Galois 群才浮现。
第二个坑:把 Galois 对应的反向关系忘了。子群越大,对应的固定域越小。$\{e\}$ 对应整个 $L$ ,全群 $G$ 对应基域 $K$ 。这跟“包含关系”的直觉相反,初学时容易写反。
第三个坑:以为正规扩张和正规子群是一回事。中间域 $F$ 对应正规子群 $H \trianglelefteq G$ 当且仅当 $F/K$ 是正规扩张——这是基本定理的关键内容,不是定义。这句话的方向必须背熟:正规子群 $\Leftrightarrow$ 中间域是正规扩张 $\Leftrightarrow$ 中间域对应的 Galois 群是商群 $G/H$ 。三件事一起记。
这些概念在哪里冒头#
Galois 理论是数论的发动机。代数数域 $K/\mathbb{Q}$ 的 Galois 群直接控制素数在 $\mathcal{O}_K$ 中的分裂方式(Frobenius 元素、Chebotarev 密度定理)。类域论本质上是阿贝尔扩张的 Galois 群和理想类群之间的对偶。Langlands 纲领把数域 Galois 群表示和自守表示对应起来——Fermat 大定理就是 $\mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q})$ 在椭圆曲线 Tate 模上的作用和某个模形式对应的特例。
物理学里,规范理论的对称性用李群描述,但有限对称的部分(如晶体的点群、分子的对称群)依然用群作用语言。计算机代数系统(Sage、Magma、PARI)实现了 Galois 群算法,能自动判定一个多项式的可解性。在密码学的某些代数攻击里,攻击者会试图在某个有限域扩张里找零点,本质就是在分裂域里搜索。
我希望你带走的东西#
一句话总结这一篇:Galois 理论是把多项式的对称性翻译成群结构的字典。多项式的根之间满足什么代数关系,决定了 Galois 群的结构;Galois 群的结构反过来决定了哪些中间域存在、根能不能用根号写出来、几何作图能不能完成。
第二件事,是养成“先算 Galois 群”的直觉。看到一个具体扩张,不要直接想次数,先问“是不是 Galois 扩张?群是什么?”;这两步定下来,所有性质都被锁死。第三件事,记住根式可解性的等价:$f$ 根式可解 $\Leftrightarrow$ Galois 群可解。这条等价把代数史上三百年的“求根公式”问题压缩成一个群论判定。
最后一点:Galois 对应不只是一个定理,是一种思维模式。每当你看到“两个看起来无关的结构之间有完美一一对应”——比如代数拓扑里覆盖空间和基本群的子群、代数几何里仿射簇和坐标环的根理想——背后都是“某种 Galois 对应”的同构母题在重复。下一篇模理论里,你会再次遇到这种对应感:模子结构和环理想结构之间的相互翻译。
补充例子#
下面把 $x^4 - 2$ 在 $\mathbb{Q}$ 上的 Galois 群算法走一遍,作为 $V_4$ 例子的进阶版。$f(x) = x^4 - 2$ 的根是 $\sqrt[4]{2}, i\sqrt[4]{2}, -\sqrt[4]{2}, -i\sqrt[4]{2}$ ,分裂域 $L = \mathbb{Q}(\sqrt[4]{2}, i)$ 。次数 $[L:\mathbb{Q}] = [\mathbb{Q}(\sqrt[4]{2}):\mathbb{Q}] \cdot [\mathbb{Q}(\sqrt[4]{2}, i) : \mathbb{Q}(\sqrt[4]{2})] = 4 \cdot 2 = 8$ 。
自同构由 $\sqrt[4]{2} \mapsto i^k \sqrt[4]{2}$ ($k = 0,1,2,3$ )和 $i \mapsto \pm i$ 两个独立选择决定,共 8 个。设 $\sigma$ 是 $\sqrt[4]{2} \mapsto i\sqrt[4]{2}, i \mapsto i$ (4 阶旋转),$\tau$ 是 $\sqrt[4]{2} \mapsto \sqrt[4]{2}, i \mapsto -i$ (共轭,2 阶)。验证 $\tau\sigma\tau^{-1} = \sigma^{-1}$ (共轭把 $i\sqrt[4]{2}$ 翻成 $-i\sqrt[4]{2}$ ,即 $\sigma^{-1}$ 的作用),所以 $\sigma$ 和 $\tau$ 满足二面体关系。$\mathrm{Gal}(L/\mathbb{Q}) \cong D_4$ 。
$D_4$ 有 10 个子群(含平凡和全群),对应 10 个中间域,包括 $\mathbb{Q}(i)$ 、$\mathbb{Q}(\sqrt{2})$ 、$\mathbb{Q}(\sqrt{-2})$ 、$\mathbb{Q}(\sqrt[4]{2})$ 、$\mathbb{Q}(i\sqrt[4]{2})$ 等等。具体子群格画出来是个金字塔,很值得自己手画一遍——画完一次,Galois 对应就再也忘不掉了。
下一步#
Galois 理论把“多项式有没有根式解”换成了“它的 Galois 群是不是可解”,把“求出所有中间域”换成了“列出 Galois 群的子群格”,把“三等分角、化圆为方”换成了“扩张次数能不能凑出 $2^k$ ”。它用对称性这把手术刀,把三百年的代数难题解剖得清清楚楚。但这只是抽象代数结构观的起点。下一篇,我们要走出“系数必须能除”的舒适区,进入**模(module)**的世界:把向量空间定义里的“域”换成“环”。这个看似只改了一个词的推广,会同时把 Abel 群分类、$\mathbb{Z}$ -模结构、线性算子的 Jordan 标准形、群表示论全部装进同一个框架里。在 Galois 理论里,我们看到群作用在域上;在模理论里,我们会看到环作用在 Abel 群上。“作用”这条线索将贯穿始终。当你发现矩阵对角化和整数分解其实是同一套语言的不同方言时,抽象代数的第二层大门就真正打开了。准备好纸笔,我们下一篇见。
抽象代数 12 篇
- 01 抽象代数(一):群 —— 你与代数结构的初次相遇
- 02 抽象代数(二):群的作用 —— 群如何移动事物
- 03 抽象代数(三):商群与同态 —— 结构压缩的艺术
- 04 抽象代数(四):Sylow 定理 —— 剖析有限群
- 05 抽象代数(五):环与理想 —— 当乘法进入画面
- 06 抽象代数(六):多项式环 —— 因子分解与唯一分解
- 07 抽象代数(七):域扩张 — 构建更大的数系
- 08 抽象代数(八):Galois 理论 —— 域与群之间的桥梁 当前
- 09 抽象代数(九):模——向量空间的推广
- 10 抽象代数(十):表示论 — 群在向量空间上的作用
- 11 抽象代数(十一):范畴论 — 数学结构的语言
- 12 抽象代数(十二):代数在实际应用中的威力 —— 从密码学到编码理论及其他