系列 · 抽象代数 · 第 2 篇

抽象代数(二):群的作用 —— 群如何移动事物

我们形式化了群如何作用于集合,证明了轨道-稳定子定理,推导了 Burnside 引理,并计算了项链的数量。

从抽象群到具体作用#

我第一次碰到“群作用”这个词的时候,脑子里全是乱码。书上冷冰冰地写着 $G \times X \to X$ ,满足两条公理,然后直接跳到轨道和稳定子。我盯着那几行字看了半小时,心里只有一个问题:这到底在干什么?群不是已经定义好了吗,为什么还要让它去“作用”在别的集合上?

直到我拿起桌上的魔方,随手拧了一下右面。

想象在魔方上转一面。你的手指做了一个动作,魔方上的贴纸跟着换了位置,但魔方还是那个魔方。你再做一次动作,贴纸又换了一批位置。如果你把“所有合法的拧动”收集起来,它们就构成一个群;如果你把“所有贴纸的位置”收集起来,它们就构成一个集合。群里的每个元素(一次拧动)都在搬运集合里的元素(贴纸)。这就是群作用(group action)最原始的画面:群是一组动作,集合是这些动作的游乐场。拿起一个对象,执行群里的一个动作,放下它。对象的轨道(orbit)是你能把它带到的所有地方;稳定子(stabilizer)是那些做完之后对象原地不动的动作。

在上一篇文章里,我们定义了群,也证明了 Lagrange 定理。那些群本身——$\mathbb{Z}/n\mathbb{Z}$ , $S_n$ , $D_n$ ——确实很有意思,但我们当时是把它们关在玻璃柜里孤立地看。群论真正的威力,恰恰发生在群“动手做事”的时候:当它置换集合里的元素、旋转多边形的顶点、或者重新排列项链上的颜色时,抽象的符号突然就有了几何和组合的血肉。

历史上,群根本不是作为抽象代数结构被发明的,而是作为“作用于几何对象或多项式根的对称性集合”登场的。Galois 研究的就是作用于多项式根的置换群(permutation group)。Klein 的 Erlangen 纲领(1872年)更狠,他直接提议:几何学本身,就是研究在某个群作用下保持不变的那些性质。到了现代代数,作用的视角已经成了标配。它能把抽象的群论问题翻译成具体的计数问题,也能把复杂的组合对称性还原成干净的代数结构。

这篇文章的核心武器有两个:轨道-稳定子定理(orbit-stabilizer theorem)和 Burnside 引理(Burnside’s lemma)。轨道-稳定子定理把群的大小、轨道的大小、稳定子的大小拴在一条等式上;Burnside 引理则利用这条等式,专门对付“在对称性意义下,到底有多少种本质不同的对象”这类问题。每当你问“旋转或翻转后算同一种,那到底有几种不同的着色方案?”时,答案永远是不动点数量的加权平均。证明过程并不玄乎,只是把轨道-稳定子的齿轮咬合起来转一圈。

我们还会把“共轭”(conjugation)本身看作一种群作用。这会自然导出类方程(class equation),它是后续证明 Sylow 定理时的核心引擎。

一个群作用 G x X 到 X 的箭头图

在往下跳进定义之前,先记住这幅心理图像:群作用不是静态的结构,而是一组动态的搬运规则。别急着背公理,先问自己:如果我把这个群元素按下去,集合里的东西会怎么跑?跑完之后,哪些东西没动?哪些东西被绑在一起了?带着这些问题,形式定义就不再是天书,而是对直觉的精确打包。

形式定义和例子#

为什么非要给“群作用”下个严格的定义?因为直觉虽然好用,但容易越界。我们需要一套规则,确保“先做动作 $h$ 再做动作 $g$ ”和“直接做动作 $gh$ ”效果完全一样,否则群的乘法结构就和集合上的搬运脱节了。

$G$ 是一个群,$X$ 是一个集合。$G$$X$ 上的*(左)群作用*(left group action)是一个函数 $G \times X \to X$ ,记作 $(g, x) \mapsto g \cdot x$ ,满足两条规矩:

  1. 单位元不动:对所有 $x \in X$ ,有 $e \cdot x = x$
  2. 乘法相容:对所有 $g, h \in G$$x \in X$ ,有 $(gh) \cdot x = g \cdot (h \cdot x)$

这句话的意思是:什么都不做(单位元)就等于没碰集合里的任何东西;先后做两个群元素,等价于先把它们的乘积算出来,再一次性作用上去。

我们说 $G$ 作用于 $X$ ,或者 $X$ 是一个 $G$ -集$G$ -set)。

很多初学者会卡在这里:这到底是个函数还是个同态?答案是:两者是一回事。一个群作用完全等价于一个群同态(group homomorphism)$\varphi : G \to \text{Sym}(X)$ ,其中 $\text{Sym}(X)$$X$ 到自身的所有双射构成的对称群(symmetric group)。给定一个作用,你就定义 $\varphi(g)(x) = g \cdot x$ ;相容性公理保证 $\varphi(gh) = \varphi(g) \circ \varphi(h)$ ,单位元公理保证 $\varphi(e) = \text{id}_X$ 。反过来,任何这样的同态也能原封不动地翻译回一个作用。

这句话的意思是:群作用就是把抽象的群元素,一对一或多对一地映射成集合上的具体洗牌动作。

这个同态视角极其重要,因为它直接暴露了作用的“核”(kernel)。$\varphi$ 的核是 $\{g \in G : g \cdot x = x \text{ 对所有 } x \in X\}$ ,也就是那些在 $X$ 的每个点上都假装没动过的群元素。如果 $\ker\varphi = \{e\}$ ,说明只有单位元才会让所有元素原地踏步,我们称这种作用是忠实的(faithful)或有效的(effective)。等价地说,同态 $\varphi : G \to \text{Sym}(X)$ 是单射,$G$ 完整地嵌进了 $\text{Sym}(X)$ 里。

这句话的意思是:忠实作用意味着群里的不同元素在集合上一定会表现出不同的搬运效果,没有任何两个元素“撞脸”。

正则作用:Cayley 定理嵌入

Cayley 定理(Cayley’s theorem)从这里几乎是白送的:每个群都通过左乘作用于自身,而且这个作用一定是忠实的。因此,每个群都同构于某个对称群的子群。具体点说,如果 $|G| = n$ ,那么 $G$ 一定能嵌进 $S_n$

这句话的意思是:任何抽象群,不管它长得多么奇怪,本质上都是一堆置换的集合,只是你可能还没找到正确的标签去标记它们。

顺便提一句右作用(right action)。它是一个映射 $X \times G \to X$ ,记作 $(x, g) \mapsto x \cdot g$ ,满足 $x \cdot e = x$$x \cdot (gh) = (x \cdot g) \cdot h$ 。任何右作用都能通过 $g \cdot x = x \cdot g^{-1}$ 翻成左作用。为了不乱,全文我们只盯左作用。

光看定义容易犯困,我们直接上例子。每个 H2 我都会给足正例和反例,帮你把直觉钉牢。

例子 1:$S_n$ 作用于 $\{1, \ldots, n\}$ 自然作用:$\sigma \cdot i = \sigma(i)$ 。这是忠实的,因为两个不同的置换至少会在一个数字上给出不同的结果。

例子 2:$D_n$ 作用于正 $n$ 边形的顶点。 把顶点标号 $1, \ldots, n$ 。每个对称操作(旋转或反射)都在置换这些顶点。这定义了一个忠实作用 $D_n \to S_n$

例子 3:$G$ 通过左乘作用于自身。 定义 $g \cdot x = gx$$g, x \in G$ )。公理直接由群的结合律和单位元性质保证:$e \cdot x = ex = x$ ,且 $(gh) \cdot x = (gh)x = g(hx) = g \cdot (h \cdot x)$ 。这叫左正则作用(left regular action),它永远忠实。

例子 4:$G$ 通过共轭作用于自身。 定义 $g \cdot x = gxg^{-1}$ 。验证:$e \cdot x = exe^{-1} = x$ ,且 $(gh) \cdot x = (gh)x(gh)^{-1} = g(hxh^{-1})g^{-1} = g \cdot (h \cdot x)$ 。这个作用通常不忠实:$g$ 在整个 $G$ 上作用平凡,当且仅当 $gxg^{-1} = x$ 对所有 $x$ 成立,也就是 $g$ 和所有元素交换,即 $g \in Z(G)$$G$ 的中心(center))。核恰好是 $Z(G)$

例子 5:$G$ 通过共轭作用于自己的子集。 对子集 $S \subseteq G$ ,定义 $g \cdot S = gSg^{-1} = \{gsg^{-1} : s \in S\}$ 。如果 $H \leq G$ 是子群,$g \cdot H = gHg^{-1}$ 依然是子群。这给出了 $G$ 在其所有子群集合上的作用。

例子 6:$G$ 作用于 $H$ 的左陪集(left cosets)。$G/H = \{gH : g \in G\}$ 。定义 $g \cdot (aH) = (ga)H$ 。这是良定义的:如果 $aH = bH$ ,则 $b^{-1}a \in H$ ,于是 $(gb)^{-1}(ga) = b^{-1}a \in H$ ,所以 $(ga)H = (gb)H$ 。这个作用的核是 $\bigcap_{g \in G} gHg^{-1}$ ,也就是藏在 $H$ 里面的最大正规子群(normal subgroup)。

反例 1:平凡作用(trivial action)。 定义 $g \cdot x = x$ 对所有 $g, x$ 。它满足公理,但极度无聊。核是整个 $G$ ,作用完全不忠实。它提醒我们:满足定义不代表有信息量。

反例 2:乱写的“作用”: 假设 $G = \mathbb{Z}/3\mathbb{Z}$$X = \{a, b\}$ 。如果你硬规定 $1 \cdot a = b, 1 \cdot b = a$ ,那么 $2 \cdot a = 1 \cdot (1 \cdot a) = 1 \cdot b = a$ ,但 $3 \cdot a = 0 \cdot a = a$ ,同时 $3 \cdot a = 1 \cdot (2 \cdot a) = 1 \cdot a = b$ 。矛盾!这说明不是随便指定搬运规则都能叫群作用,相容性公理会立刻把不合法的规则踢出去。

数值例子 1:$\mathbb{Z}/4\mathbb{Z}$ 作用于正方形的四个角。 把角标成 $\{0, 1, 2, 3\}$ ,令 $k \cdot i = (i + k) \bmod 4$ 。那么 $1$ 把每个角顺时针挪一步,$2$ 把对角互换,$3$ 逆时针挪一步。$0$ 不动。验证相容性:$(k_1 + k_2) \cdot i = (i + k_1 + k_2) \bmod 4 = k_1 \cdot ((i + k_2) \bmod 4) = k_1 \cdot (k_2 \cdot i)$ 。忠实、可迁,是最干净的循环作用。

数值例子 2:$S_3$ 通过左乘作用于自身的六个元素。 这就是 Cayley 嵌入 $S_3 \hookrightarrow S_6$$S_3$ 的每个元素变成 $S_3$ 六个元素的置换。拿 $(1\ 2) \in S_3$ 举例,它左乘列表 $\{e, (1\ 2), (1\ 3), (2\ 3), (1\ 2\ 3), (1\ 3\ 2)\}$

  • $(1\ 2)e = (1\ 2)$
  • $(1\ 2)(1\ 2) = e$
  • $(1\ 2)(1\ 3) = (1\ 3\ 2)$
  • $(1\ 2)(2\ 3) = (1\ 2\ 3)$
  • $(1\ 2)(1\ 2\ 3) = (2\ 3)$
  • $(1\ 2)(1\ 3\ 2) = (1\ 3)$ 结果是把位置 $1 \leftrightarrow 2$$3 \leftrightarrow 6$$4 \leftrightarrow 5$ 互换。这是一个 $S_6$ 里的置换。对 $S_3$ 全部六个元素做一遍,就得到一个单射同态 $S_3 \to S_6$ 。Cayley 定理在最小非交换群上的现场演示。

结构对应:可迁作用与子群: 在等变同构(equivariant isomorphism)意义下,$G$ 的可迁作用(transitive action)和 $G$ 的子群共轭类一一对应。$G$$G/H$ 上的可迁作用,正好对应 $H$ 的共轭类。这是初等群论里最干净的结构事实之一,也是从“作用思维”切换到“子群思维”的桥梁。下一章讲正规子群时,我们会把这扇门彻底推开。

轨道、稳定子和轨道-稳定子定理#

心理图像先摆好:一个点的轨道是它在群作用下的旅行轨迹——“它能去的所有地方”。稳定子是那些死死按住它不让动的动作集合。这两个概念在精确的数学意义上成反比:轨道越大,能按住它的动作就越少;轨道越小,能按住它的动作就越多。

$G$ 作用于 $X$$x \in X$

  • $x$轨道(orbit)是 $\text{Orb}(x) = G \cdot x = \{g \cdot x : g \in G\}$
  • $x$稳定子(stabilizer)是 $\text{Stab}(x) = G_x = \{g \in G : g \cdot x = x\}$

这句话的意思是:轨道是 $X$ 里的一堆点,稳定子是 $G$ 里的一堆动作。

先确认稳定子确实是个子群(subgroup)。

证明: $e \cdot x = x$ ,所以 $e \in \text{Stab}(x)$ 。如果 $g, h \in \text{Stab}(x)$ ,那么 $h \cdot x = x$ 。两边用 $h^{-1}$ 作用,得到 $h^{-1} \cdot x = x$ 。于是 $(gh^{-1}) \cdot x = g \cdot (h^{-1} \cdot x) = g \cdot x = x$ 。根据子群判定准则,$\text{Stab}(x) \leq G$$\square$

这句话的意思是:能固定 $x$ 的动作,做逆操作或者组合起来,依然能固定 $x$ ,所以它们自己就关起门来成了一个群。

轨道如何将集合 X 分割成不交的块

轨道会把整个集合 $X$ 切成互不相交的块。定义 $x \sim y$ 当且仅当存在 $g \in G$ 使得 $y = g \cdot x$ 。这是一个等价关系(equivalence relation):自反($x = e \cdot x$ ),对称($y = g \cdot x \Rightarrow x = g^{-1} \cdot y$ ),传递($y = g \cdot x, z = h \cdot y \Rightarrow z = (hg) \cdot x$ )。等价类恰好就是轨道。如果整个 $X$ 只有一个轨道,我们说这个作用是可迁的(transitive)。

这句话的意思是:群作用天然地把集合划分成若干个“连通区域”,同一个区域里的点可以互相到达,不同区域里的点老死不相往来。

重头戏来了。

$$|G| = |\text{Orb}(x)| \cdot |\text{Stab}(x)|$$ $$|\text{Orb}(x)| = [G : \text{Stab}(x)] = \frac{|G|}{|\text{Stab}(x)|}$$

这句话的意思是:群的总人数,等于 $x$ 能去的地方数量,乘以能把 $x$ 按在原地的人数。

证明直觉。 我们构造一个双射 $\Phi : G/\text{Stab}(x) \to \text{Orb}(x)$ ,规则是 $\Phi(g \cdot \text{Stab}(x)) = g \cdot x$

  • 良定义:如果 $g \cdot \text{Stab}(x) = h \cdot \text{Stab}(x)$ ,说明 $h^{-1}g \in \text{Stab}(x)$ ,也就是 $h^{-1}g$ 固定 $x$ ,那 $g \cdot x$$h \cdot x$ 当然是同一个点。
  • 满射:轨道里的每个点本来就是某个 $g \cdot x$
  • 单射:如果 $g \cdot x = h \cdot x$ ,推回去就是 $h^{-1}g \in \text{Stab}(x)$ ,说明它们属于同一个陪集。 所以 $|\text{Orb}(x)| = [G : \text{Stab}(x)]$ 。两边乘 $|\text{Stab}(x)|$ ,再用 Lagrange 定理,等式成立。$\square$

这句话的意思是:把群按稳定子切成陪集,每个陪集恰好把 $x$ 搬到轨道里的一个独特位置,不多不少。

轨道-稳定子定理:轨道大小乘以稳定子大小等于群的阶

轨道-稳定子定理是有限群论里几乎所有计数论证的源头。它直接宣告:轨道大小必须是 $|G|$ 的因子。这是一个极其强硬的算术限制,在你动笔算之前,就能把一堆不可能的轨道分解直接枪毙。

例子 1:$D_4$ 作用于正方形顶点。 顶点标 $\{1, 2, 3, 4\}$$D_4$ 阶为 8。取 $x = 1$

  • 轨道:随便一个顶点都能通过旋转从 1 到达,所以 $\text{Orb}(1) = \{1, 2, 3, 4\}$$|\text{Orb}(1)| = 4$
  • 稳定子:单位元固定 1;过顶点 1 的对角线反射也固定 1。其他旋转和反射都会把 1 搬走。所以 $\text{Stab}(1) = \{e, s\}$$|\text{Stab}(1)| = 2$
  • 检查:$|D_4| = 8 = 4 \times 2 = |\text{Orb}(1)| \times |\text{Stab}(1)|$ 。完美咬合。

例子 2:$S_4$ 作用于 $\{1,2,3,4\}$$x=1$

  • 稳定子:$\text{Stab}(1) = \{\sigma \in S_4 : \sigma(1) = 1\}$ 。这些置换只在 $\{2,3,4\}$ 上乱排,所以 $\text{Stab}(1) \cong S_3$ ,阶为 6。
  • 轨道:$S_4$ 可迁,$\text{Orb}(1) = \{1,2,3,4\}$ ,大小为 4。
  • 检查:$24 = 4 \times 6$$\checkmark$

例子 3:立方体旋转群作用于顶点。 立方体 8 个顶点,旋转群 24 个元素。作用可迁,所以 $|\text{Orb}(v)| = 8$ 。由定理,$|\text{Stab}(v)| = 24/8 = 3$ 。具体是哪三个?固定选定顶点的旋转,只能是绕穿过该顶点的体对角线转 0°、120°、240°。正好 3 个。

反例 1:$S_5$ 能可迁地作用于 7 个元素的集合吗? 绝对不能。因为如果可迁,轨道大小就是 7。但轨道-稳定子定理要求轨道大小整除 $|S_5| = 120$$7 \nmid 120$ ,直接否决。连算都不用算。

反例 2:$A_4$ 能可迁地作用于 6 个元素的集合吗? $A_4$ 阶为 12。假设能,稳定子阶必须是 $12/6 = 2$ 。作用会给出同态 $A_4 \to S_6$ ,核是 $A_4$ 的正规子群且藏在稳定子里。$A_4$ 的正规子群只有 $\{e\}, V_4, A_4$ 。阶 $\le 2$ 的只有 $\{e\}$ ,所以作用必须忠实。但 $A_4 \hookrightarrow S_6$ 的像阶为 12,每个点的稳定子大小为 2。直接对照 $A_4$ 的循环结构会发现根本塞不进去。结论:$A_4$ 没有 6 阶子群,也就没有 6 点可迁作用。这再次印证了一个核心事实:$G$$n$ 元集上的可迁作用,等价于 $G$ 里存在指数为 $n$ 的子群。

我再补一个非可迁作用的数值拆解,帮你把“轨道划分”的齿轮彻底咬死。考虑 $G = \{e, (1\ 2), (3\ 4), (1\ 2)(3\ 4)\} \leq S_4$ (同构于 Klein 四元群 $V_4$ ),作用于 $X = \{1, 2, 3, 4, 5\}$ 。前四个数字被正常置换,5 完全没人碰。我们逐点算轨道和稳定子:对 $x=1$$\text{Orb}(1)=\{1,2\}$ ,大小 2;能固定 1 的是 $\{e, (3\ 4)\}$ ,大小 2。$2 \times 2 = 4 = |G|$ 。对 $x=3$$\text{Orb}(3)=\{3,4\}$ ,稳定子 $\{e, (1\ 2)\}$ ,同样 $2 \times 2 = 4$ 。对 $x=5$$\text{Orb}(5)=\{5\}$ ,大小 1;所有群元素都固定它,稳定子就是整个 $G$ ,大小 4。$1 \times 4 = 4$ 。你看,轨道-稳定子定理在每个轨道内部独立成立,而所有轨道大小加起来 $2+2+1=5$ 正好是 $|X|$ 。这种“分块独立验证、全局拼回原集”的结构,正是 Burnside 引理双重计数的底层地基。

例子 4:$S_4$ 作用于 2-子集 $X = \binom{\{1,2,3,4\}}{2}$ $|X| = 6$ 。作用可迁。看 $\{1, 2\}$ 的稳定子:$\sigma$ 必须把集合 $\{1,2\}$ 映到自身,也就是 $\sigma$ 可以在 $\{1,2\}$ 内部互换(2种),也可以在 $\{3,4\}$ 内部互换(2种)。总共 $2 \times 2 = 4$ 个元素。由定理,轨道大小 $= 24/4 = 6$ 。和 $|X|$ 一致。$\checkmark$

立方体的24个旋转对称按轨道类型分类

不动点和Burnside引理#

心理图像:如果你想数“在对称性意义下到底有多少种不同的东西”,别去硬画轨道。去数每个对称动作留下了多少东西没动,然后求平均。这就是 Burnside 引理(Burnside’s lemma)的全部灵魂,外加一点点双重计数的小技巧。

群作用下集合的不动点示意

$$X^g = \text{Fix}(g) = \{x \in X : g \cdot x = x\}$$

这句话的意思是:$X^g$ 就是 $g$ 这个动作拍下去之后,原地没跑的那些元素的集合。

$$|\text{Orbits}| = \frac{1}{|G|} \sum_{g \in G} |X^g|$$

这句话的意思是:本质不同的对象个数,等于所有群元素不动点数量的算术平均值。

用 Burnside 引理计数轨道

证明直觉。 我们数二元组集合 $S = \{(g, x) \in G \times X : g \cdot x = x\}$ 的大小,换两种姿势数。

  • $x$ 数:对每个 $x$ ,能固定它的 $g$$|\text{Stab}(x)|$ 个。所以 $|S| = \sum_{x \in X} |\text{Stab}(x)|$
  • $g$ 数:对每个 $g$ ,被它固定的 $x$$|X^g|$ 个。所以 $|S| = \sum_{g \in G} |X^g|$ 。 由轨道-稳定子定理,$|\text{Stab}(x)| = |G|/|\text{Orb}(x)|$ 。把 $X$ 按轨道 $O_1, \ldots, O_k$ 分组: $\sum_{x \in X} \frac{1}{|\text{Orb}(x)|} = \sum_{i=1}^k \sum_{x \in O_i} \frac{1}{|O_i|} = \sum_{i=1}^k 1 = k$ 这句话的意思是:同一个轨道里的每个点,贡献的倒数权重加起来正好是 1,所有轨道加起来就是轨道总数 $k$ 。 于是 $|S| = |G| \cdot k$ ,移项得到 $k = \frac{1}{|G|} \sum_{g \in G} |X^g|$$\square$

这句话的意思是:把“谁固定了谁”这张大表横着加一遍、竖着加一遍,等式自然就浮出水面了。

Burnside 引理把“数对称性下的不同对象”变成了纯机械的流水线作业:列出群元素,数每个元素的不动点,加起来除以群阶。它从四颗珠子的项链一路通杀到魔方的旋转分类。这也是纯代数里极少数直接进工厂的定理:化学家拿它数分子异构体,计算机科学家拿它数图的同构类,组合学家拿它数铺砌和编码。只要问题长着一副“旋转/翻转/重标号后算同一种”的脸,Burnside 就是第一把手术刀。

反例直觉:为什么不能直接拿总方案数除以 $|G|$ 很多人第一次做着色题会想:总共有 $2^4=16$ 种涂法,旋转群有 4 个元素,那答案不就是 $16/4=4$ 吗?错。因为有些着色方案自带对称性(比如全黑 BBBB),旋转它 4 次都长一样,它只贡献了 1 个轨道,却占了 4 次“不动点”。Burnside 的 averaging 机制自动补偿了这种“过度对称”的方案,直接除法会严重低估。

我把这个“平均补偿”机制拆成一张微型账本,你就彻底明白了。假设 $X$ 只有 4 个着色方案 $\{A, B, C, D\}$ ,群 $G=\{e, g\}$ 阶为 2。$e$ 固定全部 4 个。$g$ 固定 $A$$D$ ,交换 $B \leftrightarrow C$ 。那么 $|X^e|=4$$|X^g|=2$ 。Burnside 给出 $(4+2)/2 = 3$ 个轨道。手动看:$\{A\}$ 是轨道 1(大小 1,稳定子大小 2);$\{D\}$ 是轨道 2(大小 1,稳定子大小 2);$\{B, C\}$ 是轨道 3(大小 2,稳定子大小 1)。注意贡献机制:轨道 1 里的 $A$$e$$g$ 各计 1 次不动点,共贡献 2;轨道 2 同理贡献 2;轨道 3 里的 $B$$C$ 都只被 $e$ 固定,各贡献 1,加起来也是 2。每个轨道对 $\sum |X^g|$ 的总贡献恒等于 $|G|$ !所以总和除以 $|G|$ ,正好就是轨道个数。这不是巧合,是轨道-稳定子定理在求和符号下的必然投影。

例子 1:4 颗珠子、2 种颜色的项链(仅旋转)。 对称群 $C_4 = \{e, r, r^2, r^3\}$ 。总着色数 $|X| = 2^4 = 16$

  • $g = e$ :不动手,16 种全留下。$|X^e| = 16$
  • $g = r$ (转 90°):珠子必须全同色才不动。全黑或全白。$|X^r| = 2$
  • $g = r^2$ (转 180°):1号=3号,2号=4号。两对独立选色。$2 \times 2 = 4$$|X^{r^2}| = 4$
  • $g = r^3$ (转 270°):同 90°,必须全同色。$|X^{r^3}| = 2$ 。 Burnside 计算:$(16 + 2 + 4 + 2) / 4 = 24 / 4 = 6$ 。 这句话的意思是:平均每个旋转动作留下 6 种方案,所以本质不同的项链就是 6 条。 手动核对:BBBB, BBBW, BBWW, BWBW, BWWW, WWWW。正好 6 条。

例子 2:加上翻转($D_4$ 作用)。 群阶变成 8。翻转分两类:

  • 过相对顶点(2 个):固定 2 颗珠子,交换另 2 颗。被交换的那对必须同色。自由度 $2^3 = 8$ 。每个贡献 8。
  • 过相对边中点(2 个):交换两对珠子。每对必须同色。自由度 $2^2 = 4$ 。每个贡献 4。 总计:$(16 + 2 + 4 + 2 + 8 + 8 + 4 + 4) / 8 = 48 / 8 = 6$ 。 这句话的意思是:虽然群变大了,但翻转动作的不动点较少,平均值巧合地还是 6。
$$N = \frac{1}{4}(4^4 + 4 + 4^2 + 4) = \frac{1}{4}(256 + 4 + 16 + 4) = \frac{280}{4} = 70$$

这句话的意思是:颜色变多后,对称性“撞车”的概率暴跌,不动点主要集中在单位元上,结果迅速膨胀到 70。

例子 4:等边三角形顶点 3 色着色($D_3$ 作用)。 $|X| = 3^3 = 27$$D_3$ 阶为 6。

  • 单位元:$|X^e| = 27$
  • 旋转 120°/240°(2 个):三个顶点必须同色。$3$ 种。共 $2 \times 3 = 6$
  • 反射(3 个):固定 1 个顶点,交换另 2 个。被交换的必须同色(3种),固定的随便选(3种)。$3 \times 3 = 9$ 。共 $3 \times 9 = 27$ 。 Burnside:$(27 + 6 + 27) / 6 = 60 / 6 = 10$ 。 这句话的意思是:10 种本质不同的三角形着色。 枚举验证:3 种单色 + 6 种“两同一异”(反射会把旋转下的不同姿态合并)+ 1 种“三色全异”。$3+6+1=10$ 。严丝合缝。

Burnside引理计数不同2色项链

共轭和类方程#

心理图像:共轭是群照镜子的方式。两个元素共轭,意味着你换个坐标系(用某个群元素做基底变换),它们干的是完全同一件事。轨道叫共轭类(conjugacy class),稳定子叫中心化子(centralizer)$C_G(x) = \{g \in G : gx = xg\}$

这句话的意思是:共轭类把群里的元素按“结构功能”分门别类,中心化子则是所有愿意和 $x$ 和平共处、交换顺序的动作集合。

$$|\text{Cl}(x)| = [G : C_G(x)] = \frac{|G|}{|C_G(x)|}$$

这句话的意思是:和 $x$ 结构相同的元素有多少个,取决于群里有多少人拒绝和 $x$ 交换位置。

顺手做个 sanity check:在交换群(abelian group)里,所有元素都互相交换,$C_G(x) = G$ 。每个共轭类大小都是 1。类方程退化为 $|G| = |G|$ 。所以共轭只在非交换群里才有戏唱;在交换环境里,每个元素都是独行侠。

$G$中心(center)是 $Z(G) = \{z \in G : zg = gz \text{ 对所有 } g \in G\}$ 。如果 $x \in Z(G)$ ,则 $C_G(x) = G$ ,共轭类是 $\{x\}$ 。反过来,单元素类 $\{x\}$ 必然意味着 $x \in Z(G)$

$$|G| = |Z(G)| + \sum_{i=1}^{r} [G : C_G(x_i)]$$

这句话的意思是:群的总人数,等于中心里独来独往的人数,加上各个非平凡共轭类的人数总和。

共轭类将群划分成不相交的块

例子 1:$S_3$ 的共轭类。 循环类型直接决定类别:

  • $(1,1,1)$$\{e\}$ ,1 个。
  • $(2,1)$$\{(1\ 2), (1\ 3), (2\ 3)\}$ ,3 个。
  • $(3)$$\{(1\ 2\ 3), (1\ 3\ 2)\}$ ,2 个。 $1 + 3 + 2 = 6 = |S_3|$$Z(S_3) = \{e\}$ 。类方程:$6 = 1 + 3 + 2$

例子 2:$D_4$ 的共轭类。 阶 8,元素 $\{e, r, r^2, r^3, s, rs, r^2s, r^3s\}$ 。算一下 $rsr^{-1} = r s r^3 = r (sr^3) = r (r^{-3} s) = r^{-2} s = r^2 s$ 。所以 $s$$r^2 s$ 共轭。完整分类:

  • $\{e\}$ (1)
  • $\{r^2\}$ (1)
  • $\{r, r^3\}$ (2)
  • $\{s, r^2 s\}$ (2)
  • $\{rs, r^3 s\}$ (2) 总计 $1+1+2+2+2=8$ 。中心 $Z(D_4) = \{e, r^2\}$ ,阶 2。类方程:$8 = 2 + 2 + 2 + 2$

例子 3:$S_4$ 的共轭类。 $|S_4| = 24$

循环类型代表类大小
$(1,1,1,1)$$e$$1$
$(2,1,1)$$(1\ 2)$$6$
$(2,2)$$(1\ 2)(3\ 4)$$3$
$(3,1)$$(1\ 2\ 3)$$8$
$(4)$$(1\ 2\ 3\ 4)$$6$

总计 $1+6+3+8+6=24$$\checkmark$$S_n$ 类大小公式是 $n! / (\prod_i i^{c_i} \cdot c_i!)$ 。对 $(2,1,1)$$24/(2 \cdot 2!) = 6$

这句话的意思是:共轭类就是群元素的“物种分类”。在 $S_n$ 里,共轭等于重标号,所以循环结构相同的置换必然共轭。几乎所有有限群分类定理,都是用共轭类的语言写的。

我们拿表里的 $(2,2)$ 型代表 $(1\ 2)(3\ 4)$ 做个解剖,看看中心化子到底长什么样。类大小是 3,按定理中心化子阶必须是 $24/3 = 8$ 。具体是哪 8 个?首先,它自己生成的子群 $\{e, (1\ 2)(3\ 4)\}$ 肯定在里面。其次,交换两对括号内部的顺序不改变置换:$(1\ 2)$$(3\ 4)$ 分别和它交换。再把两对括号整体互换:$(1\ 3)(2\ 4)$ 作用上去,$(1\ 2)(3\ 4)$ 变成 $(3\ 4)(1\ 2)$ ,完全一样。把这几种操作组合起来,正好凑出 8 个元素:$\{e, (1\ 2), (3\ 4), (1\ 2)(3\ 4), (1\ 3)(2\ 4), (1\ 4)(2\ 3), (1\ 3\ 2\ 4), (1\ 4\ 2\ 3)\}$ 。你可以逐个乘一遍验证 $g(1\ 2)(3\ 4)g^{-1} = (1\ 2)(3\ 4)$ 。这 8 个元素构成了 $D_4$ 的结构(同构于二面体群)。直觉上,中心化子就是“不破坏该置换内部配对结构”的所有重排方式。类大小 3 意味着只有 3 种不同的配对分法:$\{12|34\}, \{13|24\}, \{14|23\}$$3 \times 8 = 24$ ,齿轮再次严丝合缝。

为什么不是所有子群都正规? 直觉来了。正规子群(normal subgroup)$N \trianglelefteq G$ 的定义是 $gNg^{-1} = N$ 对所有 $g$ 成立。换成作用的语言:$G$ 通过共轭作用于自己的所有子群集合。一个子群 $H$ 是正规的,当且仅当它在这个作用下是“不动点”——不管你怎么共轭它,它作为集合整体纹丝不动。 为什么很多子群不正规?因为共轭会把子群里的元素“洗牌”到外面去。拿 $S_3$ 里的 $H = \{e, (1\ 2)\}$ 举例。用 $(1\ 3)$ 共轭它:$(1\ 3)(1\ 2)(1\ 3)^{-1} = (2\ 3)$$(2\ 3)$ 根本不在 $H$ 里。所以 $H$ 被共轭作用搬走了,它不是不动点,自然不正规。正规子群必须是若干完整共轭类的并集,缺一块都不行。这就是“正规”二字的几何直觉:它在群的内部坐标变换下保持形状不变。

命题:$p$ -群的中心非平凡。 如果 $|G| = p^n$$p$ 素数,$n \ge 1$ ),则 $Z(G) \neq \{e\}$证明: 类方程里,每个非单元素类的大小 $[G : C_G(x_i)]$ 整除 $p^n$ 且大于 1,所以必被 $p$ 整除。类方程模 $p$ 给出 $|Z(G)| \equiv |G| \equiv 0 \pmod p$ 。所以 $|Z(G)| \ge p$$\square$

这句话的意思是:$p$ 的幂次阶群,内部一定有一批元素和所有人和平共处,不可能全是刺头。

这个看似温和的结论是 Sylow 理论的发动机。比如它直接推出:阶为 $p^2$ 的群必交换。如果 $|Z(G)| = p$ ,商群 $G/Z(G)$ 阶为 $p$ ,必循环,这会强迫 $G$ 交换,矛盾。所以 $|Z(G)| = p^2$ ,即 $G = Z(G)$$p$ -群总有非平凡中心,意味着它们总有非平凡正规子群,可以不断做商群归纳。这和单群(simple group)形成鲜明对比,后者定义上就没有正规子群,是群论里最难啃的骨头。

跨界回声:Galois 对应(Galois correspondence)的具体计算。 群作用不仅在几何和组合里大杀四方,它还是域论的骨架。考虑域扩张 $\mathbb{Q}(\sqrt{2}, \sqrt{3}) / \mathbb{Q}$ 。它的 Galois 群(Galois group)$G$ 有 4 个元素,由根 $\sqrt{2}, \sqrt{3}$ 的符号翻转生成:

  • $e$ : $\sqrt{2} \mapsto \sqrt{2}, \sqrt{3} \mapsto \sqrt{3}$
  • $\sigma$ : $\sqrt{2} \mapsto -\sqrt{2}, \sqrt{3} \mapsto \sqrt{3}$
  • $\tau$ : $\sqrt{2} \mapsto \sqrt{2}, \sqrt{3} \mapsto -\sqrt{3}$
  • $\sigma\tau$ : $\sqrt{2} \mapsto -\sqrt{2}, \sqrt{3} \mapsto -\sqrt{3}$ $G \cong \mathbb{Z}/2 \times \mathbb{Z}/2$$G$ 作用于四个根 $\{\pm\sqrt{2}, \pm\sqrt{3}\}$ 。Galois 对应说的是:$G$ 的子群和中间域一一对应(反序)。
  • 子群 $\{e, \sigma\}$ 固定 $\sqrt{3}$ ,对应中间域 $\mathbb{Q}(\sqrt{3})$
  • 子群 $\{e, \tau\}$ 固定 $\sqrt{2}$ ,对应中间域 $\mathbb{Q}(\sqrt{2})$
  • 子群 $\{e, \sigma\tau\}$ 固定 $\sqrt{6} = \sqrt{2}\sqrt{3}$ ,对应中间域 $\mathbb{Q}(\sqrt{6})$
  • 平凡子群 $\{e\}$ 对应全扩张 $\mathbb{Q}(\sqrt{2}, \sqrt{3})$
  • 全群 $G$ 对应基域 $\mathbb{Q}$ 。 这句话的意思是:群在根上的作用方式,完美编码了域扩张的层级结构;子群越大,固定的东西越多,对应的域就越小。这就是 Galois 理论的核心魔法,而它的底层齿轮正是群作用。

类方程:共轭类大小之和等于群的阶

应用:着色问题和魔方对称#

理论磨锋利了,我们砍几个实际问题。

动画演示:群作用于着色对象

应用 1:用 $k$ 种颜色着色立方体的面。 立方体 6 个面。旋转群 24 个元素(同构于 $S_4$ )。分类数不动点:

  • 单位元(1个):$k^6$
  • 面心轴 $\pm 90°$ (6个):顶底自由($k^2$ ),侧面 4 个循环必须同色($k$ )。共 $k^3$
  • 面心轴 $180°$ (3个):顶底自由($k^2$ ),侧面分两对($k^2$ )。共 $k^4$
  • 体对角线 $\pm 120°$ (8个):分两组三面循环,每组同色。共 $k^2$
  • 棱中点轴 $180°$ (6个):三对面互换,每对同色。共 $k^3$ 。 Burnside 公式: $N \;=\; \frac{1}{24}\bigl(k^6 + 6k^3 + 3k^4 + 8k^2 + 6k^3\bigr) \;=\; \frac{1}{24}\bigl(k^6 + 3k^4 + 12k^3 + 8k^2\bigr).$ 这句话的意思是:把 24 种旋转各自留下的着色方案加起来除以 24,就得到本质不同的面着色数。 代入 $k=2$$N = (64 + 48 + 96 + 32)/24 = 240/24 = 10$ 。两种颜色涂立方体六个面,正好 10 种。这个数小到可以手动画出来核对,完美验证 Burnside 把 $2^6=64$ 种带标号方案压缩到了正确的轨道数。代入 $k=3$ 得 57,$k=4$ 得 240,$k=6$ 得 2226。以前要耗掉一整节课的容斥原理和分类讨论,现在代进一行公式直接出结果。

我特别喜欢这个公式的一点:它根本不需要你先搞清楚“轨道长什么样”。每个 $|X^g|$ 都是纯局部的不动点计数,$g$ 怎么把面切成循环决定了自由度。把所有局部计数加起来除以群阶,全局轨道数自己就掉下来了。这是 Burnside 引理的真正暴力美学。

应用 2:$n$$k$ 色项链($D_n$ 作用)。 旋转 $r^d$ 的不动点数是 $k^{\gcd(d, n)}$ 。翻转分奇偶:$n$ 奇数时,每个翻转固定 1 珠交换 $(n-1)/2$ 对,贡献 $k^{(n+1)/2}$$n$ 偶数时,一半翻转固定 2 珠,一半固定 0 珠。套公式即可。比如 $n=6, k=2$ ,旋转贡献 $2^6+2+2^2+2^3+2^2+2=80$ ,翻转贡献 $3 \cdot 2^4 + 3 \cdot 2^3 = 72$$N = (80+72)/12 = 13$ 。十三种二色六珠项链,和组合学图谱完全一致。

应用 3:魔方的状态空间: 魔方群阶是 $43{,}252{,}003{,}274{,}489{,}856{,}000$ 。它在 54 个色块上的作用不是自由的,我们关心的“合法状态”恰好是轨道。用群作用视角,魔方理论的开局就是:状态空间是 $S_8 \times S_{12} \times (\mathbb{Z}/3)^8 \times (\mathbb{Z}/2)^{12}$ 的一个指数为 12 的子群。为什么指数是 12?因为三个物理约束砍掉了自由度:

  1. 角块置换的奇偶性必须和棱块置换的奇偶性一致(砍掉因子 2)。
  2. 所有角块扭转角度之和必须为 $0 \bmod 3$ (砍掉因子 3)。
  3. 所有棱块翻转次数之和必须为 $0 \bmod 2$ (砍掉因子 2)。 $2 \times 3 \times 2 = 12$ 。每个约束都是一个轨道-稳定子定理的化身:群作用把庞大的笛卡尔积切成轨道,合法状态只是其中一个轨道。你拧魔方,其实是在这个轨道里散步。永远拧不出“单棱翻转”或“单角扭转”,因为它们根本不在同一个轨道里。

Polya计数:4色正方形模旋转

下一步#

群作用把“群”这个抽象代数对象重新接回了几何与组合的地面:轨道告诉你连通性,稳定子告诉你对称性,共轭类告诉你内部结构,Burnside 告诉你怎么数。但作用只是硬币的一面。下一篇,我要把视角从“群对外部集合做什么”拉回“群内部怎么自我折叠”。我们会正式引入商群(quotient group)和同态(homomorphism),彻底拆解正规子群为什么是“可以做除法”的唯一门票,并用第一同构定理(first isomorphism theorem)把群、核、像、商串成一条闭环。共轭类已经在本篇摸到了正规子群的门槛(正规子群就是若干共轭类的并),下一篇我们会直接跨过去。带着这个问题读下去:如果我想把群里的某些元素“视为零”,剩下的结构还能保持群的乘法吗?答案就在正规子群和商群的构造里。

本系列

抽象代数 12 篇

  1. 01 抽象代数(一):群 —— 你与代数结构的初次相遇
  2. 02 抽象代数(二):群的作用 —— 群如何移动事物 当前
  3. 03 抽象代数(三):商群与同态 —— 结构压缩的艺术
  4. 04 抽象代数(四):Sylow 定理 —— 剖析有限群
  5. 05 抽象代数(五):环与理想 —— 当乘法进入画面
  6. 06 抽象代数(六):多项式环 —— 因子分解与唯一分解
  7. 07 抽象代数(七):域扩张 — 构建更大的数系
  8. 08 抽象代数(八):Galois 理论 —— 域与群之间的桥梁
  9. 09 抽象代数(九):模——向量空间的推广
  10. 10 抽象代数(十):表示论 — 群在向量空间上的作用
  11. 11 抽象代数(十一):范畴论 — 数学结构的语言
  12. 12 抽象代数(十二):代数在实际应用中的威力 —— 从密码学到编码理论及其他

读有所得?

GitHub 关注我 → 新文周更

GitHub