系列 · 泛函分析 · 第 8 篇

泛函分析(八):谱理论 —— 分解算子

谱将特征值推广到无穷维空间——有界自伴算子的谱定理和连续函数演算给出了完整的分解。

当“特征值”不再是答案#

当我第一次看到“谱”这个词用于算子时,我以为它只是“特征值集合”的一个花哨同义词。对于矩阵和紧算子来说,这是正确的直觉,也是初等线性代数中想要的。问题在于,一旦算子不是紧的,这个直觉就错了。$L^2[0, 1]$ 上的位置算子 $(Mf)(x) = x f(x)$ 没有特征值:任何特征函数都必须满足 $x f(x) = \lambda f(x)$ 几乎处处成立,这迫使 $f$ 在除了单点外的所有地方为零,因此 $f$$L^2$ 中为零。然而,该算子显然不可逆,因为 $\lambda I - M$ 是乘以 $x - \lambda$ 的运算,当 $\lambda \in [0, 1]$ 时,它不能有界可逆。

函数演算:对算子施加函数

这个例子让我重新审视“谱”这个概念的定义。光看特征向量是不够的——位置算子没有任何 $L^2$ 特征向量,但 $[0,1]$ 中的每个 $\lambda$ 都让 $\lambda I - M$ 失去有界逆。所以谱必须用“是否可逆”来定义,而不是用“是否有特征向量”定义。这是一个看起来微小但内涵深远的转向:谱从“特征值列表”升级成“可逆性失效的所有 $\lambda$ ”,并因此自动包括那些“几乎是特征值”的情形——比如位置算子里的连续谱,或者 Volterra 算子的拟幂零情形。

因此,需要一个比特征值更广泛的“谱值”概念。想法是将谱定义为使得 $\lambda I - T$ 无法成为有界可逆算子的 $\lambda$ 集合,无论出于何种原因。这使谱成为算子可逆结构的属性,而不仅仅是其特征向量结构,并且对紧和非紧算子都适用。最终的回报——有界自伴算子的谱定理——通过用谱测度上的连续积分替换有限或可数对角线,从紧自伴算子推广到一般自伴算子。本文将详细探讨这一成果。

谱的定义#

$T \in B(X)$ 是复 Banach 空间 $X$ 上的有界算子。预解集

谱的分解:点谱、连续谱、剩余谱

$$ \rho(T) = \{\lambda \in \mathbb{C} : \lambda I - T \text{ 是双射且有界逆}\}. $$

是其补集:$\sigma(T) = \mathbb{C} \setminus \rho(T)$ 。根据开映射定理,$\lambda I - T$ 是双射已经足以保证有界逆,所以第二个条件是自动的。因此,谱是使得 $\lambda I - T$ 不是单射或满射的 $\lambda$ 集合。

这种二元区分(单射/满射)允许将谱细化为几个部分。

谱的分解:点谱、连续谱、剩余谱

  • 点谱 $\sigma_p(T) = \{\lambda : \lambda I - T \text{ 不是单射}\}$ —— 通常意义上的特征值。
  • 连续谱 $\sigma_c(T) = \{\lambda : \lambda I - T \text{ 是单射且有稠密值域,但不是满射}\}$ —— 没有特征向量,但 $\lambda I - T$ “几乎”是满射。
  • 剩余谱 $\sigma_r(T) = \{\lambda : \lambda I - T \text{ 是单射,值域不稠密}\}$ —— 没有特征向量,且值域缺失了空间的一部分。

这三个集合是不相交的,它们的并集是 $\sigma(T)$ 。对于 Hilbert 空间上的自伴算子,剩余谱为空——这是一个虽小但有用的事实。

一些具体的例子值得计算。

对于 $A \in M_n(\mathbb{C})$ ,谱就是特征值,都在 $\sigma_p$ 中。没有连续谱或剩余谱:在有限维空间中,单射意味着满射。整个“三部分”故事简化为矩阵特征值的故事。

第 7 篇文章告诉我们,对于紧算子 $T$ ,每个非零谱值都是特征值。所以 $\sigma(T) \setminus \{0\} \subset \sigma_p(T)$ ,可能 $0 \in \sigma_c(T)$$\sigma_r(T)$$L^2[0, 1]$ 上的 Volterra 算子有 $\sigma = \{0\}$ ,其中 $0 \in \sigma_c$

$(M f)(x) = x f(x)$ 。对于 $\lambda \in [0, 1]$$\lambda I - M$ 是乘以 $x - \lambda$ 的运算,它是单射(因为 $x - \lambda$ 除了一点外都不为零),但不是满射(像为 $\{g \in L^2 : g(x)/(x - \lambda) \in L^2\}$ ,是一个真子集)。对于 $\lambda \in [0, 1]$ 内部的点,像是稠密的,所以 $\lambda \in \sigma_c$ 。对于 $\lambda \notin [0, 1]$$\lambda I - M$ 是可逆的(乘以 $1/(x-\lambda) \in L^\infty$ ),所以 $\lambda \in \rho$ 。结论:$\sigma(M) = [0, 1]$ ,全是连续谱,没有特征值。

第三个例子是非紧自伴算子的原型。它清楚地表明为什么“找到特征值”对于一般算子来说是错误的问题:这个算子没有特征值,但它的谱是一个区间。正确的问题是“描述谱测度”,对于 $M$ 来说答案是“$[0, 1]$ 上的 Lebesgue 测度,伪装成其他形式”。

预解式及其解析性#

对于 $\lambda \in \rho(T)$ ,定义预解式

预解函数及其解析性质

$$ R(\lambda; T) = (\lambda I - T)^{-1}. $$

预解式是谱理论的技术工作马。它的第一个优点是:作为 $\lambda$ 的函数,它是算子值的并且在 $\rho(T)$ 上解析。

预解集是开集且预解式是解析的

可以证明,$\rho(T)$ 是开集,并且 $\lambda \mapsto R(\lambda; T)$$\rho(T)$$B(X)$ 是解析的,在 $\rho(T)$ 的每一点都有收敛的幂级数展开。

证明: 固定 $\lambda_0 \in \rho(T)$ 。对于 $\lambda$ 接近 $\lambda_0$ ,形式 Neumann 级数

$$ R(\lambda; T) = R(\lambda_0; T) \sum_{n=0}^\infty (\lambda_0 - \lambda)^n R(\lambda_0; T)^n $$

在算子范数下收敛,只要 $|\lambda - \lambda_0| < \|R(\lambda_0; T)\|^{-1}$ —— 这是 Neumann 级数论证。因此 $\lambda$ 也在 $\rho(T)$ 中,预解式由级数给出,因此是解析的。$\square$

一个标准的推论是第一预解恒等式为 $R(\lambda) - R(\mu) = (\mu - \lambda) R(\lambda) R(\mu)$ ,对于 $\lambda, \mu \in \rho(T)$ 成立。它是算子版本的部分分式恒等式 $1/(\lambda - t) - 1/(\mu - t) = (\mu - \lambda)/((\lambda - t)(\mu - t))$ ,它使得预解式在围道积分中有用。

对于复 Banach 空间上任意 $T \in B(X)$$\sigma(T) \neq \emptyset$$\sigma(T) \subset \{\lambda : |\lambda| \leq \|T\|\}$ 。界的证明是 Neumann 级数论证:对于 $|\lambda| > \|T\|$ ,级数 $\sum (T/\lambda)^n / \lambda$ 收敛到 $R(\lambda; T)$ 。非空性使用的是如果 $\sigma(T) = \emptyset$ ,则 $R(\lambda; T)$ 将是整函数且有界,因此由 Liouville 定理是常数,但它随着 $|\lambda| \to \infty$ 趋于零,因此恒为零——矛盾。谱的非空性因此是一个复分析定理,在实 Banach 空间中没有类似的结果。

谱半径#

定义谱半径 $r(T) = \sup\{|\lambda| : \lambda \in \sigma(T)\}$ 。有趣的是,这个几何量等于一个分析极限:

谱半径公式 r(T) = lim ||T^n||^(1/n)

$r(T) = \lim_{n \to \infty} \|T^n\|^{1/n}$

极限存在是因为 Fekete 引理应用于次乘序列 $\|T^n\|$ 。对于 $|\lambda| > r(T)$ ,Neumann 级数 $\sum T^n / \lambda^{n+1}$ 收敛(根检验),从而 $\lambda \in \rho(T)$ 。相反方向来自预解式的解析性:它在圆周 $|\lambda| = r(T)$ 上某处必有奇点,这迫使 $\sigma(T)$ 触及该圆周。

左边纯粹是关于谱(算子的几何性质)。右边纯粹是关于迭代 $T$ (分析性质)。它们相等。特别地:具有 $\|T^n\|^{1/n} \to 0$ 的算子是拟幂零的,谱为 $\{0\}$ 。Volterra 算子具有此性质。反之,谱半径为零的算子渐近行为类似于压缩映射:$\|T^n\| \to 0$ ,最终如此。

尝试一个小数值例子。取 $3 \times 3$ 矩阵

$$ A = \begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{pmatrix}. $$

那么 $A^2$ 只有一个右上角的 1,$A^3 = 0$ 。因此对于 $n \geq 3$$\|A^n\| = 0$ ,且 $r(A) = 0$$A$ 的谱为 $\{0\}$ (它是幂零的)。现在取 $B = A + 0.01 \cdot I$ 。谱为 $\{0.01\}$$\|B^n\|^{1/n} \to 0.01$ 。特征值等于渐近增长率。谱半径公式用三行说明。

Hilbert 空间上的自伴算子#

从这里开始,$H$ 是复 Hilbert 空间,$T \in B(H)$ 是自伴的,即 $T = T^*$ 。世界变得友好得多。

到底友好多少?关键有三件事。,自伴算子的谱必须在实数轴上——这是由 $\langle Tx, x\rangle = \langle x, Tx\rangle = \overline{\langle Tx, x\rangle}$ 强制的,下文会用具体的 $\|\cdot\|^2$ 估计证明。,没有剩余谱——剩余谱定义为“值域不稠密但单射”的部分,自伴性把它和点谱合并。,谱定理给出一个干净的“算子=乘法算子”表示。这三件事合起来让自伴算子成为算子理论里最舒服的一类。

物理上自伴算子对应可观测量,这件事和上面三条数学性质完美对应:可观测量必须有实测量结果(谱实),测量必须有概率分布(谱分解给出投影值测度),可观测量的函数必须有意义(函数演算)。这个对应不是巧合——von Neumann 在 1932 年精确地以这种数学结构来定义“量子力学的可观测量”。所以“自伴算子是友好的”这条数学陈述同时也是“量子力学的数学基础是健全的”这条物理陈述。

自伴算子的谱位于实线上

对于 $\lambda = a + ib \in \mathbb{C}$$b \neq 0$ ,算子 $T - \lambda I$ 满足

$$ \|(T - \lambda I) x\|^2 = \|(T - aI)x\|^2 + b^2 \|x\|^2 \geq b^2 \|x\|^2, $$

因此 $T - \lambda I$ 有下界,故单射且值域闭。由于自伴性,$\text{range}(T - \lambda I)^\perp = \ker(T - \overline{\lambda} I)$ ,同样的论证表明这个核是平凡的。因此值域是整个 $H$$T - \lambda I$ 可逆,且 $\lambda \in \rho(T)$

自伴算子的谱因此位于 $\mathbb{R}$ 上。事实上,它位于 $[-\|T\|, \|T\|]$ 内,并且(更精细的估计)位于 $[m, M]$ 内,其中 $m = \inf_{\|x\|=1} \langle Tx, x \rangle$$M = \sup_{\|x\|=1} \langle Tx, x\rangle$ ,且 $m, M \in \sigma(T)$

如果 $\lambda I - T$ 有稠密值域,同样的自伴性恒等式表明它也是单射的,因此整个谱是点谱或连续谱。没有第三种类型。这种二分法使得自伴算子的谱定理非常干净:每个谱值要么是特征值(有特征向量),要么是连续谱值(有“近似特征向量”:Weyl 序列 $x_n$ 使得 $\|x_n\| = 1$$(T - \lambda I)x_n \to 0$ )。

连续函数演算#

这是关键思想,也是谱理论中最干净的一个。给定 $T = T^*$ 有界且谱 $\sigma(T) \subset [m, M] \subset \mathbb{R}$ ,想$T$ 应用函数。对于多项式这是微不足道的:$p(T) = \sum a_n T^n$ 。对于收敛半径超过 $\|T\|$ 的幂级数也一样。但对于谱上的函数 $f(t) = e^t$ 呢?或者对于正算子 $T$ 上的 $f(t) = \sqrt{t}$$[0, M]$ 上呢?或者 $f(t) = \mathbf{1}_{(\lambda_0, \infty)}(t)$ ,区间的指示函数呢?

“对算子应用函数”这件事在物理里几乎天天用——量子动力学要 $e^{-itH/\hbar}$ 、热半群要 $e^{t\Delta}$ 、谱投影要 $\mathbf{1}_B(H)$ 、能量平方根要 $\sqrt{H}$ 。每次写下这些表达式时都默认它们有意义,但严格定义需要谱定理。连续函数演算给出第一层定义:对谱上任何连续函数 $f$$f(T)$ 通过先在多项式上定义、再用 Stone-Weierstrass 稠密性扩展。Borel 函数演算更进一步,让 $f$ 可以是 Borel 可测函数(包括指示函数),代价是 $f(T)$ 不再是 $T$ 的“连续函数”,但仍然有清晰的算子意义。

这套机制有一条干净的代数性质:它是 $*$ -代数同态。也就是说,$f \mapsto f(T)$ 把函数的代数运算(加、乘、复共轭)翻译成算子的代数运算(加、乘、伴随)。这意味着如果两个函数 $f, g$ 满足某个代数恒等式(比如 $\sin^2 + \cos^2 = 1$ ),那么对应的算子也满足同样的恒等式($\sin^2(T) + \cos^2(T) = I$ )。这种代数性质让谱定理不仅是“一个表示定理”,而是“一个把函数论搬到算子论的字典”。下文的乘法算子表示和谱测度表示都建立在这条字典上。

干净的答案是连续函数演算

函数演算:对算子应用函数

可以证明,设 $T = T^* \in B(H)$ 。存在唯一映射 $\Phi: C(\sigma(T)) \to B(H)$ 使得

  1. $\Phi$$*$ -代数同态:$\Phi(fg) = \Phi(f)\Phi(g)$$\Phi(\overline{f}) = \Phi(f)^*$$\Phi(1) = I$$\Phi(t) = T$
  2. $\Phi$ 是等距映射:$\|\Phi(f)\| = \|f\|_{C(\sigma(T))} = \sup_{\lambda \in \sigma(T)} |f(\lambda)|$
  3. $\sigma(\Phi(f)) = f(\sigma(T))$ (谱映射定理)。

构造首先通过多项式情况:定义 $\Phi(p) = p(T)$ 对于多项式,验证 $\|p(T)\| = \|p\|_{C(\sigma(T))}$ (这是自伴性给出的),然后通过 Stone-Weierstrass 密度扩展到连续函数。最终结果是一种方法,可以为谱上任何连续函数 $f$ 定义 $f(T)$ ,并且具有所有期望的代数和范数性质。

特别是,有 $e^T$$\sqrt{T}$ (对于正算子 $T$ ),$|T| = (T^*T)^{1/2}$ 对于一般 $T$ ,以及一系列有用的算子函数。连续函数演算是应用算子理论的基础:任何需要对自伴算子 $T$ 计算 $f(T)$ 的地方,这提供了一个干净的方法。

一个小数值实例。取 $T = \text{diag}(1, 2, 3)$$\mathbb{C}^3$ 上。那么 $\sigma(T) = \{1, 2, 3\}$ ,对于连续函数 $f$$\Phi(f) = \text{diag}(f(1), f(2), f(3))$ —— 函数演算简化为对特征值应用 $f$ 。对于具有连续谱的算子,同样的想法适用,但“对角线”被函数空间上的乘法算子取代。这基本上是谱定理的内容。

有界自伴算子的谱定理#

有几种等价表述。我发现最有用的是乘法算子形式和谱测度形式

谱定理是这一节最重要的结论,值得在写出形式陈述之前先讲一下它的来历。有限维线性代数告诉我“每个 Hermitian 矩阵都有正交特征基,可以对角化”。第七篇紧自伴算子告诉我“每个紧自伴算子有正交特征向量列,特征值趋于零”。在这两步之间,结构是一样的:在合适的基下算子就是“按特征值乘一下”。问题是,对一般有界自伴算子(既不是有限维也不是紧的,比如位置算子),“特征向量列”可能根本不存在——位置算子没有任何 $L^2$ 特征向量,但它显然在合理意义下应该“按 $x$ 乘一下”。

谱定理的解决方案是把“可数个特征向量”换成“连续的谱测度”。位置算子在 $L^2[0,1]$ 上的“特征基”是 $\{\delta_x : x \in [0,1]\}$ ——一族连续参数化的“广义特征向量”,它们不在 $L^2$ 里,但它们的“频谱”信息可以编码到一个投影值测度 $E$ 上:$E([a,b])$ 是“投影到支撑在 $[a,b]$ 上的函数”这件事,正是把特征值在 $[a,b]$ 中的部分对应的子空间挑出来。算子 $T$ 通过这个测度积分出来:$T = \int \lambda \, dE(\lambda)$

第二种说法更具体:每个有界自伴算子都酉等价于某个 $L^2$ 空间上乘以一个实值函数。换句话说,所有自伴算子在合适的基下都是“某个空间上的位置算子”——位置算子不是特例,而是范例。Hermitian 矩阵是这个定理的有限维特例($\Omega$$\{1,\ldots,n\}$ 加计数测度),紧自伴是可数离散特例($\Omega$$\mathbb{N}$ 加适当测度),位置算子本身就是连续测度的实例。

Hilbert 空间上有界自伴算子的谱定理

可以证明,设 $T \in B(H)$ 是自伴的。存在测度空间 $(\Omega, \mu)$ ,酉算子 $U: H \to L^2(\Omega, \mu)$ ,以及有界可测函数 $h: \Omega \to \mathbb{R}$ 使得

$$ U T U^{-1} = M_h, $$

其中 $M_h$ 是乘以 $h$ 的算子。换句话说:每个有界自伴算子酉等价于某个 $L^2$ 空间上的乘法算子。

这是“每个 Hermitian 矩阵都可以对角化”的正确推广。对于矩阵,$\Omega$ 是有限的(特征值的指标集,带重数),$\mu$ 是计数测度,$M_h$ 是对角矩阵。对于一般的有界自伴算子,$\Omega$ 可能是连续统,$\mu$ 是连续测度,但结构图是一样的:在合适的基下,$T$ 是乘以实值函数。

可以证明,设 $T \in B(H)$ 是自伴的。存在唯一的投影值测度 $E$$\sigma(T)$ 的 Borel 集上,使得

$$ T = \int_{\sigma(T)} \lambda \, dE(\lambda), $$

其中积分弱解释为:$\langle T x, y \rangle = \int \lambda \, d \langle E(\lambda) x, y \rangle$ 。测度 $E$ 将每个 Borel 集 $B \subset \sigma(T)$ 映射到正交投影 $E(B)$ ,满足 $E(\emptyset) = 0$$E(\sigma(T)) = I$ ,且对不交并具有可数可加性。

这是物理学家喜欢的形式:它是“可观测量有谱,测量投射到本征空间”的算子理论内容。投影值测度 $E$ 告诉你,对于每个 Borel 集 $B$ ,投射到“状态在谱区域 $B$ 中的部分”的正交投影。

对于紧自伴算子(第 7 篇文章),$E$ 是特征值处的有限秩投影之和。对于 $L^2[0, 1]$ 上的乘以 $x$ 的算子,$E(B)$ 是乘以 $\mathbf{1}_B$ —— 投射到支持在 $B$ 上的函数。两种情况都是同一定理的特殊情况。

例子以加深理解#

$(Mf)(x) = m(x) f(x)$$L^2(\Omega, \mu)$ 上,其中 $m$ 是实值有界可测函数。谱是 $m$ 的所谓本质范围,

$$ \sigma(M) = \{\lambda : \mu(\{x : |m(x) - \lambda| < \varepsilon\}) > 0 \text{ 对所有 } \varepsilon > 0\}. $$

谱测度是 $E(B) = M_{\mathbf{1}_{m^{-1}(B)}}$ ,即乘以 $B$ 的原像的指示函数。这是每个自伴算子酉等价的“模型”例子。

经典算子的谱:移位、乘法、积分算子

$S(x_1, x_2, \ldots) = (0, x_1, x_2, \ldots)$ 。不是自伴的:$S^*$ 是左移 $(x_1, x_2, \ldots) \mapsto (x_2, x_3, \ldots)$ 。谱:$\sigma(S) = \overline{\mathbb{D}} = \{|\lambda| \leq 1\}$$S$ 的点谱:空(没有 $\ell^2$ 特征向量)。$S^*$ 的点谱:开单位圆盘 $\mathbb{D}$ ,特征向量为 $(1, \lambda, \lambda^2, \ldots)$ 对于 $|\lambda| < 1$$S$$S^*$ 之间的不对称性是教科书中的例子,说明点谱不是自伴性的量。

例 C($L^2(\mathbb{R})$ 上的 Laplacian,技术上无界但有启发性):$\Delta f = f''$ 。通过 Fourier 变换,$\Delta$ 变为 $L^2(\mathbb{R})$ 上的乘以 $-|\xi|^2$ 。谱:$\sigma(\Delta) = (-\infty, 0]$ ,全是连续谱。没有 $L^2$ 特征函数。“特征函数” $e^{i\xi x}$ 不在 $L^2$ 中,它们是广义特征函数。这是 Fourier 分析实际上是谱理论的一个典型例子。

$K(x, y) = e^{-|x-y|^2}$ ,一个高斯核。算子是紧且自伴的,因此特征值形成一个趋于零的序列。特征函数可以通过在细网格上离散化并对所得矩阵进行对角化来数值逼近。特征值大致呈指数衰减,与核的光滑性匹配。

这些例子值得建立直觉。几乎所有在数学物理中遇到的自伴算子都是 A、B、C、D 或其组合的变体。

一个数值例子以固定图像#

考虑有界自伴算子 $(T f)(x) = (1 - x^2) f(x) + \int_{-1}^1 K(x, y) f(y) \, dy$$L^2[-1, 1]$ 上,其中 $K(x, y)$ 是一个小的 Hilbert-Schmidt 核。第一部分是乘以 $1 - x^2$ ,具有连续谱 $[0, 1]$ 。第二部分是紧自伴算子。整个算子既有连续谱(来自乘法部分)又可能有离散特征值集(来自紧部分的扰动)。

数值上,将区间离散化为 $N = 1000$ 个点,构建相应的 $1000 \times 1000$ 对称矩阵,并对角化。特征值密集分布在 $[0, 1]$ 上(近似连续谱),可能还有一些异常值(近似离散特征值)。当 $N \to \infty$ 时,特征值簇填充 $[0, 1]$ ,速率由乘法算子的谱密度预测,异常值稳定。这是算子谱的定性图像:在极限情况下,乘法算子给出连续谱,紧算子给出离散特征值,组合给出混合。谱测度形式的定理是捕捉这两种机制的结构性陈述。

具体来说:对于 $L^2[0, 1]$ 上的乘法算子 $M_g$ ,其中 $g(x) = x$ ,谱测度 $E(B) = M_{\mathbf{1}_{B}}$ 是乘以 $B$ 的指示函数,$\langle E(B) f, f \rangle = \int_B |f|^2 \, dx$ 。这就是 $B$ 的 Lebesgue 测度加权 $|f|^2$ 。严格意义上的特征函数不存在;正确的替代是谱测度。

实践中的分解 $\sigma_{ac} \cup \sigma_{sc} \cup \sigma_{pp}$ #

分解 $\sigma(T) = \sigma_{ac}(T) \cup \sigma_{sc}(T) \cup \sigma_{pp}(T)$ —— 绝对连续谱、奇异连续谱、纯点谱 —— 是谱测度形式应用 Lebesgue 分解定理后的结果。大多数物理感兴趣的算子有 $\sigma_{sc} = \emptyset$ ,但反例存在(稀疏势的随机 Schrödinger 算子,某些参数值下的几乎 Mathieu 算子),这些是微妙且有趣的。

为什么分解重要?在量子力学中,各部分具有物理意义。纯点谱对应束缚态(电子被原子核捕获,粒子在约束势中):绝对连续谱对应散射态(自由粒子,可以逃逸到无穷远的粒子):奇异连续谱是奇特但真实的:它对应既非束缚态也非散射态的状态,具有异常传输性质。证明普通原子只有点谱和绝对连续谱(没有奇异连续谱)是数学物理中的深刻定理(RAGE 定理及其后代),花了数十年才建立。

连续函数演算扩展到Borel 函数演算,允许对谱上的任何有界 Borel 函数 $f$ 应用 $f(T)$ —— 特别是指示函数,这给出了投影值谱测度 $E(B) = \mathbf{1}_B(T)$ 。因此,连续和 Borel 函数演算一起给出了谱定理;反过来,谱定理通过积分 $E$ 得到它们。整个故事是一个紧密的三向等价。

计算谱:实践者的目录#

有些算子出现得如此频繁,以至于记住它们的谱是有用的。一个简短的目录。

$\sigma(I) = \{1\}$ 。虽然简单,但值得说明。单位算子只有一个特征值。

$T(x_1, x_2, \ldots) = (\lambda_1 x_1, \lambda_2 x_2, \ldots)$ 其中 $\lambda_n$ 有界。谱是 $\{\lambda_n\}$ 的闭包。每个 $\lambda_n$ 是特征值。$\{\lambda_n\}$ 的极限点是连续谱。

谱是 $g$ 的在 $\lambda$ 处有纯点谱,其中 $\mu(g^{-1}(\{\lambda\})) > 0$ (因此 $g$ 在正测度集上是常数);其余部分是连续谱。

$\sigma(S) = \overline{\mathbb{D}}$ ,点谱为空,剩余谱是开单位圆盘 $\mathbb{D}$ ,连续谱是单位圆。当取伴随 $S^*$ (左移)时,$\mathbb{D}$ 上的剩余谱质量消失:$\mathbb{D}$ 变为点谱。

$\ell^2(\mathbb{Z})$ 上的离散 Laplacian: $(\Delta x)_n = x_{n+1} + x_{n-1} - 2 x_n$ 。通过 Fourier 变换 $\ell^2(\mathbb{Z}) \cong L^2([-\pi, \pi])$ ,这是乘以 $2\cos\theta - 2$ 对于 $\theta \in [-\pi, \pi]$ 。因此谱是 $[-4, 0]$ ,全是连续谱,没有特征值。图像与物理学家所说的“紧束缚模型带结构”匹配。

$L^2(\mathbb{R})$ 上的连续 Laplacian $\Delta$ 无界,但有启发性:通过 Fourier 变换,谱为 $(-\infty, 0]$

Volterra 积分算子 $(V f)(x) = \int_0^x f(y) \, dy$$L^2[0, 1]$ 上:紧的,$\sigma(V) = \{0\}$ 。顺便提一下,第 $n$ 次迭代的范数 $\|V^n\| = 1/n!$ ,因此 $\|V^n\|^{1/n} \to 0$ 通过谱半径公式确认 $r(V) = 0$

Toeplitz 算子 $T_g$ 具有单位圆上的连续符号 $g$ ,作用于 Hardy 空间 $H^2$ :谱是曲线 $g(\mathbb{T})$ 以及曲线绕过的所有点(这是 Brown 和 Halmos 1964 年的一个显著结果)。Toeplitz 算子本质上是“作用于正频率的 Fourier 乘子”,其谱理论是算子理论和调和分析中的一个重要主题。Hardy-Hilbert 核 $(Hf)(x) = \int_0^\infty f(y)/(x+y)\,dy$$L^2(0, \infty)$ 上是有界的,算子范数恰好为 $\pi$ (Hilbert 不等式),具有连续谱 $[0, \pi]$ ,可以通过 Mellin 变换显式计算。

这些例子不仅仅是琐事。它们是直觉的基石:面对新的算子时,应该问它与这些中的哪一个相似。大多数实际算子是这些模型的扰动或组合。

数值线性代数中的谱理论#

一个实用的旁注。谱理论的整个装置在数值线性代数中有直接对应。QR 算法通过迭代移位相似变换来计算特征值;底层收敛证明使用谱映射定理和谱隙的速度估计。Lanczos 算法通过构建 Krylov 子空间并利用正交性来计算大型对称矩阵的特征值;分析使用 Rayleigh 商和 Courant-Fischer 极大极小原理。ARPACK,大规模特征值问题的标准库,本质上是 Lanczos 加上 shift-and-invert 技巧,由谱映射定理证明。

当研究算子谱并数值计算它们时,相同的结构定理同时支配两者。无限维谱问题的有限维逼近误差分析是谱逼近理论(Chatelin, Anselone)的主题,这是算子理论在科学计算中的最干净应用之一。要点:算子理论和数值分析之间没有防火墙。两边使用相同的定理;只有实现细节不同。

为什么这很重要:量子可观测量#

在量子力学中,可观测量(能量、动量、位置)是 Hilbert 空间上的自伴算子。可观测量的谱正是可能的测量结果集。谱测度 $E$ 编码结果的概率分布:在状态 $\psi$ 中,测量结果在 Borel 集 $B$ 中的概率是 $\langle E(B) \psi, \psi \rangle$ 。这不是类比——而是 von Neumann 在 1932 年提出的量子力学的字面数学基础。

为什么算子的特征值应该对应物理测量结果的谜团有一个结构性答案:自伴算子在 Hilbert 空间上的数学结构是从物理可观测量具有确定概率的实值结果的经验观察中逆向工程得出的。谱理论在某种意义上是用数学语言表述的物理学。连续函数演算告诉你如何计算 $f(\hat H)$ ,其中 $\hat H$ 是 Hamiltonian,这包括 $e^{-it\hat H}$ —— 时间演化算子。谱理论是使 Schrödinger 方程在任何非平凡意义上可解的基础。

第 12 篇文章将详细讨论这一点。目前:谱理论是量子力学的线性代数基础设施,也是大量偏微分方程的正确设置。

谱映射定理及其用途#

一个小但有用的陈述:$\sigma(f(T)) = f(\sigma(T))$ 对于 $\sigma(T)$ 上的任何连续函数 $f$ 成立。因此 $T^2$ 的谱是 $\{\lambda^2 : \lambda \in \sigma(T)\}$$e^T$ 的谱是 $\{e^\lambda : \lambda \in \sigma(T)\}$ ,等等。多项式情况是直接的(将 $f - \mu$ 因式分解为 $\prod (z - \lambda_j)$ ,且 $f(T) - \mu I = \prod (T - \lambda_j I)$ 可逆当且仅当每个因子都可逆)。连续情况通过逼近得到。

动画:扰动下谱的移动

这能够计算通过代数运算或函数演算从 $T$ 构建的算子的谱。如果 $T \geq 0$ (正自伴),则 $T^{1/2}$ 良好定义且自伴,$\sigma(T^{1/2}) = \sqrt{\sigma(T)}$ 。如果 $T = T^*$ 且谱在 $[m, M]$ 内,则 $(T - mI)/(M - m)$ 的谱在 $[0, 1]$ 内,规范化算子。

为什么叫“谱”?历史旁注#

“谱”这个词是 Hilbert 的创造。在他 1906 年关于积分方程的讲座中,他注意到某些对称积分核的特征值形成了类似于原子发射光谱的离散线的“谱”。物理谱和算子谱随后共同发展:到 1925 年 Heisenberg 提出矩阵力学时,能量算子的特征值实际上就是观测到的原子光谱线。数学术语先于物理解释二十年,但两者变得不可分割。“谱”是少数数学术语与其物理指称不仅类似而且历史连续的情况之一。

谱投影和 Riesz 函数演算#

在讨论无界算子之前,还有一个工具:Riesz 函数演算 适用于一般有界算子(不一定自伴)。对于 Banach 空间上的 $T \in B(X)$ 和在 $\sigma(T)$ 邻域内全纯的 $f$ ,定义

$$ f(T) = \frac{1}{2\pi i} \oint_\Gamma f(\lambda) R(\lambda; T) \, d\lambda, $$

其中 $\Gamma$ 是包围 $\sigma(T)$ 的轮廓,在 $f$ 的定义域内。积分是算子值的,并且由于预解式的解析性而收敛。

特别地,取 $f = \mathbf{1}_U$ 为谱的连通分支 $U \subset \sigma(T)$ (即 $U$ 是谱的一个连通分支),得到Riesz 谱投影

$$ P_U = \frac{1}{2\pi i} \oint_{\Gamma_U} R(\lambda; T) \, d\lambda, $$

其中 $\Gamma_U$ 只包围谱在 $U$ 中的那一部分,把别的连通分支留在外面。$P_U$ 是有界算子,满足 $P_U^2 = P_U$ (投影),并且与 $T$ 交换。$T$ 沿着 $P_U$ 给出的分解 $H = P_U H \oplus (I - P_U) H$ 分裂成两块:$T|_{P_U H}$ 的谱恰好是 $\sigma(T) \cap U$$T|_{(I - P_U) H}$ 的谱是 $\sigma(T) \setminus U$ 。换句话说,连通分支级别的谱可以独立分析,互不干扰。

这件事在物理里特别有用。氢原子 Hamilton 算子的谱是“离散负特征值(束缚态)∪ 连续正谱(散射态)”,这两个分支在零点处分开。对应的 Riesz 投影 $P_-$ (绕开束缚态的轮廓积分)正是“投影到束缚态子空间”的算子,$P_+ = I - P_-$ 投到散射态子空间。整个量子力学里的“谱测度分解为离散+连续”都可以在 Riesz 投影框架下统一描述——只要谱有一个连通分支是孤立的,就有一个有界投影把它单独抠出来。

更妙的是,这套机器对孤立特征值给出有限维约化。若 $\lambda_0 \in \sigma(T)$ 是孤立的(与谱其他部分有正距离),围绕 $\lambda_0$ 画一条小圆 $\Gamma$ ,得到 Riesz 投影 $P_{\lambda_0}$ 。如果它的像是有限维(比如 $T$ 是紧算子或预解式紧的算子),那么 $T$ 在这个有限维子空间上的限制就是一个有限维矩阵,可以用经典 Jordan 形式分析。一个无穷维谱问题被压缩到一个有限维矩阵问题——这是微扰论、稳定性分析、特征值连续性证明的标准技术。$T$ 的微小变化让 $\lambda_0$ 移动多少,可以通过 $P_{\lambda_0}$ 的有限维矩阵的微扰展开来计算。

为什么这很重要#

谱论给我的核心收获是:自共轭算子等价于一个乘法算子,外加一个谱测度。这件事从有限维“对称矩阵可对角化”出发,经过紧自共轭算子的特征值列表,最终扩展到一般有界自共轭算子的谱测度积分。每一步都把“可以谈论的谱对象”扩大了一点:从有限多个特征值,到可数特征值列表(趋零),到一般测度(可能含连续部分)。

这套理论是量子力学的数学骨架。可观测量是自共轭算子,测量结果的概率分布由谱测度给出,时间演化是 $e^{-itH/\hbar}$ 。Stone 定理告诉我每个强连续幺正群对应一个自共轭生成元——也就是说,量子动力学的“场景”和自共轭算子的“代数”一一对应。如果把谱论这一节抽掉,量子力学的数学基础就空了一块。

第七篇的紧算子是这套谱论里最简单的特例(谱测度纯原子,且原子在零处累积)。下一篇要处理的无界算子是它最难的一面——定义域不再是整个空间,谱可以是无界的,自共轭性需要单独验证。但谱定理的形式不变:仍然是“算子=乘法算子,按谱测度积分”。

反例:谱半径公式失败的算子(非 Banach 代数)#

谱半径公式 $r(T) = \lim_n \|T^n\|^{1/n}$ 在 Banach 代数(即 $B(X)$ 有完备的算子范数)里成立。在没有完备算子范数的设定下,公式可能失效。

具体例子:取 $V = c_{00}$ (有限支撑序列),赋 $\ell^2$ 范数(不完备)。在 $V$ 上定义"无穷维 Jordan 块"$T(x_1, x_2, \ldots) = (x_2, x_3, \ldots)$ (左移位)。每个 $T^n e_k = e_{k-n}$$k > n$ ,否则 $0$ 。所以 $\|T^n\| = 1$ 对所有 $n$ ,给出 $r(T) = 1$ 。但 $T$$c_{00}$ 上没有特征向量(求 $T x = \lambda x$$x_{k+1} = \lambda x_k$$x_k = \lambda^{k-1} x_1$ ,但要 $x \in c_{00}$ 需要 $x_1 = 0$ ,于是 $x = 0$ )。在 $V$ 不完备的设定下,“谱"作为可逆失败的 $\lambda$ 集合还有意义,但谱半径公式给出的 $1$ 不对应任何具体特征值——它是 $V$ 的完备化 $\ell^2$ 上的谱半径。

教训:谱论的所有"代数等于几何"对应(谱半径=极限范数比、Gelfand 表示、Stone-Weierstrass)都依赖完备性。在不完备的设定下,谱可以有"鬼”——不在原空间的极限点。Banach 代数的完备性是这套理论的入场券。

反例:自伴并不蕴含可对角化(在非紧设定下)#

紧自伴算子的谱定理给出"特征向量正交基",让人产生"自伴 = 可对角化"的本科直觉。这条直觉在非紧自伴算子上彻底失败。

具体反例:$L^2[0,1]$$M f(x) = x f(x)$ 。自伴($\langle Mf, g \rangle = \int x f \bar g = \langle f, Mg\rangle$ ),有界($\|M\| = 1$ ),谱 $[0, 1]$ ,但没有任何特征向量。求 $x f(x) = \lambda f(x)$$(x - \lambda) f(x) = 0$ 几乎处处,逼出 $f = 0$$L^2$ 中。所以"特征向量正交基"对 $M$ 不存在。

正确替代:谱测度 $E_M([a, b]) f = \mathbf{1}_{[a, b]} \cdot f$ (投影到支持在 $[a, b]$ 上的函数)。$M$ 的"对角化"是 $M = \int_0^1 \lambda\,dE_M(\lambda)$ ——按谱测度积分而不是按特征向量求和。这一升级把"可对角化矩阵 $\sum \lambda_i v_i v_i^*$ “换成"按测度积分”,完全不依赖特征向量存在。第八篇展开这一点的目的是把"对角化"从依赖特征向量的概念解放为依赖谱测度的概念。

常见陷阱:把"谱中"和"特征值"混淆#

新手最常犯的错是把 $\lambda \in \sigma(T)$ 当成"$T x = \lambda x$ 有非零解"。这条等价在有限维和紧算子上成立,但在一般有界算子上不成立。

具体:$L^2[0,1]$ 上的 $M f(x) = x f(x)$$\sigma(M) = [0, 1]$ ,但点谱 $\sigma_p(M) = \emptyset$ 。每个 $\lambda \in [0, 1]$ 都是连续谱:$\lambda I - M = (\lambda - x) \cdot$ 是单射、有稠密像、但不满射($f(x) = 1$ 不在 $(\lambda - x) \cdot L^2$ 的像里因为 $(\lambda - x)^{-1}$$\lambda$ 附近不是 $L^2$ 函数)。

第二个陷阱:剩余谱在自伴算子上为空。自伴算子的谱要么是点谱要么是连续谱。如果谱分析中得到一个剩余谱,立刻怀疑算子是否真的自伴——可能只是对称(symmetric, $T \subset T^*$ )但不自伴($T = T^*$ 在定义域意义下也成立)。这条区别在第九篇的无界算子里成为整篇主题。

下一步#

到目前为止我都假设算子是有界的。这是一个非常强的假设,物理里几乎没几个有趣的算子满足它:位置算子 $X$$L^2(\mathbb{R})$ 上无界,动量算子 $P = -i\frac{d}{dx}$ 无界,Hamilton 算子 $H = -\Delta + V$ 无界。要把谱论用到这些算子上,必须放弃有界性。

下一篇专门讨论无界算子:定义域是稠密子空间而非整个 Hilbert 空间,闭性取代连续性,自共轭性比对称性严格得多(要求 $\mathcal{D}(T) = \mathcal{D}(T^*)$ ,不仅仅是 $T \subset T^*$ )。我会展开几件具体的事:怎样指定一个微分算子的定义域使它自共轭、Friedrichs 延拓如何把对称半有界算子升级成自共轭、Kato-Rellich 微扰定理给出的充分条件、为什么 Schrödinger 算子 $-\Delta + V$ 在合理的 $V$ 下自共轭。最重要的是,谱定理在无界设定下依旧成立——只是“函数演算”要用允许 $\lambda$ 取无穷的形式来重写。这一切的入口是把“闭”和“自共轭”作为独立于“有界”的概念固定下来,第六篇的闭图像定理已经为此做好了准备。


本系列

泛函分析 12 篇

  1. 01 泛函分析(一):度量空间 —— 距离、收敛与完备性
  2. 02 泛函分析(二):赋范空间与Banach空间
  3. 03 泛函分析(三):Hilbert 空间 —— 无限维空间中的几何
  4. 04 泛函分析(四):对偶空间与 Hahn-Banach 定理 —— 线性泛函的驯服
  5. 05 泛函分析(五):弱拓扑和弱*拓扑 —— 当范数收敛太强时
  6. 06 泛函分析(六):有界线性算子与三大定理
  7. 07 泛函分析(七):紧算子——通往有限维的桥梁
  8. 08 泛函分析(八):谱理论 —— 分解算子 当前
  9. 09 泛函分析(九):无界算子 —— 当有界性失效时
  10. 10 泛函分析(十):算子半群 — 无限维空间中的演化方程
  11. 11 泛函分析(十一):分布与Sobolev空间 — 广义解
  12. 12 泛函分析(十二):泛函分析在行动 —— 偏微分方程和量子力学

读有所得?

GitHub 关注我 → 新文周更

GitHub