系列 · 泛函分析 · 第 10 篇

泛函分析(十):算子半群 — 无限维空间中的演化方程

C₀-半群为演化方程提供了抽象框架 — Hille-Yosida 定理刻画了哪些算子生成良好定义的动力学。

$u' = Au$ 搬到无穷维#

我第一次试图把热方程 $\partial_t u = \Delta u$ 写成“无穷维 ODE”时被一个具体障碍卡住:标量 ODE $u' = au$ 的解 $u(t) = e^{at}u_0$ 我从大学一年级就会写,矩阵 ODE $u' = Au$ 用矩阵指数 $e^{tA} = \sum_n (tA)^n/n!$ 也不难——那为什么 $u' = \Delta u$ 的解不能直接写成 $e^{t\Delta}u_0$ ?尝试展开 $\sum_n (t\Delta)^n / n!$ ,每一项都是更高阶的微分算子,作用在初始条件上得到无穷阶导数——级数对一般 $L^2$ 函数完全发散。矩阵指数那一招在无穷维直接失效。

半群性质:T(s+t) = T(s)T(t)

但物理上 $e^{t\Delta}$ 这个对象显然存在——它就是热半群,对每个 $t > 0$ 由高斯核卷积给出。问题只是我用错了构造。Hille、Yosida、Phillips 的半群理论给出正确的构造:不通过 Taylor 级数定义 $e^{tA}$ ,而是通过预解算子 $(\lambda - A)^{-1}$ 的 Laplace 反变换来定义。这套构造不依赖 $A$ 有界,只要求 $A$ 满足若干谱条件(闭性、稠密定义域、合适的预解估计)。一旦满足,整个矩阵指数的语言——半群性、生成元、扰动、误差控制——都搬到无穷维。

这一篇要把这套机器讲清楚:什么是 $C_0$ -半群、生成元如何从半群读出来、Hille-Yosida 定理给出什么充分必要条件、扰动理论如何处理 $A + B$ 、热方程/波动方程/Schrödinger 方程如何统一在半群框架下。半群理论是“演化 PDE = 无穷维 ODE”这一观念的精确版本,下游所有时间依赖问题都跑在这条轨道上。

最简单的有趣的微分方程是 $u' = a u$ ,其中 $a \in \mathbb{R}$ 。解 $u(t) = e^{at} u_0$ 是如此熟悉,以至于很容易忘记它是一个结构:映射 $T(t) = e^{at}$$\mathbb{R}$ 上的一参数算子族,满足 $T(0) = I$$T(t + s) = T(t) T(s)$ 和在 $t$ 处的连续性。将 $a$ 替换为自伴随矩阵 $A$ ,你就有 $T(t) = e^{tA}$ ,即矩阵指数,它解决了系统 $u' = Au$ 。将 $A$ 替换为 Hilbert 空间上的无界算子 —— Laplacian、Schrödinger Hamiltonian 或 Fokker-Planck 算子 —— 你希望做同样的事情。但矩阵指数幂级数可能不收敛,算子可能不在整个 $H$ 上定义,普通微积分也不再适用。

Hille、Yosida 和 Phillips 发展的半群理论挽救了这种情况。它说:在适当的条件下(生成元),存在一个一参数族 $T(t)$ 满足相同的代数和连续性质,并且以精确的方式解决 $u' = A u$ 。条件由 Hille-Yosida 定理 描述,该定理刻画了强连续半群的生成元。一旦有了它,这个框架就可以用单一统一的语言解决热方程、波动方程、Schrödinger 方程以及广泛的演化 PDE。本文将对此进行介绍。

$C_0$ -半群#

$X$ 是 Banach 空间。强连续一参数半群$C_0$ -半群是一族 $\{T(t) : t \geq 0\} \subset B(X)$ ,满足:

写下三条公理之前先说明每一条想表达什么。$T(0) = I$ 说零时间什么都不做——这是“流”的零元。$T(t+s) = T(t)T(s)$ 是半群性质,等价于“先走 $s$ 再走 $t$ 等于一次走 $t+s$ ”——这是流的可加性,$\mathbb{R}^+$ 上的群运算翻译到算子上。强连续性要求初值的连续依赖:稍微变化时间 $t$ ,状态 $T(t)x$ 也只稍微变化。这三条加起来给出“足够规则”的演化,让“生成元”的概念有意义。

注意两件事。一是这族是定义在 $t \geq 0$ 上的半群,不是定义在所有 $t \in \mathbb{R}$ 上的群——这种不对称对应物理上的不可逆性。热方程是典型例子:从 $u_0$ 沿热半群向前走没问题,但向后走($t < 0$ )会让光滑函数瞬间变成奇异分布,根本不存在。$\mathcal{F}^2$ 时间反演的破坏正是耗散系统的物理标志。二是连续性要求是“强连续”,意思是逐点连续——对每个 $x$ 而言 $T(t)x$$t$ 上连续,但 $T(t)$ 作为算子在算子范数下不一定连续。这个区分在分析上很重要,下文会专门讨论。

  1. $T(0) = I$
  2. 对所有 $t, s \geq 0$$T(t + s) = T(t) T(s)$
  3. 对所有 $x \in X$$\lim_{t \to 0^+} T(t) x = x$ (在零处强连续)。

C_0 半群作用于初始状态的轨道

半群给出了映射 $t \mapsto T(t) x$ ,即初始状态 $x$轨道,在零处的强连续加上半群性质意味着对所有 $t \geq 0$ 都有强连续性:$\|T(t + h) x - T(t) x\| = \|T(t)(T(h) - I) x\| \leq \|T(t)\| \|(T(h) - I) x\| \to 0$ 。因此轨道是 $X$ 中的连续轨迹。

注意不对称性:半群仅在 $t \geq 0$ 时定义,而不是对所有 $t \in \mathbb{R}$ 。如果我们对所有 $t \in \mathbb{R}$$T(t)$ 并且 $T(t) T(-t) = I$ ,那么有一个 而不是一个半群。Hilbert 空间上的酉群特别重要 —— 它们对应于保守系统的时变。不能扩展为群的半群对应于耗散系统(热流、扩散、流体粘度)。

一个标准估计:对于 $C_0$ -半群,存在 $M \geq 1$$\omega \in \mathbb{R}$ 使得对所有 $t \geq 0$$\|T(t)\| \leq M e^{\omega t}$ 。允许的 $\omega$ 的下确界是半群的增长界$\omega \leq 0$ 的半群有界;$\omega < 0$ 的半群指数衰减;收缩半群$M = 1$$\omega \leq 0$ 的情形。

生成元#

给定 $C_0$ -半群 $T(t)$ ,其 生成元 $A$ 定义为

生成元是把“流”这件事压缩成一个静态算子的方式。给一个 $C_0$ -半群 $T(t)$ ,它描述了 $X$ 上的一族“向前演化”操作:从 $x$ 出发走 $t$ 时间得到 $T(t)x$ 。生成元 $A$ 提取这个流在 $t=0$ 处的方向场——“瞬间速度”。如果 $T(t) = e^{tA}$ 是把 $A$ 指数化得到的群(在矩阵情形下这就是矩阵指数),那么 $A$ 当然就是 $T$ 在零处的导数。无穷维情形下生成元的定义域 $D(A)$ 是真子空间——只有那些光滑到能让差商收敛的初值才进得了 $D(A)$ ,但 $D(A)$$X$ 中稠密,剩下的初值通过逼近处理。

生成元作为半群的无穷小极限

$$ A x = \lim_{t \to 0^+} \frac{T(t) x - x}{t}, $$

定义域 $D(A) = \{x \in X : \text{极限存在}\}$

强连续半群在零时刻的时间导数作为生成元

生成元是半群的“无穷小版本”,是标量指数的算子理论类比 “$a = \log T(1)$ "。两个基本事实:

  • $D(A)$$X$ 中稠密,且 $A$ 是闭算子。
  • 对于 $x \in D(A)$ ,轨道 $u(t) = T(t) x$ 可微,对所有 $t$$u(t) \in D(A)$ ,且 $u'(t) = A u(t)$

因此轨道解决了抽象 Cauchy 问题 $u'(t) = A u(t)$ ,初始条件为 $u(0) = x$ ,对任何 $x \in D(A)$ 。对于 $x \notin D(A)$ ,轨道仍然是连续的,但可能不可微。关键是 $D(A)$ 是稠密的,因此每个初始条件都可以用光滑的一个来近似。

一个小练习:对于标量例子 $T(t) = e^{at}$$\mathbb{R}$ 上,生成元是乘以 $a$ ,定义域是整个 $\mathbb{R}$ 。对于有限矩阵 $A$$T(t) = e^{tA}$ 的生成元是 $A$ ,定义域是 $\mathbb{C}^n$ 。对于 $L^2(\mathbb{R})$ 上的无界算子 $A$ ,生成元的定义域是一个适当稠密的子空间,前一篇文章中的无界算子定义域考虑再次发挥作用。

具体计算示例:Dirichlet 边界条件下的 [0, 1] 区间上的热半群#

让我通过一个完整的例子来说明。$L^2[0, 1]$ 上的 Dirichlet Laplacian 具有特征函数 $\phi_n(x) = \sqrt{2} \sin(n\pi x)$ 和特征值 $-n^2 \pi^2$$n = 1, 2, 3, \ldots$ 。热半群则为

$$ T(t) f = \sum_{n=1}^\infty e^{-n^2 \pi^2 t} \langle f, \phi_n \rangle \phi_n. $$

对于 $t > 0$ ,指数阻尼因子 $e^{-n^2 \pi^2 t}$ 消除了所有高频成分,因此无论 $f$ 有多粗糙,$T(t) f$ 都是 $C^\infty$ 的。半群对每个 $t > 0$ 都是紧的(算子是 Hilbert-Schmidt 的,奇异值迅速衰减)。这种紧性赋予了热半群显著的正则化性质。

数值上,取 $f(x) = \mathbf{1}_{[1/4, 3/4]}(x)$ 。其 Fourier 系数为 $\langle f, \phi_n \rangle = (\sqrt{2}/(n\pi))(\cos(n\pi/4) - \cos(3 n\pi/4))$ 。在 $t = 0.001$ 时,因子 $e^{-\pi^2 \cdot 10^{-3}} \approx 0.99$ 几乎保持第一模式不变,而 $e^{-100 \pi^2 \cdot 10^{-3}} \approx e^{-0.987} \approx 0.37$ 将第十模式衰减到约三分之一。到 $t = 0.1$ 时,只有前几个模式幸存。此时解显然接近低频轮廓,在 $x = 1/2$ 附近有一个单峰。

这个例子也说明了为什么 谱方法 在 PDE 中很受欢迎:当算子的精确谱展开可用时,时间演化变成了坐标上的指数乘法,这是非常简单的。挑战通常不是时间积分,而是谱展开本身,这需要显式的特征函数基(可分离几何)或数值特征值求解器(通过有限元处理一般几何)。

Hille-Yosida 定理#

该主题的定义定理。它告诉我们 确切 哪些算子是 $C_0$ -半群的生成元。

写出形式陈述前先讲一下这个定理的意义。给一个无界算子 $A$ ,我想知道 $e^{tA}$ 这个对象是否能被合理定义、能否生成一个动力学。Taylor 级数那条路对无界算子失效。Hille-Yosida 定理把这个问题翻译成预解算子 $(\lambda - A)^{-1}$ 的估计:只要 $A$ 闭且稠密定义、预解集包含正实轴、$\lambda$ 倍预解算子的范数被 1 控制,那么 $e^{tA}$ 就以收缩半群的形式存在。这个翻译让“能否求指数”这个动态问题变成一个静态的谱估计问题。

为什么是预解估计?因为 Laplace 变换。形式上 $\int_0^\infty e^{-\lambda t} e^{tA} dt = (\lambda - A)^{-1}$ ,所以预解算子就是半群的 Laplace 变换。Hille-Yosida 实际上在说:如果 Laplace 变换满足合理估计,那么逆 Laplace 变换(即半群本身)就存在并且良好。这就是为什么这个定理虽然形式看起来抽象,但内容相当直观。

Hille-Yosida 预解式界

线性算子 $A: D(A) \to X$$X$ 上的收缩 $C_0$ -半群的生成元当且仅当:

  1. $A$ 是闭的且稠密定义的。
  2. 重解集 $\rho(A)$ 包含 $(0, \infty)$
  3. 对于每个 $\lambda > 0$$\|R(\lambda; A)\| \leq 1/\lambda$ ,等价地 $\|\lambda R(\lambda; A) x\| \leq \|x\|$ 对所有 $x$ 成立。

Hille-Yosida:刻画收缩半群的生成元

这些条件是必要且充分的。正向方向是直接的:将 $T(t)$$e^{-\lambda t}$ 积分得到 $R(\lambda; A) = \int_0^\infty e^{-\lambda t} T(t) \, dt$ ,即 Laplace 变换,重解估计从 $\|T(t)\| \leq 1$ 得出。

反向方向更有趣。Yosida 的想法:定义 Yosida 近似 $A_\lambda = \lambda A R(\lambda; A) = \lambda^2 R(\lambda; A) - \lambda I$ ,这是一个 有界 算子。半群 $T_\lambda(t) = e^{t A_\lambda}$ 则是良好定义的(有界算子的矩阵指数)。可以证明当 $\lambda \to \infty$$T_\lambda(t) \to T(t)$ 在强拓扑中成立,极限就是所需的半群。整个构造是通过有界算子仔细逼近无界生成元,这是半群理论中的一个工作马模式。

一般的(非收缩)Hille-Yosida 定理将 (3) 替换为 $\|R(\lambda; A)^n\| \leq M/(\lambda - \omega)^n$ 对所有 $\lambda > \omega$$n \geq 1$ 。增长界变为 $\omega$ ,常数变为 $M$

值得标记的一个推论:Stone 定理指出,斜对称算子(即 $iA$ 自伴)生成 $C_0$ -半群当且仅当 $A$ 是斜自伴的。半群则是对所有 $t \in \mathbb{R}$ 定义的酉群 $T(t) = e^{tA}$ 。这是 Hille-Yosida 定理关于酉群的特殊情况,它使量子力学的时间演化变得严格。

生成元的扰动#

应用中的一个标准问题:给定 $C_0$ -半群的生成元 $A$ ,何时 $A + B$ 也生成半群?答案取决于 $B$ 是什么类型的扰动。

指数公式收敛

如果 $A$ 生成 $C_0$ -半群且 $B$ 是有界的,则 $A + B$ 生成 $C_0$ -半群,$T_{A+B}(t)$ 由 Dyson 级数给出:

$$ T_{A+B}(t) = \sum_{n=0}^\infty \int_{0 \leq s_1 \leq \cdots \leq s_n \leq t} T_A(t - s_n) B T_A(s_n - s_{n-1}) B \cdots B T_A(s_1) \, ds. $$

这是算子理论中的 Duhamel 公式,推广形式。它是量子力学中扰动理论的基础(扰动哈密顿量的时间演化算子的 Dyson 级数)。

如果 $A$ 生成收缩半群且 $B$ 相对于 $A$ 有界且界小于 1(即 $\|Bx\| \leq a \|Ax\| + b\|x\|$$a < 1$ ),则 $A + B$ 也生成 $C_0$ -半群。这是前一篇文章中的 Kato-Rellich 定理的类似物。它处理了广泛的物理扰动。

如果 $A$$B$ 分别生成半群且 $A + B$ (稠密定义)是半群的生成元,则

$$ T_{A+B}(t) = \lim_{n \to \infty} \left( T_A(t/n) T_B(t/n) \right)^n, $$

极限在强拓扑中。这将组合动力学分解为交替的短步骤。它是数值 PDE 中算子分裂方法的基础。

生成元的扰动理论本身是一个主要课题。全面覆盖可以参考 Engel-Nagel 的《线性演化方程的一参数半群》,这是现代标准参考书,当认真处理演化 PDE 时值得一读。

热方程#

最干净的例子。$L^2(\mathbb{R}^n)$ 上的热半群是

热方程 $\partial_t u = \Delta u$ 是半群理论最入门的例子,也是我每次重新思考“无穷维 ODE”观念时回头来用的标尺。它具备半群理论想展示的所有干净性质:生成元 $\Delta$ 自共轭、谱 $(-\infty, 0]$ 全负、半群在 $L^2$ 上收缩、平滑性瞬间生效、解可以显式写成高斯核卷积。后面所有更复杂的演化方程(Stokes、Navier-Stokes、反应扩散)在某种意义上都是“热方程加修正”,半群框架的优势就在这种复用上。

热核与热方程

$$ (T(t) f)(x) = (4\pi t)^{-n/2} \int_{\mathbb{R}^n} e^{-|x-y|^2/(4t)} f(y) \, dy. $$

热方程半群平滑初始轮廓

这是与宽度为 $\sqrt{4t}$ 的高斯热核的卷积。直接验证:$T(0) = I$ (高斯在 $t \to 0$ 时变成 delta 函数),$T(t + s) = T(t) T(s)$ (高斯卷积给出宽度相加的高斯),并且 $T(t) f \to f$$L^2$ 中当 $t \to 0^+$ 时成立(标准 mollifier 论证)。因此 $T(t)$$C_0$ -半群。

生成元是 $A = \Delta$ ,定义域为 $H^2(\mathbb{R}^n)$ 。验证方法:选取一个光滑 Schwartz 函数 $f$ ,展开热核的 Taylor 级数,并显示

$$ \frac{T(t) f - f}{t} \to \Delta f $$

$L^2$ 中当 $t \to 0^+$ 时成立。轨道 $u(t, \cdot) = T(t) f$ 则解决热方程 $\partial_t u = \Delta u$ ,初始条件为 $u(0, \cdot) = f$

热半群具有显著的平滑性质:对于任何 $f \in L^2$ (无需假设光滑性)和任何 $t > 0$ ,函数 $T(t) f$$C^\infty(\mathbb{R}^n)$ 中。高斯核如此良好,与其卷积立即成为正则化器。这是热方程是抛物型方程的核心原因 —— 时间上的小意味着空间上的光滑,立即生效。

一个数值练习:取 $f(x) = \mathbf{1}_{[-1, 1]}(x)$$\mathbb{R}$ 上。则 $T(t) f$ 是高斯核在 $[x - 1, x + 1]$ 上的积分,等于 $\frac{1}{2}(\text{erf}((x+1)/(2\sqrt{t})) - \text{erf}((x-1)/(2\sqrt{t})))$ 。在 $t = 0$ 时这是指示函数(在 $\pm 1$ 处有不连续点);在 $t > 0$ 时它是 $C^\infty$ 的,不连续性立即平滑成 $\text{erf}$ 轮廓。平滑是即时且全局的。

均值和方差图景#

热半群具有概率解释:$T(t) f = E[f(X_t) | X_0 = x]$ ,其中 $X_t$ 是从 $x$ 开始的 Brownian 运动。$X_t$ 的方差在每个坐标上是 $2t$ (在生成元是 $\Delta$ 而不是 $\Delta/2$ 的约定下),因此核随着宽度成比例于 $\sqrt{t}$ 扩散。这是 Feynman-Kac 的伪装,它是 PDE 中随机方法的基础:通过模拟 Brownian 运动来求解热方程。

$L^2$ 上的热半群也是收缩的:对所有 $t \geq 0$$\|T(t) f\|_{L^2} \leq \|f\|_{L^2}$ ,除非 $f = 0$ 时不等式严格成立。这对应于热传导的耗散性质。相比之下,Schrödinger 半群 $e^{it\Delta}$$L^2$ 上是酉的 —— 它精确地保持 $L^2$ 范数,对应于概率守恒。

解析半群:一类特殊半群#

$C_0$ -半群 $T(t)$解析的,如果它扩展到扇形 $\Sigma_\theta = \{z \in \mathbb{C} : |\arg z| < \theta\}$ 上的全纯函数 $T(z)$ ,对于某个 $\theta > 0$ ,且 $\|T(z)\|$ 在每个子扇形上是有界的。解析半群具有显著的平滑性质:对每个 $k$ 和每个 $t > 0$$T(t) X \subset D(A^k)$ ,且轨道在时间上是实解析的。

热半群是标准的解析半群:它扩展到 $\text{Re}(z) > 0$ 时的 $T(z) = e^{z \Delta}$ ,高斯核 $G_z(x) = (4\pi z)^{-n/2} e^{-|x|^2/(4z)}$ 在右半平面内是解析的。大多数抛物方程给出解析半群;它们的生成元通过谱位于扇形内且在扇形补集上有 $\|R(\lambda; A)\| \leq C/|\lambda|$ 形式的重解估计来刻画。

解析半群是 PDE 中 最大正则性 结果的最清晰设置:抛物方程 $u' = Au + f$ 的解具有与 $f$ 相同的正则性(模导数),前提是 $A$ 生成解析半群。这是抛物方程的 $L^p$ 理论的基础,也是半群理论是抛物 PDE 的正确框架的主要原因之一。

互补类是 收缩半群(包括 Stone 定理中的酉群和概率中的 Markov 半群)。收缩半群通常不是解析的 —— Schrödinger 半群 $e^{it\Delta}$ 是酉的但在 $t$ 上不是解析的,因为 $\sigma(i\Delta) = i \cdot [0, \infty)$ 位于虚轴上,这是扇形的边界而不是任何扇形的内部。不同的物理(抛物 vs 双曲 vs 酉)给出不同的半群类,技术工具也相应不同。

波动方程#

波动方程需要稍微重新表述,因为它们是二阶的。将 $\partial_t^2 u = \Delta u$ 写成一阶系统:令 $v = \partial_t u$ ,系统为

热方程是抛物的,半群在 $L^2$ 上收缩、解析、瞬间光滑。波动方程不一样——它是双曲的,能量守恒,解保持初始的正则性而不增不减。在半群框架下这种区别表现为生成元的谱位置:热方程生成元 $\Delta$ 的谱在负实轴上,对应衰减;波动方程生成元的谱在虚轴上,对应振荡。两种谱位置给两种动力学,半群理论用同一套语言区分它们。

写成一阶系统是处理二阶方程的标准技巧,让二阶 ODE/PDE 看起来像一阶 ODE。代价是状态空间从“函数”变成“函数对”——位置 $u$ 加速度 $v = \partial_t u$ 一起记录系统状态。能量空间 $H^1 \oplus L^2$ 是这种表述的自然 Hilbert 空间,能量泛函 $\|\nabla u\|^2 + \|v\|^2$ 给出能量守恒——它在演化下不变,所以半群 $T(t)$ 在这个能量范数下是幺正的。

$$ \partial_t \begin{pmatrix} u \\ v \end{pmatrix} = \begin{pmatrix} 0 & I \\ \Delta & 0 \end{pmatrix} \begin{pmatrix} u \\ v \end{pmatrix}. $$

这是能量空间 $H^1 \oplus L^2$ 上的抽象 Cauchy 问题。生成元是上面的矩阵算子,由此产生的半群(实际上是群,因为它酉的)是波动半群。能量 $\|\nabla u\|_{L^2}^2 + \|v\|_{L^2}^2$ 是守恒的,这在能量范数下给出酉性。

大多数双曲 PDE 可以类似地表示为半群。半群框架涵盖了波动方程、Klein-Gordon 方程、Maxwell 方程等等。每个都成为“$u' = A u$ 且生成元适当”的特例,一般的半群理论(Hille-Yosida、Trotter、扰动理论)统一适用。

Markov 半群和随机过程#

函数空间上的半群 $T(t)$Markov 半群,如果它是正的($f \geq 0 \Rightarrow T(t) f \geq 0$ )且保持常数($T(t) 1 = 1$ )。这些通过 $T(t) f(x) = E_x[f(X_t)]$ 对应于 Markov 过程。生成元是过程的 无穷小生成元,由 Itô 公式在定义域的光滑部分给出。

我第一次发现“半群”和“Markov 过程”是同一件事时被这个对应震到。Markov 过程是概率上的随机轨迹——粒子在 $\mathbb{R}^n$ 上随机游走、扩散、跳跃;半群是算子上的“流”——一族满足 $T(t+s) = T(t)T(s)$ 的演化算子。这两件事看似一个是随机的、一个是确定的,但通过 $T(t)f(x) = E_x[f(X_t)]$ 这个对应它们一一对应:$T$ 把“随机轨迹的期望”作为一个确定的算子作用在初始函数 $f$ 上,期望抹去了随机性,留下了确定的演化。

这种对应让概率论和泛函分析互相借力。从概率到分析:Itô 公式直接给出生成元 $A$ 的具体形式(比如布朗运动是 $\frac{1}{2}\Delta$ ,OU 过程是 $\frac{1}{2}\Delta - x\cdot\nabla$ ),不需要解析地构造。从分析到概率:Hille-Yosida 给出过程存在性(哪些 $A$ 真的对应一个 Markov 过程)、谱隙给出混合速率(过程多快忘记初始分布)、对数 Sobolev 不等式给出集中估计(过程的分布多集中)。这是“算子半群=Markov 过程”这条字典在每个方向上都被反复利用。

示例:

  • Brownian 运动$\mathbb{R}^n$ 上的生成元是 $\frac{1}{2} \Delta$ (注意相对于热半群的 $\Delta$$1/2$ 因子,取决于约定)。
  • Ornstein-Uhlenbeck 过程 的生成元是 $\frac{1}{2} \Delta - x \cdot \nabla$ (向原点漂移)。
  • 反射 Brownian 运动 在半线上有生成元 $\frac{1}{2} d^2/dx^2$ ,在 $0$ 处有 Neumann 边界。
  • 被杀 Brownian 运动 的生成元是 $\frac{1}{2} \Delta$ ,在杀死集合上有 Dirichlet 边界。
  • Lévy 过程 的生成元是 Fourier 乘子(Lévy 符号),推广了扩散。

半群框架是几乎所有概率论“算子方面”的正确设置。Hille-Yosida 定理成为 Markov 过程的生成定理 —— 给定满足正性和收缩条件的算子 $A$ ,存在一个半群生成元为 $A$ 的随机过程。这是解析算子理论和概率过程理论之间的桥梁。

一个小的数值示例:OU 过程生成元 $A f = \frac{1}{2} f''(x) - x f'(x)$$L^2(\mathbb{R}, e^{-x^2/2} dx)$ 上有 Hermite 多项式 $H_n(x)$ 作为特征函数,特征值为 $-n/2$ 。OU 半群则为 $T(t) f = \sum_n e^{-nt/2} \langle f, H_n \rangle H_n / n!$ ,具有明确的衰减速率 $1/2$ (OU 过程的 谱隙)。此衰减速率直接转化为 OU 过程收敛到其平稳分布的速率。

长时间行为和谱隙#

$t \to \infty$$T(t) x$ 的渐近行为由 $A$ 的谱控制。对于谱 $\sigma(A) \subset (-\infty, 0]$ 的自伴 $A$ ,轨道按 $\|T(t) x\| \leq e^{-\alpha t} \|x\|$ 衰减,其中 $-\alpha = \sup\{\text{Re}(\lambda) : \lambda \in \sigma(A)\}$谱隙 $\alpha$ 是返回平衡的指数速率。

半群的稳定性分类

在 Markov 链理论中,生成元的谱隙是混合速率 —— 链多快忘记其初始分布。Poincaré 不等式 $\text{Var}_\mu(f) \leq C \int |\nabla f|^2 d\mu$ ,其中 $\mu$ 是不变测度,正是 $L^2(\mu)$ 上扩散算子的谱隙条件。常数 $C$ 是谱隙的倒数。

更精细的界,对数 Sobolev 不等式 控制相对熵收敛而不是 $L^2$ 收敛,给出更尖锐的集中估计。Bakry-Émery 准则指出,如果某种曲率-维数界成立,则扩散满足对数 Sobolev 不等式,这是现代 Ricci 曲率和度量测度空间上梯度流理论的算子理论基础。所有这些都基于相同的半群框架。

对于非自伴生成元,谱隙和渐近行为更为微妙。谱半径通常不控制 $T(t)$ 的算子范数 —— 在指数衰减之前可能会出现 瞬态增长(Trefethen 和 Embree 的 伪谱 捕捉了这一点)。在流体力学应用中,线性化的 Navier-Stokes 生成元高度非正规,来自特征向量非正交性的瞬态增长在稳定性理论中起着重要作用。

重解表示:从 $A$ 恢复 $T(t)$ #

一个有用的技术工具:给定生成元 $A$ ,能否显式写出半群 $T(t)$ ?Laplace 变换恒等式

$$ R(\lambda; A) = \int_0^\infty e^{-\lambda t} T(t) \, dt $$

逆变换为 $T(t)$ 的逆 Laplace 变换/围道积分表达式。

重解表示:从 $A$
 的重解恢复 $T(t)$

对于解析半群(其生成元的谱在左半平面且重解估计扩展到扇形),公式为

$$ T(t) = \frac{1}{2\pi i} \int_\Gamma e^{\lambda t} R(\lambda; A) \, d\lambda, $$

其中 $\Gamma$ 是围绕 $A$ 的谱在左半平面的围道。这是 Dunford 公式 对算子指数的推广,它推广了矩阵 $e^{tA}$ 的围道积分表示。

该公式主要用于理论用途 —— 它允许将重解估计转移到半群估计。对于半群的实际计算,通常有显式公式(如热核)或数值方法(Crank-Nicolson、指数积分器)。但该公式使生成元和半群之间的抽象对应关系变得精确。

半群下的时间演化#

半群下向量的时间演化

半群在 Banach 空间上定义了一个流,每个初始条件描绘出一条连续轨迹。对于 $x \in D(A)$ ,这条轨迹是可微的;对于一般的 $x \in X$ ,至少是连续的。轨迹的衰减或增长由 $A$ 的谱性质控制:

  • 如果 $\sigma(A) \subset \{\text{Re}(\lambda) \leq 0\}$$A$ 是收缩半群的生成元,则 $T(t)$ 有界。
  • 如果 $\sigma(A) \subset \{\text{Re}(\lambda) \leq -\alpha < 0\}$ ,则在适当条件下(例如正规性),$T(t)$ 指数衰减。
  • 如果 $A$ 是斜自伴的(Stone 定理情况),则 $T(t)$ 是酉的并保持所有由内积导出的范数。

$A$ 的谱性质与 $T(t)$ 渐近行为之间的联系是演化方程稳定性理论中的一个重要主题。对于谱离散且有上界的自伴 $A$$T(t)$ 的主导衰减速率由 $A$ 的最大(最负)特征值设定 —— 谱隙在 Markov 链和随机过程的收敛理论中无处不在(Poincaré 不等式、Cheeger 不等式),它们追溯到相同的算子理论机制。

Stone 定理#

酉情况非常重要,值得单独陈述。

$\{U(t) : t \in \mathbb{R}\}$ 是 Hilbert 空间 $H$ 上的强连续一参数酉群。存在唯一的自伴算子 $A$ 使得对所有 $t$$U(t) = e^{itA}$

反之,每个自伴算子 $A$ 通过谱定理生成酉群 $U(t) = e^{itA}$$U(t) = \int e^{it\lambda} dE(\lambda)$ )。

自伴算子与一参数酉群之间的双射是算子理论中最简洁的结果之一。它是量子力学中“可观测量生成对称性”的严格表述:Hamiltonian 生成时间演化,动量生成空间平移,角动量生成旋转。群律 $U(t + s) = U(t) U(s)$ 是“时间/空间/旋转角度的数量”的可加性,强连续性是自然的物理假设,即小动作产生小变化。

我将在第 12 章详细讨论 Stone 定理,其中它直接应用于 Schrödinger 方程。

示例目录#

一些经典的半群及其生成元。

经典半群:热、输运、Schrödinger

热半群$L^2(\mathbb{R}^n)$ 上:$T(t) f = G_t * f$ ,生成元 $\Delta$$H^2$ 上。收缩,正则化。

输运半群$L^2(\mathbb{R})$ 上:$(T(t) f)(x) = f(x - t)$$t \geq 0$ ,生成元 $-d/dx$$H^1$ 上。等距(范数保持)。

Schrödinger 半群$L^2(\mathbb{R}^n)$ 上:$T(t) f = e^{it\Delta} f$ ,生成元 $i\Delta$$H^2$ 上。酉群(扩展到 $t \in \mathbb{R}$ )。

Ornstein-Uhlenbeck 半群$L^2(\mathbb{R}^n, e^{-|x|^2/2})$ 上:$(T(t) f)(x) = E[f(e^{-t} x + \sqrt{1 - e^{-2t}} G)]$ 对标准 Gaussian $G$ ,生成元 $A = \Delta - x \cdot \nabla$ 在适应于 Gaussian 测度的 Sobolev 空间上。收缩,遍历。

Markov 半群$L^p(\Omega, \mu)$ 上对于 Markov 链或过程:$T(t) f(x) = E_x[f(X_t)]$ 。生成元是通过 Itô 公式定义的过程的无穷小生成元。

这些涵盖了扩散、漂移、振荡和随机动力学 —— 实质上是数学物理和概率中演化 PDE 的整个动物园。

数值方面:时间步进#

实际上,当数值求解 PDE 时,隐式地近似了半群。基本方案:

  • 前向 Euler: $u_{n+1} = (I + \tau A) u_n$ ,相当于近似 $T(\tau) \approx I + \tau A$ 。条件稳定;对于一维热方程,要求 $\tau \leq Ch^2$ ,其中 $h$ 是空间网格大小(CFL 条件)。
  • 后向 Euler: $u_{n+1} = (I - \tau A)^{-1} u_n$ ,近似 $T(\tau) \approx (I - \tau A)^{-1}$ 。无条件稳定,一阶精度。
  • Crank-Nicolson: $u_{n+1} = (I - \tau A/2)^{-1}(I + \tau A/2) u_n$ ,近似 $T(\tau) \approx \text{Padé}_{1,1}(\tau A)$ 。无条件稳定,二阶精度。
  • 指数积分器: $u_{n+1} = e^{\tau A} u_n$ 精确,通过 Krylov 子空间方法或直接指数化计算。高阶精度,当 $A$ 有宽谱范围时有用。

这些方案的收敛理论是半群理论的直接结果。Lax 等价定理 表明:对于适定的 Cauchy 问题(即由 $C_0$ -半群给出解的问题),一致的有限差分格式是收敛的当且仅当它是稳定的。半群框架是证明这一点的正确设置,因为“适定的 Cauchy 问题”恰好是“算子生成 $C_0$ -半群”。

工作示例:带扩散的人口动力学#

考虑 $\partial_t u = \Delta u + r u(1 - u)$$L^2(\Omega)$ 上,其中 $\Omega$ 是带有 Dirichlet 边界的有界区域,$r > 0$ 是增长率。在 $u = 0$ 附近的线性化生成元为 $\Delta + r I$ 。半群是 $T(t) = e^{rt} S(t)$ ,其中 $S(t)$$\Omega$ 上的 Dirichlet 热半群。谱分析:$\Omega$ 上的 $\Delta$ 有特征值 $-\lambda_n \to -\infty$ ,因此线性化有特征值 $-\lambda_n + r$ ,如果 $r > \lambda_1$ (主 Dirichlet 特征值),则可能是正的(不稳定)。

这是 Fisher-KPP 方程,其动力学 —— 以速度 $2\sqrt{r}$ 传播的入侵前沿、常数状态 $u = 1$ 的渐近稳定性、指数暂态 —— 都可以从线性化的谱分析得出。半群框架为这一切提供了一致的语言,从解的存在性到长时间行为。

一个小的数值观察:如果你在一维区间上从一个凸起的初始条件开始模拟这个方程,你会看到凸起首先衰减(如果区间相对于 $1/\sqrt{r}$ 足够小,扩散主导,零状态稳定),然后会进入一个过渡阶段,凸起的形状变成行波前沿,最终以 $2\sqrt{r}$ 的速度向两端铺开,把零状态推到 $u = 1$ 。这三段——衰减、转折、行波——分别对应线性化谱的三种情形:所有特征值为负、最大特征值穿过零、连续谱中的“边缘振荡”决定行波速度。半群理论让我可以单独分析每一段,再把它们拼起来。

为什么这很重要#

算子半群把无穷维线性 ODE 写成了和有限维一样的形式:$u(t) = T(t) u_0$ 。生成元 $A$ 扮演矩阵的角色,谱 $\sigma(A)$ 决定长时间行为,预解式 $R(\lambda; A) = (\lambda I - A)^{-1}$ 是分析工具。整个 PDE 抽象理论——抛物方程的存在唯一性、波动方程的能量守恒、量子动力学的幺正演化、Markov 过程的时间演化——都可以用这一套语言统一表述。

第八篇的谱定理在这里是发动机:自共轭算子 $A$ 的谱测度让 $e^{tA}$ 直接通过函数演算定义,性质(自共轭性、正性、迹类)从谱测度立即读出。第九篇的无界自共轭算子是这套机器的核心输入:物理上的 Hamilton 算子 $-\Delta + V$ 经过 Friedrichs 延拓变成自共轭,立即生成一个幺正群——这就是 Stone 定理给出的 Schrödinger 动力学。

第十二篇会把这套语言用到具体的应用上:椭圆边值问题用 Lax-Milgram 解、变分极小化用紧嵌入提供存在性、量子力学的演化用 Stone 定理写成 $e^{-itH/\hbar}$ 。一切都是这一节准备好的。

反例:热半群不能反向时间演化#

热半群 $T(t) = e^{t\Delta}$ 只对 $t \geq 0$ 定义。把它"延拓到 $t < 0$ “会失败——这条不对称是耗散动力学的核心特征。

具体反例:取 $u_0(x) = e^{-x^2}$$\mathbb{R}$ 上。Fourier 变换 $\hat u_0(\xi) = \sqrt{\pi} e^{-\xi^2/4}$ 。热半群在 Fourier 空间是乘以 $e^{-t\xi^2}$ ,所以 $\widehat{T(t) u_0}(\xi) = \sqrt{\pi} e^{-(t + 1/4)\xi^2}$

$t \geq 0$$T(t) u_0(x) = (1 + 4t)^{-1/2} e^{-x^2/(1+4t)}$ ,是 $L^2$ 函数,光滑。

$t = -1/4$$\widehat{T(-1/4) u_0}(\xi) = \sqrt{\pi}$ ,常数。这对应一个 $\delta$ 分布(不是 $L^2$ 函数)——已经离开 $L^2$ 函数空间。

$t < -1/4$$\widehat{T(t) u_0}(\xi) = \sqrt{\pi} e^{|t+1/4|\xi^2}$ 在高频指数增长,根本不是缓增分布——这种"反向热"对象在任何合理函数空间里都不存在。

教训:反向热方程是不适定的(Hadamard 不适定),不是因为方程"难"而是因为反向演化要求把高频信息从无穷小的振幅恢复到指数大的振幅,任何数值噪音都会爆炸。半群理论里 $T(t)$ 只在 $t \geq 0$ 上良定义对应物理上的不可逆性——熵增加方向。Stone 定理给的酉群(如 Schrödinger 半群 $e^{-itH/\hbar}$ )反过来:可以双向演化,因为它是幺正的,频率被相位旋转而不是放大或缩小。耗散和保守的区别在半群理论里是"半群($t \geq 0$ )“和"群($t \in \mathbb{R}$ )“的区别。

反例:Trotter 公式需要核心条件#

Trotter 公式 $e^{t(A+B)} = \lim_n (e^{tA/n} e^{tB/n})^n$ 看起来像矩阵指数的 Lie 公式,但搬到无界算子需要更细致的条件。

具体反例:取 $A = i \frac{d^2}{dx^2}$$B = i V$ (势能算子)在 $L^2(\mathbb{R})$ 上,$V$$L^\infty$ 函数。这两者都是斜自伴(生成幺正群)。但若 $\mathcal{D}(A) \cap \mathcal{D}(B)$ 不是 $A + B$ 的核(即 $A + B$ 在这上面不本质自伴),那么 Trotter 公式给出的极限可能不是 $e^{t(A+B)}$ ,而是另一个自伴延拓的指数。Reed-Simon 卷四给出了具体反例:$V$ 在零附近振荡足够快时,$A + B$ 有多个不同的自伴延拓,Trotter 极限取的是哪一个不由公式本身决定。

教训:写 $e^{t(A+B)} = \lim e^{tA/n} e^{tB/n}$ 看似无害,要严格需要先验证 $A + B$ 自伴(或本质自伴)于公共定义域。Kato-Rellich 定理是验证这条件的标准工具,第九篇的内容在这里直接被引用。物理学家常常默默假设这一切都成立——通常确实成立,但严格用 Trotter 公式做数值分析时需要核对。

常见陷阱:把"强连续"当成"算子范数连续”#

$C_0$ -半群的”$C_0$ “是"强连续”(strongly continuous),意思是对每个 $x$$T(t) x \to x$$t \to 0^+$ 。这等于 $T(t) \to I$ 在算子范数下。

具体反例:$L^2[0, 1]$ 上的左移半群 $(T(t) f)(x) = f(x + t)$ (约定 $f$ 周期延拓)。对每个固定 $f$$\|T(t) f - f\|_2 \to 0$$t \to 0$ (强连续)。但 $\|T(t) - I\| = 2$ 对所有 $t > 0$ (算子范数永远不收敛到 $0$ )——证明:取 $f$ 是窄高斯,$T(t) f$ 把它平移 $t$ ,两者支撑不重叠时 $\|T(t) f - f\|_2 = \sqrt{2} \|f\|_2$ ,归一化后给 $\|T(t) - I\| \geq \sqrt{2}$ ;细化的论证给 $2$

第二个陷阱:算子范数连续半群(uniformly continuous semigroup)有界生成元,对应有限维或微扰理论的特殊情形。$C_0$ -半群一般有无界生成元,无穷维 PDE 的所有半群都是 $C_0$ 但非算子范数连续。把这两件事混淆,PDE 半群的结论会被错误地应用——比如尝试用算子范数连续半群的有界生成元定理去描述 Laplacian。第十一篇的 Sobolev 设定下"嵌入是紧的"和"算子是紧的"会再次重复这种"逐点 vs 一致"的对照。

下一步#

到这里为止,我所有的“函数空间”都是 Banach 或 Hilbert 空间——元素是真正的函数,可以逐点定义(也许至多在零测集上修改)。但 PDE 的现代理论需要一个更宽的设定,里面允许“不是函数的函数”——比如 Dirac $\delta$ 函数、单点处的微分、$|x|$ 在原点的二阶导数。

下一篇引入分布Sobolev 空间。分布是把函数推广到“可以与测试函数配对”的对偶对象,在分布意义下任何函数都可以求任意阶导。Sobolev 空间 $W^{k, p}$ 是“$k$ 阶(分布)导数都在 $L^p$ 中”的函数构成的 Banach 空间,它把 PDE 弱解放到一个可分析的舞台上:$H^1$ 上 Lax-Milgram 给出椭圆方程的存在性,$H^1_0$ 上的紧嵌入给出非线性 PDE 的紧致性方法,$L^2$ -能量估计在 Sobolev 范数下变成定量的存在性证明。把第六篇的三大定理、第七篇的紧算子、第十篇的半群、本篇的谱论都放进 Sobolev 框架里,就得到了一个能把抽象泛函分析翻译成具体 PDE 估计的工具箱。这是迈向第十二篇“应用”的最后一步。


本系列

泛函分析 12 篇

  1. 01 泛函分析(一):度量空间 —— 距离、收敛与完备性
  2. 02 泛函分析(二):赋范空间与Banach空间
  3. 03 泛函分析(三):Hilbert 空间 —— 无限维空间中的几何
  4. 04 泛函分析(四):对偶空间与 Hahn-Banach 定理 —— 线性泛函的驯服
  5. 05 泛函分析(五):弱拓扑和弱*拓扑 —— 当范数收敛太强时
  6. 06 泛函分析(六):有界线性算子与三大定理
  7. 07 泛函分析(七):紧算子——通往有限维的桥梁
  8. 08 泛函分析(八):谱理论 —— 分解算子
  9. 09 泛函分析(九):无界算子 —— 当有界性失效时
  10. 10 泛函分析(十):算子半群 — 无限维空间中的演化方程 当前
  11. 11 泛函分析(十一):分布与Sobolev空间 — 广义解
  12. 12 泛函分析(十二):泛函分析在行动 —— 偏微分方程和量子力学

读有所得?

GitHub 关注我 → 新文周更

GitHub