系列 · 泛函分析 · 第 2 篇

泛函分析(二):赋范空间与Banach空间

范数公理、经典例子、有限维空间中范数的等价性、完备性及其重要性、Schauder基、商空间以及可分性的作用。

度量不够用的那一刻#

我第一次写下“两个函数之间的距离”时,就把度量空间当成 $\mathbb{R}^n$ 的脱壳版本来用——直到我想做最朴素的事:把两个向量加起来,再问加完之后离原点有多远。度量公理里没有“加法”这件事;它只回答“两点相距多少”。我可以在度量空间里收敛,却不能在度量空间里把收敛的两个序列相加再统一估计范数。这个小小的失能让我意识到,度量并不知道自己活在向量空间上。

赋范空间补的就是这一刀。范数是“从原点出发的距离”,而向量空间结构告诉我加法和数乘如何改变这个距离。两件事拼起来给出度量没有的三个好处:齐次性 $\|\alpha x\| = |\alpha|\|x\|$ 让我能控制缩放,平移不变性 $d(x+z, y+z) = d(x,y)$ 让原点不再特殊,闭子空间在商之后还是赋范空间。它们看似小事,却正是后面所有“算子范数”“对偶配对”“级数展开”得以成立的基础。

完备的赋范空间叫 Banach 空间。完备性这一条单独看像是技术细节,本节讲完会变成第六篇三大定理、第七篇紧算子、第八篇谱论里反复用到的关键假设。Banach 空间是泛函分析的“出生地”,不少抽象论证都是先在 Banach 上写出来,再特化到 Hilbert 或更具体的函数空间。

为什么范数不仅仅是戴着帽子的度量#

不同 p 值下 l^p 空间的单位球

在第一篇文章中,度量是一个集合上的独立函数,没有代数结构。这种一般性带来了拓扑和完备性,但对代数没有任何回馈。一旦我愿意假设底层集合是向量空间,一个更刚性的对象就变得可用:范数,一个定义在空间上的非负函数,其诱导的度量 $d(x,y) = \|x - y\|$平移不变的正齐次的

平移不变性 — $d(x + z, y + z) = d(x, y)$ — 听起来像是一个细节问题,但它使度量对原点的位置视而不见,这种视而不见让我可以将线性映射与度量参数组合在一起。正齐次性 — $\|\alpha x\| = |\alpha| \|x\|$ — 提供了一个纯度量所缺乏的数量缩放规则。这些特性共同将度量向量空间转变为有界线性算子的自然家园,这是后续每篇文章的主角。

在赋范空间而不是一般的度量空间中工作时,尽管只增加了几个公理,几何结构却变得更加刚性。例如,赋范空间的每个闭子空间都继承了赋范结构(这在度量空间中也是显而易见的),但在赋范空间中,闭子空间的也是一个赋范空间 —— 在纯度量世界中没有类似的商构造。线性泛函在任何向量空间中都存在,但在赋范空间中可以问它们是否连续,答案变成了一个深刻的理论(第四篇文章)。这篇文章构建了基本词汇。

范数公理#

写出三条公理之前先讲一下它们各自做什么。正定性 $\|x\| = 0 \iff x = 0$ 让范数能区分零向量和非零向量——这是所有“是否相等”问题的基础。正齐次性 $\|\alpha x\| = |\alpha|\|x\|$ 让我能控制缩放——这是“范数是从原点出发的距离”这一物理直觉的精确表述,也是后面定义算子范数 $\|T\| = \sup_{\|x\|=1}\|Tx\|$ 的前提。三角不等式 $\|x+y\| \leq \|x\|+\|y\|$ 是和平形成线性结构的最低要求——它让加法在范数下连续、让级数收敛有意义、让“两个有限的东西加起来还是有限的”成立。

公理就这三条,故意写得很弱。这是因为我希望同一个定理同时适用于 $\mathbb{R}^n$ 上的 $\ell^p$ 范数($1 \leq p \leq \infty$ )、$L^p$ 函数空间、连续函数空间 $C[a,b]$ 、Banach 空间之间的有界算子空间 $B(X,Y)$ 等等。每一种具体范数都有自己的几何($\ell^1$ 是菱形单位球、$\ell^\infty$ 是方形、$\ell^2$ 是圆),但它们共享这三条公理,所以共享一切只用公理推出的定理。这就是泛函分析的杠杆:写一遍证明,套用十次。

$V$$\mathbb{R}$$\mathbb{C}$ 上的向量空间。$V$ 上的一个范数是满足以下条件的函数 $\|\cdot\|: V \to [0, \infty)$

有限维中的范数等价性

  1. $\|x\| = 0 \iff x = 0$ (正定性)。
  2. $\|\alpha x\| = |\alpha|\, \|x\|$ (正齐次性)。
  3. $\|x + y\| \leq \|x\| + \|y\|$ (三角不等式)。

赋范空间是一个带有范数的向量空间。范数诱导了一个度量 $d(x, y) = \|x - y\|$ ,该度量自动满足四个度量空间公理(通过计算),因此每个赋范空间都是度量空间。Banach空间是完备的赋范空间。

注意公理的数量很少。与内积(第三篇文章)相比,范数是简朴的 —— 没有公理强制平行四边形法则,也没有公理强制单位球是圆的。因此,大多数赋范空间不是Hilbert空间,来自 $\mathbb{R}^n$ 的大部分几何直觉需要验证而不是假设。

经典例子#

  • $\mathbb{R}^n$ 中的 $\|x\|_p = \big(\sum |x_i|^p\big)^{1/p}$ 对于 $1 \leq p < \infty$ ,以及 $\|x\|_\infty = \max_i |x_i|$
  • 序列空间 $\ell^p = \{ x = (x_n) : \sum |x_n|^p < \infty \}$ 带有 $\|x\|_p = (\sum|x_n|^p)^{1/p}$ ,以及 $\ell^\infty$ 中的有界序列带有 $\|x\|_\infty = \sup |x_n|$
  • 连续函数 $C[a,b]$ 带有 $\|f\|_\infty = \sup_{t \in [a,b]} |f(t)|$
  • Lebesgue空间 $L^p[a,b] = \{ f : \int_a^b |f|^p < \infty \}$ 模去几乎处处相等,带有 $\|f\|_p = \big(\int |f|^p\big)^{1/p}$
  • 有界连续函数 $C_b(\mathbb{R})$ 带有上确界范数。
  • 收敛到 $0$ 的序列空间 $c_0$ ,带有上确界范数。
  • 赋范空间之间的有界线性算子 $B(X, Y)$ ,带有算子范数 $\|T\| = \sup_{\|x\| \leq 1} \|Tx\|$

Minkowski不等式(即 $\|\cdot\|_p$ 的三角不等式)和Hölder不等式($\sum |x_n y_n| \leq \|x\|_p \|y\|_q$ 对于 $1/p + 1/q = 1$ )是证明这些是范数的主要工具。两者都可以通过归结为 $[0, \infty)$ 上的凸函数 $t \mapsto t^p$ 来证明。

l1, l2 和 l-infinity 范数下的 R^2 单位球

数值示例#

$x = (1, 2, 2) \in \mathbb{R}^3$ 。则 $\|x\|_1 = 5$$\|x\|_2 = \sqrt{1 + 4 + 4} = 3$$\|x\|_\infty = 2$ 。一般不等式 $\|x\|_\infty \leq \|x\|_2 \leq \|x\|_1$ 成立:$2 \leq 3 \leq 5$ 。关系 $\|x\|_2 \leq \sqrt{n}\|x\|_\infty$ (这里 $\sqrt{3} \cdot 2 \approx 3.46 \geq 3$ )和 $\|x\|_1 \leq \sqrt{n}\|x\|_2$ (这里 $\sqrt{3} \cdot 3 \approx 5.2 \geq 5$ )成立,因为所有 $\ell^p$ 范数在 $\mathbb{R}^n$ 上最多相差 $n^{1/p - 1/q}$ 因子。这个等价性是下一个定理;在无限维情况下它失效。

有限维空间上的所有范数都是等价的#

$$C_1 \|x\|_a \leq \|x\|_b \leq C_2 \|x\|_a \quad \text{对于所有 } x \in V.$$

范数的等价性正是诱导拓扑的等价性:一个序列在一个范数下收敛当且仅当在另一个范数下也收敛。

Banach(完备)vs 不完备赋范空间

可以证明,有限维向量空间上的任意两个范数都是等价的。

证明概要。$V$$n$ 维的,基为 $e_1, \ldots, e_n$ ,并在坐标中定义 $\|x\|_2 = \big(\sum |x_i|^2\big)^{1/2}$ 。设 $\|\cdot\|$ 是任何其他范数。写成 $x = \sum x_i e_i$ 并使用三角不等式和齐次性得到 $\|x\| \leq \sum |x_i| \|e_i\| \leq C_2 \|x\|_2$ 对于 $C_2 = (\sum \|e_i\|^2)^{1/2}$ (Cauchy-Schwarz 不等式)。对于下界,$\|\cdot\|: (V, \|\cdot\|_2) \to \mathbb{R}$ 是连续的(由上界给出),单位球 $S = \{ x : \|x\|_2 = 1 \}$$\|\cdot\|_2$ 下是紧的(在有限维下闭且有界)。因此 $\|\cdot\|$$S$ 上达到最小值 $C_1 > 0$ ,并且齐次性给出 $\|x\| \geq C_1 \|x\|_2$ 在整个 $V$ 上。$\square$

证明依赖于单位球的紧性 —— 这种紧性在无限维情况下失效。因此,所有范数的等价性确实是有限维定理。

有限维空间上的所有范数都是等价的

为什么这很重要#

在有限维情况下,你可以选择任何方便计算的范数。拓扑、收敛序列、闭集、连续映射 —— 所有这些都是相同的,无论选择哪种范数。这就是为什么初等线性代数从不问你指的是哪种范数:任何范数都给出了 $\mathbb{R}^n$ 的标准拓扑。理解无限维的第一个要点是这种自由度消失了。在 $C[0,1]$ 上选择 $L^2$$L^1$$L^\infty$ 会产生三种真正不同的拓扑、三种真正不同的完备化和三种真正不同的定理。选错范数是研究生浪费时间最常见的原因之一。

第二个后果:有限维赋范空间之间的每个线性映射都是连续的。实际上,在坐标中,映射由矩阵给出,所有矩阵元素都被算子范数限制,并且范数的等价性意味着一组坐标函数的连续性意味着任何其他组的连续性。在无限维情况下,线性映射可以是不连续的。微分算子 $D: C^1[0,1] \to C[0,1]$$f \mapsto f'$ ,从 $C^1$$C$ 是有界的,但如果在其定义域上加上上确界范数 —— 假装在稠密子空间 $C^1[0,1]$ 上定义 $D: C[0,1] \to C[0,1]$ —— 它是无界的:$\sin(n t)$ 的上确界范数为 $1$ ,但其导数的上确界范数为 $n$ 。第九篇文章将详细讨论无界算子。

$\ell^p$ 层次结构和包含链#

对于序列空间,包含链 $\ell^1 \subset \ell^2 \subset \cdots \subset \ell^\infty$ 成立(严格包含)。推理很简单:如果 $\sum |x_n|^p$ 收敛,则 $|x_n| \to 0$ ,所以最终 $|x_n| \leq 1$ ,因此对于 $q \geq p$$|x_n|^q \leq |x_n|^p$$\sum |x_n|^q$ 的尾部被 $\sum |x_n|^p$ 控制。所需的常数因子使包含连续:当 $x \in \ell^p$ 时,$\|x\|_q \leq \|x\|_p$ 对于 $q \geq p$

Schauder 基逼近

对于有限测度空间上的Lebesgue函数空间(如 $L^p[0,1]$ ),包含方向相反:当 $q \geq p$ 时,$L^q[0,1] \subset L^p[0,1]$ ,通过Hölder不等式应用于 $|f|^p \cdot 1$ 。在非有限测度空间(如 $\mathbb{R}$ )上,两种包含都不成立 —— 函数 $1/(1 + |t|)$$p > 1$ 时属于 $L^p(\mathbb{R})$ 但在 $p = 1$ 时不属于,而像 $|t|^{-1/p}$$0$ 附近发散的函数不属于任何 $q > p$$L^q$ 。因此 $L^p$ 包含是微妙的,取决于测度。对于序列空间,计数测度是无限的,但每个单点集的测度为 $1$ ,只有“无穷远处的衰减”方向重要,因此包含链简单。

序列空间的包含链 l^1 ⊂ l^2 ⊂ … ⊂ l^infinity

数值示例#

取调和级数 $x_n = 1/n$ 。则 $\sum 1/n = \infty$ ,所以 $x \notin \ell^1$ 。但 $\sum 1/n^2 = \pi^2/6$ ,所以 $x \in \ell^2$$\|x\|_2 = \pi/\sqrt{6} \approx 1.283$ 。且 $\sup |x_n| = 1$ ,所以 $x \in \ell^\infty$$\|x\|_\infty = 1$ 。这个例子展示了 $\ell^2 \setminus \ell^1$$\ell^\infty \setminus \ell^2$ 的分离。要找到 $\ell^\infty \setminus \ell^2$ 中的一个元素,常数序列 $1, 1, 1, \ldots$ 可以:$\|\cdot\|_\infty = 1$$\sum 1 = \infty$

这些包含几乎是 $\ell^p$ 家族中唯一的“自由”结构。范数是不等价的:$\ell^1$$\ell^2$ 中的等距副本并不与 $\ell^2$ 的拓扑一致,等等。$\ell^p$ 家族是一个美丽的一参数实验室,用于测试Banach空间的性质是一般性质还是特定几何的性质。

Banach空间:完备性落地#

一个赋范空间是Banach空间,如果它在其范数诱导的度量下是完备的。完备性是关于特定范数的事实,而不仅仅是关于底层向量空间。给一个Banach空间和一个非Banach空间添加范数结构有时会产生相同的向量空间 —— 例如,作为向量空间的 $\ell^p$$\ell^\infty$ 的子空间,但它们在拓扑化后是非常不同的对象。

Banach空间:在其范数下完备的赋范空间

是Banach的例子#

  • $\mathbb{R}^n$$\mathbb{C}^n$ 带有任何范数(有限维,因此完备)。
  • $C[a, b]$ 带有上确界范数。Cauchy序列是一致Cauchy的,因此一致收敛到一个连续函数。
  • $\ell^p$ 对于 $1 \leq p \leq \infty$ 。Cauchy序列逐项收敛;极限通过Fatou引理回到 $\ell^p$
  • $L^p[a, b]$ 对于 $1 \leq p \leq \infty$ —— Lebesgue完备性定理(通过Lebesgue控制收敛定理证明)。
  • $C_0(\mathbb{R}^n)$ ,在无穷远处消失的连续函数,带有上确界范数。
  • $Y$ 是Banach时,有界算子 $B(X, Y)$

不是Banach的例子#

  • $C[0,1]$ 带有 $L^1$ 风格的度量 $\int |f - g|$ (第一篇文章中的例子)。完备化是 $L^1[0,1]$
  • 多项式空间带上有确界范数 —— 可数维,不在 $C[0,1]$ 中闭合,完备化是 $C[0,1]$
  • $\mathbb{R}$ 上的紧支连续函数带上有确界范数 —— 完备化是 $C_0(\mathbb{R})$

一个巧妙的特征#

有一个简洁的测试:一个赋范空间 $V$ 是Banach空间当且仅当 $V$ 中每一个绝对收敛的级数都收敛。(级数 $\sum x_n$ 是绝对收敛的,如果 $\sum \|x_n\| < \infty$ 。)证明只需两行:Cauchy序列有子序列 $\|x_{n_{k+1}} - x_{n_k}\| < 2^{-k}$ ,然后 $x_{n_K} = x_{n_1} + \sum_{k=1}^{K-1}(x_{n_{k+1}} - x_{n_k})$ 是一个绝对收敛级数的部分和;如果这些部分和收敛,原来的Cauchy序列也收敛(因为Cauchy加一个收敛子序列意味着收敛)。反之,任何绝对收敛的级数都有Cauchy部分和,因此完备性给出一个极限。这是在证明特定空间完备性时最常用的等价定义之一 —— 检查绝对收敛级数是否收敛通常比直接处理Cauchy序列更容易。

Schauder基#

我第一次试图把 $\ell^2$ 中的“基”写下来时犯了一个错。我以为可以照搬有限维线性代数的 Hamel 基,给 $\ell^2$ 找一组基让任何向量都是这组基的有限线性组合。Baire 范畴定理立刻把这条路堵死:可数维 Banach 空间不可能完备,所以无穷维 Banach 空间的 Hamel 基必然不可数,根本不能写下来用。要在分析中“展开向量”,需要的不是有限组合,而是允许收敛级数的“拓扑基”——这就是 Schauder 基。

在有限维赋范空间中,每个基(代数意义上的)也是“拓扑”基:每个向量都是基元素的有限线性组合。在无限维Banach空间中,代数(Hamel)基非常庞大 —— 根据Baire定理,无限维Banach空间不能有可数的Hamel基 —— 并且对分析毫无用处。

绝对收敛 vs 条件收敛

对于可分Banach空间,正确的概念是一个序列 $(e_n) \subset V$ 被称为Schauder基,如果每个 $x \in V$ 都有唯一表示 $x = \sum_{n=1}^\infty c_n e_n$ 作为收敛级数(在 $V$ 的范数下)。收敛是一个拓扑条件,而不是代数条件,这也是Schauder基与Hamel基的区别。

Schauder基:有限组合是稠密的序列

例子#

  • 标准单位向量 $e_n = (0, \ldots, 0, 1, 0, \ldots)$ 形成 $\ell^p$ 的Schauder基,对于 $1 \leq p < \infty$ ,但不是 $\ell^\infty$ 的Schauder基(常数序列 $1$ 在这个基下没有Schauder展开,因为只取前 $N$ 项得到的部分和与 $1$ 之间的上确界范数始终为 $1$ )。
  • 三角系统 $\{1, \cos(n t), \sin(n t)\}_{n \geq 1}$$L^2[0, 2\pi]$ 的Schauder基(实际上是正交基)。它不是 $L^p[0, 2\pi]$ 的Schauder基,对于 $p \neq 2, p > 1$ —— Fourier级数的部分和在 $L^p$ 范数下不收敛到一般的 $f$$p = 1$$p = \infty$
  • Haar系统是每个 $L^p[0,1]$ 的Schauder基,对于 $1 \leq p < \infty$

Schauder基的存在性意味着可分性(基向量的有理组合是稠密的),但逆命题不成立 —— Per Enflo在1973年的例子表明存在一个没有Schauder基的可分Banach空间,解决了长期存在的问题。

数值示例#

$\ell^2$ 中,取 $x = (1/n)_{n \geq 1}$ 。在标准基下的Schauder展开是 $x = \sum_{n=1}^\infty (1/n) e_n$ 。部分和是 $S_N = (1, 1/2, 1/3, \ldots, 1/N, 0, 0, \ldots)$ ,且 $\|x - S_N\|_2^2 = \sum_{n=N+1}^\infty 1/n^2 \to 0$$N \to \infty$ 。系数是唯一的,因为如果 $\sum c_n e_n = 0$ ,则与 $e_m$ 内积迫使 $c_m = 0$

为什么这很重要#

Schauder基让我可以把整个无限维Banach空间的问题简化为系数序列的问题。泛函分析中最具体的事情 —— Fourier分析、小波分解、数值中的有限维逼近 —— 正好是Schauder基论证。可分Hilbert空间中正交基的Schauder基性质(第三篇文章)是最干净的版本,历史上是通用定义的模型。

实践中的等价范数#

同一向量空间上的范数是等价的,如果它们具有相同的Cauchy序列,等价地,相同的收敛序列,等价地,相同的拓扑。在有限维情况下,所有范数都是等价的(上面);在无限维情况下,它们通常是不等价的。

比较 R^2 上等价范数的单位球

一些观察。

  • 如果 $\|\cdot\|_a$$\|\cdot\|_b$$V$ 上等价,则 $V$ 关于一个范数完备当且仅当关于另一个范数完备。因此,“等价”是一个强关系:它保留了Banach性质。
  • 如果 $V$$\|\cdot\|_a$$\|\cdot\|_b$ 下是Banach空间,并且 $\|x\|_b \leq C \|x\|_a$ 对所有 $x$ 成立(单边界),那么根据开映射定理(第六篇文章),反向界 $\|x\|_a \leq C' \|x\|_b$ 对某个 $C'$ 成立,因此范数自动等价。这是一个有点令人惊讶的结果,其证明必须等到有了开映射定理。
  • $C[0,1]$ 上的范数 $\|f\|_\infty$$\|f\|_1$ 不等价。序列 $f_n(t) = t^n$$\|f_n\|_\infty = 1$$\|f_n\|_1 = 1/(n+1) \to 0$

数值示例#

$\mathbb{R}^2$ 上,不等式 $\|x\|_\infty \leq \|x\|_2 \leq \|x\|_1 \leq \sqrt{2} \|x\|_2 \leq 2 \|x\|_\infty$ 点态成立。因此这三个范数是等价的,等价常数接近 $1$ 。随着 $n$ 增长,$\mathbb{R}^n$ 中的常数增长像 $n^{1/p - 1/q}$ ,但对于任何固定的 $n$ ,它们仍然是有限的。令 $n \to \infty$ ,常数爆炸;这是有限维等价在 $\ell^p$ 上失败的确切意义。

商空间#

$$\|x + W\|_{V/W} = \inf_{w \in W} \|x - w\| = d(x, W).$$

这确实是一个范数 —— 正定性使用了 $W$闭的 —— 投影 $\pi: V \to V/W$$\pi(x) = x + W$ ,是一个连续线性满射,且 $\|\pi\| \leq 1$

如果 $V$ 是Banach空间,则 $V/W$ 也是Banach空间 —— $V/W$ 中的Cauchy序列可以通过绝对收敛提升到 $V$ 中的Cauchy序列,其极限投影到商空间中的所需极限。

直观上,商空间在做一件“把不需要的方向折叠掉”的事。比如 $V$ 是函数空间、$W$ 是常数函数构成的一维子空间,$V/W$ 就是“模掉常数”——它把“相差一个常数的函数”视为同一个对象,自然出现在 Neumann 边值问题里(Neumann 解只确定到一个常数)。$W$ 是闭这一条很关键:如果 $W$ 不闭,$V/W$ 上面的 $\|\cdot\|$ 不再是范数(正定性失败),变成只是个半范数,整个 Banach 空间结构垮掉。这是为什么本节后面专门有一节强调“闭子空间不是自动的”。

例子#

$L^1(\mathbb{R})$ 中,考虑积分等于零的闭子空间 $W$ 。商 $L^1(\mathbb{R}) / W$ 是一维的,通过 $\overline{f} \mapsto \int f$$\mathbb{R}$ 同构。更结构化地说,商构造让我可以忽略任何不需要的闭子空间;在PDE中,Sobolev空间 $H^1(\Omega) / \mathbb{R}$ (模掉常数)是带有Neumann边界条件的变分问题的正确空间。

为什么这很重要#

商是处理我想忽略的子空间的方式。在算子理论中,$V / \ker(T)$ 识别出 $T$ 发送到同一位置的 $V$ 中的元素。第一同构定理说 $V / \ker(T) \cong \mathrm{Range}(T)$ 通过诱导映射 $\widetilde T: V/\ker(T) \to \mathrm{Range}(T)$ 。当 $T$ 有界且范围闭时,$\widetilde T$ 是双连续同构 —— 第六篇文章将利用这一点。

序列空间 $c_0$$c$$\ell^\infty$ #

三个密切相关的序列空间值得单独一段:

  • $\ell^\infty$ :有界序列,带有 $\|x\|_\infty = \sup |x_n|$
  • $c$ :收敛序列,带有 $\|x\|_\infty = \sup |x_n|$
  • $c_0$ :收敛到 $0$ 的序列,带有 $\|x\|_\infty = \sup |x_n|$

所有三个在上确界范数下都是Banach空间。包含 $c_0 \subset c \subset \ell^\infty$ 都是严格的且闭的,因为 $c_0$ 序列的一致收敛极限在 $c_0$ 中,等等。

比较 c_0, c, l^infinity 序列空间

空间 $\ell^\infty$不可分的(第一篇文章提到)。对于每个 $A \subseteq \mathbb{N}$ ,指示函数 $\mathbb{1}_A \in \ell^\infty$ ,且 $\|\mathbb{1}_A - \mathbb{1}_B\|_\infty = 1$ 对于 $A \neq B$ 。有不可数多个这样的指示函数,因此 $\ell^\infty$ 有一个不可数的 $1$ 分离子集,不能有一个可数稠密子集。$c$$c_0$ 可分的,有理数支持的有限序列作为可数稠密集。可分性很重要 —— 它是让对偶性良好工作的规律性(第四篇文章)。

标准基 $(e_n)$$c_0$$\ell^p$ 对于 $1 \leq p < \infty$ 的Schauder基,但不是 $c$ 的Schauder基(常数序列 $1$$c$ 中,但其在 $(e_n)$ 中的Schauder展开在上确界范数下不收敛)。对于 $c$ ,正确的Schauder基是 $\{1, e_1, e_2, \ldots\}$ —— 常数 $1$ 加上标准基向量。这种调整是那些提醒选择基底是一项精细艺术的小而烦人的事情之一。

为什么完备性是分界线#

以下是贯穿Banach空间理论的主要定理模式:完备性可以用局部假设交换全局结论。

  • Banach-Steinhaus(第六篇文章):算子族的逐点有界性意味着一致有界性。
  • 开映射定理(第六篇文章):Banach空间之间的满射有界线性映射自动是开映射。
  • 闭图定理(第六篇文章):Banach空间之间具有闭图的线性映射自动是有界的。
  • Hahn-Banach(第四篇文章):子空间上的任何连续线性泛函可以扩展到整个空间而不增加其范数。

其中,只有Hahn-Banach是真正的纯代数(它不需要完备性)。其他三个关键要求完备性。在系列的其余部分,完备性是不断兑现的假设,通常在背景中无形地起作用。

Banach空间也是算子代数的合适环境,因为当 $X$ 是Banach空间时,$B(X)$ 本身就是一个Banach空间 —— 甚至在复合下是一个代数,且 $\|S T\| \leq \|S\| \|T\|$ (Banach代数)。谱理论(第八、九篇文章)在这个环境中进行。

有界线性算子:算子范数#

$$\|T\| = \sup_{x \neq 0} \frac{\|T x\|_Y}{\|x\|_X} = \sup_{\|x\|_X \leq 1} \|T x\|_Y = \sup_{\|x\|_X = 1} \|T x\|_Y.$$

这三个公式通过齐次性一致。线性算子是有界的当且仅当它是连续的当且仅当它在 $0$ 处连续。(对于线性映射,这三个条件是等价的。)因此,在赋范空间之间的线性算子中,“有界”和“连续”是可以互换的。

有界线性算子的空间 $B(X, Y)$ 在算子范数下是一个赋范空间,并且只要 $Y$ 是完备的,它就是完备的 —— 算子的Cauchy序列逐点Cauchy,因此逐点收敛到某个 $T$ ,算子范数界传递到极限。因此,只要 $Y$ 是Banach空间,$B(X, Y)$ 就是Banach空间。

数值示例#

移位算子 $S: \ell^2 \to \ell^2$ 定义为 $S(x_1, x_2, x_3, \ldots) = (0, x_1, x_2, \ldots)$ 是有界的,且 $\|S\| = 1$ 。为了看到这一点,$\|S x\|_2^2 = \sum_{n \geq 2} |x_{n-1}|^2 = \|x\|_2^2$ ,因此对于每个 $x$$\|S x\|_2 = \|x\|_2$ ,从而 $\|S\| = 1$ 。同样的算子是一个等距但不是满射的,因为 $S x$ 的第一个坐标总是 $0$ 。这是在有限维中没有类似物的结构事实,因为在有限维空间中,每个有限维空间到自身的等距都是自动满射的。

微分算子 $D: C^1[0,1] \to C[0,1]$$f \mapsto f'$ ,如果我在定义域上加上自然的 $C^1$ 范数 $\|f\|_{C^1} = \|f\|_\infty + \|f'\|_\infty$ ,则是有界的:$\|D f\|_\infty = \|f'\|_\infty \leq \|f\|_{C^1}$ ,因此 $\|D\| \leq 1$ ,且在函数如 $f(t) = \sin(2\pi t) / 2\pi$ 上达到等号。但如果我在 $C^1[0,1]$ 上加上上确界范数(没有导数项),$D$ 是无界的 —— 函数族 $f_n(t) = \sin(n \pi t) / n$ 的上确界范数为 $1/n \to 0$ ,但 $D f_n = \pi \cos(n\pi t)$ 的上确界范数为 $\pi$ ,拒绝消失。因此,同一个代数算子在一个范数选择下是有界的,在另一个范数选择下是无界的。算子和范数的配对是不可约的。

有界 vs 代数:一个警示故事#

仅线性性在无限维中并不保证连续性。具体来说,在 $\ell^2$ 的代数对偶(不要求连续的线性泛函)上,可以使用选择公理来扩展在Hamel基上做你想做的事情的线性泛函。选择公理扩展通常除非从连续数据开始否则不会连续。

这里有一个我每年都要给学生强调的细节:在有限维线性代数里,“线性映射”和“连续映射”几乎是同义词——任何有限维线性映射用矩阵表示都自动连续,所以本科教材里基本不区分。但在无穷维这两件事完全分开。线性是代数性质,连续是拓扑性质,这两条公理在线性空间上是独立的。一个稠密子空间上线性的“符号操作”——比如对多项式的形式微分——可以是不连续的:取多项式 $p_n(t) = t^n / n$$\|p_n\|_\infty = 1/n \to 0$ ,但 $p_n'(t) = t^{n-1}$ 满足 $\|p_n'\|_\infty = 1$ 不趋于零。形式上微分是线性运算,作为算子它在 $C[0,1]$ 上不连续。

这种区分让我每次写下“给一个线性映射”都要先问“它是否连续”。如果是从一个稠密子空间上的代数操作开始(比如对光滑函数的微分),那么我必须独立验证连续性,不能默认。如果代数操作不连续,可以把它的图取闭包,得到一个“闭算子”——这是第六、七、九篇会反复用的对象。所有 PDE 中的微分算子、量子力学中的位置和动量算子,都是从这种“代数定义但需要补足连续性”的过程构造出来的。本系列剩下的章节里,每次出现“算子”这个词都暗示了“有界、连续、线性”三件事——但在无穷维里这三件事不是免费的。

一个具体的例子:取 $V = \ell^2_{fin}$$\ell^2$ 中的稠密子空间,由有限支撑序列组成。定义 $\varphi: V \to \mathbb{R}$$\varphi(x) = \sum_n n x_n$ (由于 $x$ 是有限支撑的,这是一个有限和)。在基向量 $e_n$ 上,$\varphi(e_n) = n$ ,但 $\|e_n\|_2 = 1$ ,因此 $\varphi$ 在单位球上是无界的。泛函 $\varphi$ 是线性和良定义的,但不连续。它不能连续地扩展到整个 $\ell^2$ 。与前一段的对比在于,对于Banach空间之间的有界算子,连续性是自动的 —— 但有界是输入假设,而不是推论。

这种区别是为什么本系列中关于算子和泛函的每个定理都以“设 $T$ 有界”或“设 $T$ 连续”开始。没有这个假设,几乎没有理论。

闭子空间不是自动的#

在度量空间中,每个闭子集在自然意义上“自动”是闭的。在无限维赋范空间中,子空间的类似主张更为微妙。线性子空间不必是闭的;如果是有限维的,它自动是闭的(有限维范数等价性的结果),但可数维子空间通常是稠密且不闭的。

例如,多项式子空间在 $C[0,1]$ (带上确界范数)中是稠密的——这就是 Weierstrass 逼近定理。多项式子空间是真子空间,因为大多数连续函数(比如 $\sin t$ )不是多项式,但它的闭包恰好是整个 $C[0,1]$ 。换句话说,多项式空间是稠密但不闭的;它的范数闭包远比它本身大。如果我天真地把它当成“线性代数意义上的子空间”来处理,就会错过这件事——线性代数告诉我有一个真包含,分析告诉我这个真包含在拓扑上是看不见的。

闭子空间反而是分析中真正有用的对象。原因有两条。第一,刚才证明过的事实:$V/W$ 是赋范空间当且仅当 $W$ 是闭的——非闭子空间得到的不是赋范空间,因为 $\|x + W\|$ 不再是正定的。第二,闭子空间继承完备性:如果 $V$ 是 Banach 空间,$W \subset V$ 闭,则 $W$ 在诱导范数下也是 Banach 空间。非闭子空间不一定,比如有限支撑序列 $\ell^p_{fin}$$\ell^p$ 中不完备。

这就引出一个习惯性的检查:每次写下“子空间”这个词,我都得先问一句这个子空间是否闭。线性张成 $\mathrm{span}\{x_1, x_2, \ldots\}$ (代数张成,只取有限和)通常不闭;它的闭包 $\overline{\mathrm{span}}\{x_1, x_2, \ldots\}$ (范数闭包)才是分析中需要的对象。把这两者混淆几乎是无穷维线性代数最常见的错误来源,本节后续每一篇都会反复提醒这个区别。

为什么这很重要#

回到本篇开头的问题:为什么范数不只是“戴着帽子的度量”。答案在这一节里集齐了。范数让我能比较向量的大小、做线性运算、定义算子范数、谈论级数收敛、构造商空间、识别闭子空间。这些都不是抽象度量空间能直接给我的。完备性把这套机器锁紧成 Banach 空间,让无穷级数、不动点、对偶论证全都可用。

而完备性又不是免费的:它筛掉了像 $C[0,1]$$L^1$ 范数下、$\ell^p_{fin}$$\ell^p$ 范数下这样“漏水”的空间。本系列剩下的篇章——Hilbert 空间、对偶、三大定理、紧算子、谱理论——基本上都是在完备性的前提下展开。如果某个空间不完备,第一步往往就是先把它完备化,再做任何分析。Banach 空间是泛函分析的“出生地”,所有别的结构都从这里长出来。

反例:当“等价范数”这条直觉滑落#

有限维线性代数训练出一种本能:所有范数都"等价",所以选哪个无所谓。这条直觉在无穷维彻底失败,而失败的方式比初见时想象的更具体。

$X = C[0,1]$ 。配上 sup 范数 $\|f\|_\infty = \sup_t |f(t)|$$L^1$ 范数 $\|f\|_1 = \int_0^1 |f|\,dt$ ,立刻能看到差距。对 $f_n(t) = t^n$ :sup 范数恒为 $1$$L^1$ 范数为 $1/(n+1) \to 0$ 。同一族函数在一个范数下停在单位球面上,在另一个范数下塌缩到原点。把范数比放成数:$\|f_{99}\|_\infty / \|f_{99}\|_1 = 1 / 0.01 = 100$$\|f_{999}\|_\infty / \|f_{999}\|_1 = 1000$ ,比值无界。在有限维,比值有界于一个只依赖维数的常数,正是这条界让"等价"成立。

更尖锐的反例:在 $C[0,1]$ 上同一族 $f_n(t) = t^n$ 是 sup 范数下的非柯西序列(成对距离 $\geq 1 - 1/2^n$ ),却是 $L^1$ 范数下的柯西序列(极限是 $0$ 函数,仍在 $C[0,1]$ 里——这次没漏水)。换 $f_n(t) = \min(1, nt)$$L^1$ 是柯西的但极限是阶梯函数(漏水),sup 范数下又非柯西。同一个空间挂上不同范数,柯西性、收敛性、完备性全变。

教训:每次写下"$X$ 完备"或"$x_n \to x$ “都得跟上一句"在哪个范数下”。无穷维的范数选择不是装饰,它选的是整套分析机器。

常见陷阱:把"代数子空间"当成"分析子空间"#

代数线性代数的子空间只要求对加法和标量乘法封闭。分析里的子空间还要求——否则它不能继承完备性,也不能做商空间。这两件事在有限维里自动统一(有限维子空间总是闭的),但在无穷维分裂成两个不同的概念,最常见的错误就是把它们混淆。

具体:多项式空间 $\mathcal{P} \subset C[0,1]$ 在 sup 范数下是真子空间但不闭,闭包是整个 $C[0,1]$ (Weierstrass 定理)。如果天真地把 $\mathcal{P}$ 当成"线性代数子空间"用——比如想做 $C[0,1] / \mathcal{P}$ ——会发现商空间没有合理的范数($\|f + \mathcal{P}\| = \inf_{p \in \mathcal{P}} \|f - p\|_\infty = 0$ 对每个 $f$ 都成立,因为多项式稠密),整套商构造塌掉。换成闭子空间,比如 $\{f \in C[0,1] : f(0) = 0\}$ ,商空间立刻干净——商范数等于 $|f(0)|$$C[0,1] / \{f : f(0) = 0\} \cong \mathbb{R}$

习惯上每次写"令 $W$$X$ 的子空间"都得先问一句"$W$ 闭吗"。如果不闭,要么取闭包,要么承认拿到的是不完备的对象。本系列后续每章的论证里都有这条隐式检查。

下一步#

Banach 空间是合适的舞台,但缺少一样在有限维里几乎是默认的东西:一个让两个向量可以“成角度”的内积。范数告诉我向量有多长,却不告诉我两个向量是否正交、是否平行、夹角是多少。Pythagoras 定理、正交分解、Fourier 展开——所有这些“几何”工具都需要内积才能搬到无穷维。

下一篇引入Hilbert 空间:带有完备内积的向量空间。内积自动诱导一个范数($\|x\| = \sqrt{\langle x, x\rangle}$ ),所以每个 Hilbert 空间都是 Banach 空间,但反过来不成立——只有满足平行四边形等式的范数才来自内积。这一限制看似苛刻,却让一大堆几何工具立刻可用:正交投影、Gram-Schmidt、正交基的 Schauder 展开、Riesz 表示、Bessel 不等式。$L^2$ 是其中最常出现的例子,量子力学和信号处理几乎都活在 $L^2$ 里。Hilbert 空间会成为本系列后半段大部分定理的默认背景。


本系列

泛函分析 12 篇

  1. 01 泛函分析(一):度量空间 —— 距离、收敛与完备性
  2. 02 泛函分析(二):赋范空间与Banach空间 当前
  3. 03 泛函分析(三):Hilbert 空间 —— 无限维空间中的几何
  4. 04 泛函分析(四):对偶空间与 Hahn-Banach 定理 —— 线性泛函的驯服
  5. 05 泛函分析(五):弱拓扑和弱*拓扑 —— 当范数收敛太强时
  6. 06 泛函分析(六):有界线性算子与三大定理
  7. 07 泛函分析(七):紧算子——通往有限维的桥梁
  8. 08 泛函分析(八):谱理论 —— 分解算子
  9. 09 泛函分析(九):无界算子 —— 当有界性失效时
  10. 10 泛函分析(十):算子半群 — 无限维空间中的演化方程
  11. 11 泛函分析(十一):分布与Sobolev空间 — 广义解
  12. 12 泛函分析(十二):泛函分析在行动 —— 偏微分方程和量子力学

读有所得?

GitHub 关注我 → 新文周更

GitHub