机器学习数学推导（二十）：正则化与模型选择

Sun, 08 Feb 2026 09:00:00 +0000

你将学到什么#

一个拥有 1 亿参数的网络，用 5 万张图片训练，按经典理论应该会严重过拟合，但现代深度网络却能很好地泛化。这背后主要有两个原因：正则化——一系列限制模型容量的技术；以及泛化理论——从数学上解释学习何时有效。作为整个系列的最后一章，我们将整合之前积累的所有工具——最小二乘、MAP 估计、优化方法、EM 算法、神经网络——来探讨这个领域最深刻的问题：机器学习为什么能泛化？

机器学习数学推导（一）：绪论与数学基础

Tue, 20 Jan 2026 09:00:00 +0000

本章内容#

2005 年，Google Research 在公开评测中证明：仅用原始双语语料训练的统计翻译模型，竟能超越语言学家数十年精心设计的规则系统。这一结论令当时的专家颇感不适，却在数学上令人振奋——一个从未被告知语言规则的系统，只要有足够多的例子，依然能自行还原这些规则。这是为什么？

PAC Learning on Chen Kai Blog

机器学习数学推导（二十）：正则化与模型选择

你将学到什么#

机器学习数学推导（一）：绪论与数学基础

本章内容#