<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>PAC Learning on Chen Kai Blog</title><link>https://www.chenk.top/zh/tags/pac-learning/</link><description>Recent content in PAC Learning on Chen Kai Blog</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Sun, 08 Feb 2026 09:00:00 +0000</lastBuildDate><atom:link href="https://www.chenk.top/zh/tags/pac-learning/index.xml" rel="self" type="application/rss+xml"/><item><title>机器学习数学推导（二十）：正则化与模型选择</title><link>https://www.chenk.top/zh/ml-math-derivations/20-%E6%AD%A3%E5%88%99%E5%8C%96%E4%B8%8E%E6%A8%A1%E5%9E%8B%E9%80%89%E6%8B%A9/</link><pubDate>Sun, 08 Feb 2026 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/ml-math-derivations/20-%E6%AD%A3%E5%88%99%E5%8C%96%E4%B8%8E%E6%A8%A1%E5%9E%8B%E9%80%89%E6%8B%A9/</guid><description>&lt;h2 id="你将学到什么" class="heading-anchor">你将学到什么&lt;a href="#%e4%bd%a0%e5%b0%86%e5%ad%a6%e5%88%b0%e4%bb%80%e4%b9%88" class="heading-link" aria-label="Permalink to this section" title="Copy link to this section">#&lt;/a>
&lt;/h2>&lt;p>一个拥有 1 亿参数的网络，用 5 万张图片训练，按经典理论应该会严重过拟合，但现代深度网络却能很好地泛化。这背后主要有两个原因：&lt;strong>正则化&lt;/strong>——一系列限制模型容量的技术；以及&lt;strong>泛化理论&lt;/strong>——从数学上解释学习何时有效。作为整个系列的最后一章，我们将整合之前积累的所有工具——最小二乘、MAP 估计、优化方法、EM 算法、神经网络——来探讨这个领域最深刻的问题：&lt;strong>机器学习为什么能泛化？&lt;/strong>&lt;/p></description></item><item><title>机器学习数学推导（一）：绪论与数学基础</title><link>https://www.chenk.top/zh/ml-math-derivations/01-%E7%BB%AA%E8%AE%BA%E4%B8%8E%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/</link><pubDate>Tue, 20 Jan 2026 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/ml-math-derivations/01-%E7%BB%AA%E8%AE%BA%E4%B8%8E%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/</guid><description>&lt;h2 id="本章内容" class="heading-anchor">本章内容&lt;a href="#%e6%9c%ac%e7%ab%a0%e5%86%85%e5%ae%b9" class="heading-link" aria-label="Permalink to this section" title="Copy link to this section">#&lt;/a>
&lt;/h2>&lt;p>2005 年，Google Research 在公开评测中证明：仅用原始双语语料训练的统计翻译模型，竟能超越语言学家数十年精心设计的规则系统。这一结论令当时的专家颇感不适，却在数学上令人振奋——&lt;strong>一个从未被告知语言规则的系统，只要有足够多的例子，依然能自行还原这些规则&lt;/strong>。这是为什么？&lt;/p></description></item></channel></rss>