机器学习数学推导（九）：朴素贝叶斯

Wed, 28 Jan 2026 09:00:00 +0000

引子： 一个垃圾邮件过滤器，训练只需几毫秒，支持百万级特征，几乎不需要调整超参数，却能在短文本任务上胜过许多更复杂的模型。朴素贝叶斯能做到这一点，靠的是一个大胆到近乎离谱的假设：给定类别后，所有特征条件独立。它不仅不为此道歉，反而坚持到底；尽管这个假设在几乎所有真实数据集上都不成立，分类器依然表现良好。要搞清楚原因，需要深入理解生成模型、MAP 估计、Dirichlet 先验及偏差–方差权衡的核心概念。这篇文章将带你一步步走完这条完整路径。

Text Classification on Chen Kai Blog

机器学习数学推导（九）：朴素贝叶斯