标签

Machine Learning

May 8, 2026 阿里云全栈实战 36 分钟

阿里云全栈实战（十一）：PAI 打造机器学习平台

阿里云完整 ML 平台：PAI-DSW 笔记本、PAI-DLC 分布式训练、PAI-EAS 模型服务、Designer 可视化工作流、Model Gallery。端到端训练和部署自定义模型。

Mar 6, 2026 阿里云 PAI 22 分钟

阿里云 PAI（二）：DSW Notebook 避坑指南

PAI-DSW 实战：选对 GPU 镜像、把 OSS 挂好不丢权重、把官方 Quick Start 的 MNIST 完整跑通。再附上一些只在淘宝场景里踩过才知道的坑。

Mar 5, 2026 阿里云 PAI 20 分钟

阿里云 PAI（一）：平台概览与产品地图

基于官方文档梳理 2026 年阿里云 PAI 的四层服务架构、你真正会用到的五个子产品（DSW、DLC、EAS、Designer、Model Gallery），它们和 ECS、OSS 的关系，以及一套干净的账号/区域/工作空间初始化流程。

Feb 8, 2026 机器学习数学推导 24 分钟

机器学习数学推导（二十）：正则化与模型选择

系列收官：从偏差-方差分解出发，沿着 L1/L2 几何、Dropout 子网络采样、K 折交叉验证、AIC/BIC、VC 维到现代的双下降现象，回答机器学习理论中最深的一个问题——为什么模型能泛化。

Feb 7, 2026 机器学习数学推导 24 分钟

机器学习数学推导（十九）：神经网络与反向传播

神经网络如何学习？本文推导前向传播的矩阵形式、反向传播的链式法则逐层推导、梯度消失/爆炸的数学分析、以及 Xavier 和 He 初始化的方差保持策略。

Feb 6, 2026 机器学习数学推导 26 分钟

机器学习数学推导（十八）：聚类算法

如何在无标签数据中发现群组结构？本文从数学基础出发推导 K-means（Lloyd 算法与 K-means++）、层次聚类、DBSCAN 密度聚类、谱聚类与高斯混合模型，配以七张图直观展现每种算法背后的不同假设。

Feb 5, 2026 机器学习数学推导 22 分钟

机器学习数学推导（十七）：降维与主成分分析

高维空间对基于距离的算法极其不友好。本文从最大方差与最小重构误差两个等价视角推导 PCA，并依次扩展到核 PCA、LDA、t-SNE 与 ICA——配套图示直接展示同一份数据上各方法到底干了什么。

Feb 4, 2026 机器学习数学推导 20 分钟

机器学习数学推导（十六）：条件随机场

CRF 为什么在序列标注任务上压 HMM 一头？本文从零推导线性链 CRF——势函数与特征函数、前向后向算法、对数似然梯度（经验期望减模型期望）、Viterbi 解码，以及现代 BiLSTM-CRF 的整合方式。

Feb 3, 2026 机器学习数学推导 22 分钟

机器学习数学推导（十五）：隐马尔可夫模型

从一个原理推出 HMM 的三大经典算法：把联合分布按时间因子化，再用动态规划复用跨时间的子计算。覆盖前向后向的边缘与平滑、Viterbi 的 MAP 解码，以及 Baum-Welch（EM）的参数学习。

Feb 2, 2026 机器学习数学推导 22 分钟

机器学习数学推导（十四）：变分推断与变分 EM

从一行恒等式出发推导变分推断：ELBO 分解、平均场假设、坐标上升 CAVI、变分 EM，以及让 VAE 得以训练的重参数化技巧。

Feb 1, 2026 机器学习数学推导 18 分钟

机器学习数学推导（十三）：EM 算法与 GMM

从 Jensen 不等式与 ELBO 出发推导 EM 算法，证明其单调上升性，并完整给出高斯混合模型（GMM）的 E 步、M 步更新公式、模型选择以及与 K-means 的关系。

Jan 31, 2026 机器学习数学推导 22 分钟

机器学习数学推导（十二）：XGBoost 与 LightGBM

从 XGBoost 的二阶泰勒展开到 LightGBM 的直方图加速，本文系统推导两大工业级梯度提升框架——正则化目标函数、分裂增益闭式解、GOSS 单边采样与 EFB 互斥特征绑定的数学原理。

Jan 30, 2026 机器学习数学推导 30 分钟

机器学习数学推导（十一）：集成学习

推导一群平庸分类器为何能压过单个高手。涵盖偏差-方差分解、Bagging 与随机森林的方差缩减、AdaBoost 的指数损失、以及 GBDT 在函数空间中的梯度下降。

Jan 29, 2026 机器学习数学推导 22 分钟

机器学习数学推导（十）：半朴素贝叶斯与贝叶斯网络

从 SPODE、TAN、AODE 到完整的贝叶斯网络：通过单依赖树、超父集成与图结构学习，把朴素贝叶斯和全联合分布之间的鸿沟逐级填平。

Jan 28, 2026 机器学习数学推导 28 分钟

机器学习数学推导（九）：朴素贝叶斯

从贝叶斯定理与条件独立假设出发，完整推导朴素贝叶斯分类器：参数估计、拉普拉斯平滑、三种模型变体，以及为什么这个看似过于简单的模型在实践中如此有效。

Jan 27, 2026 机器学习数学推导 22 分钟

机器学习数学推导（八）：支持向量机

从最大间隔到核技巧，完整推导 SVM 的理论框架——拉格朗日对偶、KKT 条件、SMO 算法与核函数构造。

Jan 26, 2026 机器学习数学推导 28 分钟

机器学习数学推导（七）：决策树

从信息熵到基尼指数，从 ID3 到 CART——系统推导决策树的数学原理：分裂准则、连续特征与缺失值处理、剪枝策略、特征重要性，所有图都用 sklearn 验证。

Jan 25, 2026 机器学习数学推导 24 分钟

机器学习数学推导（六）：逻辑回归与分类

从 Sigmoid 到 Softmax，完整推导逻辑回归——交叉熵损失、梯度计算、正则化与多分类扩展，附 Python 验证。

Jan 24, 2026 机器学习数学推导 36 分钟

机器学习数学推导（五）：线性回归

从代数（正规方程）、几何（正交投影）、概率（最大似然）三个角度完整推导线性回归，再延伸到 Ridge、Lasso、梯度下降与诊断方法，全部结论与 scikit-learn 互验。

Jan 23, 2026 机器学习数学推导 34 分钟

机器学习数学推导（四）：凸优化理论

从凸集与凸函数出发，严格推导梯度下降、牛顿法、BFGS、KKT 条件与 ADMM——机器学习优化的数学基石。

Jan 22, 2026 机器学习数学推导 24 分钟

机器学习数学推导（三）：概率论与统计推断

从 Kolmogorov 公理到最大似然估计，从贝叶斯推断到信息论——一篇文章打通机器学习背后的概率与统计语言。

Jan 21, 2026 机器学习数学推导 24 分钟

机器学习数学推导（二）：线性代数与矩阵论

机器学习的语言是线性代数。本文从第一性原理推导向量空间、特征值分解、SVD 与矩阵求导——ML 优化所需的全部工具。

Jan 20, 2026 机器学习数学推导 34 分钟

机器学习数学推导（一）：绪论与数学基础

机器为什么能从有限的数据中学到普适的规律？本章从第一性原理出发，系统推导学习理论的数学骨架——问题形式化、损失函数、PAC 框架、VC 维、偏差-方差分解与无免费午餐定理。

Jul 28, 2025 单点深潜 20 分钟

辛几何与结构保持神经网络：让模型学会守恒

理解能保持能量与辛结构的物理感知神经网络。涵盖 HNN、LNN、SympNet、辛积分器，以及四个经典物理系统实验。

May 1, 2025 迁移学习 34 分钟

迁移学习（一）：基础与核心概念

迁移学习入门指南：为什么迁移有效、形式化定义、分类体系、负迁移，以及一个基于 MMD 域适应的完整特征迁移实现。

Apr 9, 2025 线性代数 30 分钟

线性代数（十五）：机器学习中的线性代数——从 PCA 到推荐系统

线性代数是机器学习的'母语'。本章深入 PCA、LDA、SVM 核方法、矩阵分解推荐系统、线性回归的矩阵形式，以及神经网络中的线性层与注意力机制背后的线性代数原理。

Aug 30, 2024 概率论与数理统计 22 分钟

概率与统计（八）：贝叶斯统计——先验、后验，以及频率学派为何争论不休

从第一性原理出发的贝叶斯推断：后验分布、共轭先验、Beta-二项模型与正态-正态模型、可信区间、预测分布、MCMC 直观理解，以及与机器学习正则化的深层联系。

Aug 14, 2024 PDE × 机器学习 36 分钟

偏微分方程与机器学习（八）：反应扩散系统与 GNN

深层 GNN 之所以崩溃，是因为它就是图上的扩散方程；图灵 1952 年的反应扩散理论告诉我们如何修好它——也为整个八章 PDE+ML 系列收尾。

Jul 30, 2024 PDE × 机器学习 34 分钟

偏微分方程与机器学习（七）：扩散模型与 Score Matching

从 PDE 视角统一理解扩散模型：热方程、Fokker-Planck、score matching、DDPM/DDIM、Latent Diffusion，配可视化。

Jul 15, 2024 PDE × 机器学习 34 分钟

偏微分方程与机器学习（六）：连续归一化流与 Neural ODE

如何把高斯变成数据分布？本文从 ODE/PDE 理论出发，系统推导 Neural ODE、伴随方法、连续归一化流（FFJORD）与 Flow Matching，并用 7 张图把核心机制画清楚。

Jun 30, 2024 PDE × 机器学习 34 分钟

偏微分方程与机器学习（五）：辛几何与保结构网络

保结构神经网络的几何起点：相空间、辛形式、Liouville 定理、辛积分器，以及 HNN / LNN / SympNet 三种把守恒律烧进网络结构里的方法。

May 31, 2024 PDE × 机器学习 42 分钟

偏微分方程与机器学习（三）：变分原理与优化

变分原理与 PDE 求解：Euler-Lagrange 方程、Wasserstein 梯度流、Mean-Field 理论，以及完整数值实验。