Neural Networks on Chen Kai Blog

机器学习数学推导（十九）：神经网络与反向传播

Sat, 07 Feb 2026 09:00:00 +0000

本文概览#

单个感知机无法解决 XOR 问题，但只要堆叠足够多的感知机并引入非线性激活函数，就能构建出一个通用函数逼近器。那么，这样的网络如何从数据中学习？答案是反向传播——它本质上是对链式法则的高效应用，通过一次反向遍历复用中间结果，成为过去四十年所有深度学习库的核心引擎。深入理解其数学原理，还能揭示两个关键现象：为什么深层网络容易遭遇梯度消失或爆炸，以及为什么权重初始化远非随意选择。

线性代数（十六）：深度学习中的线性代数——从全连接到 Transformer

Wed, 16 Apr 2025 09:00:00 +0000

去掉那些营销包装，深度网络的本质其实很简单：一连串矩阵乘法，中间用逐元素非线性函数连接起来。前向传播、反向传播、卷积、注意力机制、归一化、微调——所有这些所谓的“技巧”不过是同一个代数主题的小小变化。一旦看清背后的矩阵，这个领域就不再是零散的配方，而是统一的语言。

偏微分方程与机器学习（一）：物理信息神经网络

Wed, 01 May 2024 09:00:00 +0000

本系列第一章 · 阅读约 35 分钟。 这章是整个系列的地基。后面七章讲神经算子、变分原理和 Score Matching，其实都在探讨同一个问题：如何将物理或数学约束编码进神经网络的优化目标？搞定了 PINN，后续章节只是更换不同的约束。

Neural Networks on Chen Kai Blog

机器学习数学推导（十九）：神经网络与反向传播

本文概览#

推荐系统（三）—— 深度学习基础模型

线性代数（十六）：深度学习中的线性代数——从全连接到 Transformer

偏微分方程与机器学习（一）：物理信息神经网络