<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Neural Networks on Chen Kai Blog</title><link>https://www.chenk.top/zh/tags/neural-networks/</link><description>Recent content in Neural Networks on Chen Kai Blog</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Sat, 07 Feb 2026 09:00:00 +0000</lastBuildDate><atom:link href="https://www.chenk.top/zh/tags/neural-networks/index.xml" rel="self" type="application/rss+xml"/><item><title>机器学习数学推导（十九）：神经网络与反向传播</title><link>https://www.chenk.top/zh/ml-math-derivations/19-%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%E4%B8%8E%E5%8F%8D%E5%90%91%E4%BC%A0%E6%92%AD/</link><pubDate>Sat, 07 Feb 2026 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/ml-math-derivations/19-%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%E4%B8%8E%E5%8F%8D%E5%90%91%E4%BC%A0%E6%92%AD/</guid><description>&lt;h2 id="本文概览" class="heading-anchor">本文概览&lt;a href="#%e6%9c%ac%e6%96%87%e6%a6%82%e8%a7%88" class="heading-link" aria-label="Permalink to this section" title="Copy link to this section">#&lt;/a>
&lt;/h2>&lt;p>单个感知机无法解决 XOR 问题，但只要堆叠足够多的感知机并引入非线性激活函数，就能构建出一个&lt;strong>通用函数逼近器&lt;/strong>。那么，这样的网络如何从数据中学习？答案是&lt;strong>反向传播&lt;/strong>——它本质上是对链式法则的高效应用，通过一次反向遍历复用中间结果，成为过去四十年所有深度学习库的核心引擎。深入理解其数学原理，还能揭示两个关键现象：为什么深层网络容易遭遇梯度消失或爆炸，以及为什么权重初始化远非随意选择。&lt;/p></description></item><item><title>推荐系统（三）—— 深度学习基础模型</title><link>https://www.chenk.top/zh/recommendation-systems/03-%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80%E6%A8%A1%E5%9E%8B/</link><pubDate>Sun, 07 Dec 2025 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/recommendation-systems/03-%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80%E6%A8%A1%E5%9E%8B/</guid><description>&lt;p>2016 年 6 月，Google 发表了一篇仅一页的论文，悄然重塑了推荐系统的格局。该文介绍了 &lt;strong>Wide &amp;amp; Deep Learning&lt;/strong>——当时正驱动着十亿用户规模的 Google Play 应用商店推荐。短短一年内，各大科技公司纷纷将深度模型投入生产；到 2019 年，行业标准已然转变：矩阵分解不再是核心系统，而仅作为基线方法。&lt;/p></description></item><item><title>线性代数（十六）：深度学习中的线性代数——从全连接到 Transformer</title><link>https://www.chenk.top/zh/linear-algebra/16-%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%AD%E7%9A%84%E7%BA%BF%E6%80%A7%E4%BB%A3%E6%95%B0/</link><pubDate>Wed, 16 Apr 2025 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/linear-algebra/16-%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%AD%E7%9A%84%E7%BA%BF%E6%80%A7%E4%BB%A3%E6%95%B0/</guid><description>&lt;p>去掉那些营销包装，深度网络的本质其实很简单：一连串矩阵乘法，中间用逐元素非线性函数连接起来。前向传播、反向传播、卷积、注意力机制、归一化、微调——所有这些所谓的“技巧”不过是同一个代数主题的小小变化。一旦看清背后的矩阵，这个领域就不再是零散的配方，而是统一的语言。&lt;/p></description></item><item><title>偏微分方程与机器学习（一）：物理信息神经网络</title><link>https://www.chenk.top/zh/pde-ml/01-%E7%89%A9%E7%90%86%E4%BF%A1%E6%81%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/</link><pubDate>Wed, 01 May 2024 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/pde-ml/01-%E7%89%A9%E7%90%86%E4%BF%A1%E6%81%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/</guid><description>&lt;p>&lt;strong>本系列第一章 · 阅读约 35 分钟。&lt;/strong> 这章是整个系列的地基。后面七章讲神经算子、变分原理和 Score Matching，其实都在探讨同一个问题：如何将物理或数学约束编码进神经网络的优化目标？搞定了 PINN，后续章节只是更换不同的约束。
&lt;figure class="article-figure">
 &lt;img src="https://blog-pic-ck.oss-cn-beijing.aliyuncs.com/posts/zh/pde-ml/01-Physics-Informed-Neural-Networks/illustration_1.png" alt="偏微分方程与机器学习（一）：物理信息神经网络 — 章节概览图" loading="lazy" decoding="async" class="content-image">
 
&lt;/figure>
&lt;/p></description></item></channel></rss>