<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>算法 on Chen Kai Blog</title><link>https://www.chenk.top/zh/categories/%E7%AE%97%E6%B3%95/</link><description>Recent content in 算法 on Chen Kai Blog</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Thu, 30 Dec 2021 09:00:00 +0000</lastBuildDate><atom:link href="https://www.chenk.top/zh/categories/%E7%AE%97%E6%B3%95/index.xml" rel="self" type="application/rss+xml"/><item><title>核方法（八）：深度核学习 vs 深度学习——选择指南与故障排查</title><link>https://www.chenk.top/zh/kernel-methods/08-%E6%B7%B1%E5%BA%A6%E6%A0%B8%E5%AD%A6%E4%B9%A0/</link><pubDate>Thu, 30 Dec 2021 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/kernel-methods/08-%E6%B7%B1%E5%BA%A6%E6%A0%B8%E5%AD%A6%E4%B9%A0/</guid><description>&lt;p>2026 年了，为什么还要读核方法？Transformer 不是已经把整个 ML 栈吃掉了吗？是也不是。Transformer 吃掉了头条，核方法吃掉的是角落——只有 200 个样本的场景、必须给出校准误差棒的场景、物理学家需要知道是&lt;em>哪个&lt;/em>基函数贡献了这次预测的场景。本系列的最终篇就是这份&amp;quot;角落工程师手册&amp;quot;：核方法什么时候真的能赢、出了问题怎么诊断、怎么把核挂在神经网络头顶上拿到两边的好处，以及为什么 NTK（Jacot et al., 2018）告诉我们深网在某个极限下其实&lt;em>就是&lt;/em>一种核方法——两派的边界，到 2026 年比任何时候都更模糊。&lt;/p></description></item><item><title>核方法（七）：大规模核方法——Nystrom 近似与随机傅里叶特征</title><link>https://www.chenk.top/zh/kernel-methods/07-%E5%A4%A7%E8%A7%84%E6%A8%A1%E6%A0%B8%E6%96%B9%E6%B3%95/</link><pubDate>Fri, 24 Dec 2021 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/kernel-methods/07-%E5%A4%A7%E8%A7%84%E6%A8%A1%E6%A0%B8%E6%96%B9%E6%B3%95/</guid><description>&lt;p>你想拿 RBF SVM 去跑一个百万规模的图像分类任务。Gram 矩阵是 &lt;span class="math-inline">$10^6 \times 10^6$&lt;/span>
 的 double 数组，整整 &lt;strong>8 TB&lt;/strong>。光是这一个数字——八个 TB 的内存，仅仅为了&lt;em>存&lt;/em>那个核矩阵——就解释了为什么大部分在统计课上学过核方法的工程师，在真实生产环境里都默默不再碰它。核技巧用一次内积就送你一个无穷维特征空间；账单是在你有 &lt;span class="math-inline">$n^2$&lt;/span>
 对数据时寄到。&lt;/p></description></item><item><title>核方法（六）：高斯过程——当核方法遇到贝叶斯推断</title><link>https://www.chenk.top/zh/kernel-methods/06-%E9%AB%98%E6%96%AF%E8%BF%87%E7%A8%8B/</link><pubDate>Sun, 19 Dec 2021 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/kernel-methods/06-%E9%AB%98%E6%96%AF%E8%BF%87%E7%A8%8B/</guid><description>&lt;p>核岭回归给你一个数。喂进 &lt;span class="math-inline">$x_*$&lt;/span>
，它返回 &lt;span class="math-inline">$\hat{y}_* = 23.7$&lt;/span>
。完。但你接下来要&lt;em>用&lt;/em>这个预测做事——安排发货、调整剂量、下注——光一个数字不够用。&amp;ldquo;明天 25 度&amp;quot;是一句话；&amp;ldquo;很可能 25 度，95% 的概率落在 22 到 28 之间&amp;quot;才是可以&lt;em>行动&lt;/em>的信息。任何在不确定性下的决策都需要后一种。高斯过程是把核方法从&amp;quot;点预测器&amp;quot;升级到&amp;quot;分布预测器&amp;quot;最干净的路径，且不需要扔掉前五篇里任何一行核函数的代数。这一升级的代价仅仅是一次 Cholesky——同样的 &lt;span class="math-inline">$O(n^3)$&lt;/span>
、同样的 Gram 矩阵——却额外白送了后验协方差和边际似然两件相当昂贵的礼物。&lt;/p></description></item><item><title>核方法（五）：核 SVM、核 PCA 与核岭回归</title><link>https://www.chenk.top/zh/kernel-methods/05-%E6%A0%B8svm%E6%A0%B8pca%E6%A0%B8%E5%B2%AD%E5%9B%9E%E5%BD%92/</link><pubDate>Tue, 14 Dec 2021 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/kernel-methods/05-%E6%A0%B8svm%E6%A0%B8pca%E6%A0%B8%E5%B2%AD%E5%9B%9E%E5%BD%92/</guid><description>&lt;p>你的特征只有二维，数据明明是一个圆环套一个圆环，而 &lt;code>LinearSVC&lt;/code> 在 50% 准确率上瞪着你——一副&amp;quot;我真心觉得直线就是答案&amp;quot;的天真神情。你盯着散点图，又盯着模型，脑子后台终于冒出&amp;quot;核 SVM&amp;quot;三个字。改成 &lt;code>kernel='rbf'&lt;/code>，准确率瞬间跳到 0.98，整个下午你都在琢磨：刚才那一手到底是什么魔法？为什么同样的招数还能让核 PCA 把瑞士卷展平，让核岭回归三行代码拟合一个正弦波？&lt;/p></description></item><item><title>核方法（四）：常见核函数族——RBF、Matern、多项式、周期与更多</title><link>https://www.chenk.top/zh/kernel-methods/04-%E5%B8%B8%E8%A7%81%E6%A0%B8%E5%87%BD%E6%95%B0%E6%97%8F/</link><pubDate>Thu, 09 Dec 2021 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/kernel-methods/04-%E5%B8%B8%E8%A7%81%E6%A0%B8%E5%87%BD%E6%95%B0%E6%97%8F/</guid><description>&lt;p>你第一次在 sklearn 里写 &lt;code>SVC(kernel='rbf')&lt;/code>，&lt;code>gamma&lt;/code> 设了多少？&lt;code>'scale'&lt;/code>？&lt;code>'auto'&lt;/code>？滚动过那个默认值时你压根没看一眼。三个月后模型严重过拟合，Gram 矩阵看着像单位阵，你也不知道是哪个旋钮拧错了。大多数&amp;quot;核调参&amp;quot;的债，其实是&lt;em>选核&lt;/em>的债——你为了错误的理由选了默认的核，再多 grid search 也救不回来。&lt;/p></description></item><item><title>核方法（三）：RKHS——核方法的理论灵魂</title><link>https://www.chenk.top/zh/kernel-methods/03-rkhs%E7%90%86%E8%AE%BA/</link><pubDate>Sat, 04 Dec 2021 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/kernel-methods/03-rkhs%E7%90%86%E8%AE%BA/</guid><description>&lt;p>如果你曾在某节课上听到老师写下 &amp;ldquo;RKHS&amp;rdquo; 三个字母就感觉血压升高，那这篇文章是写给你的。RKHS 不是一个由三个吓人字母组成的秘密俱乐部——它就是一个函数空间。一旦你看清楚里面装的是什么东西，核方法就不再是魔法，而是你已经熟悉的那种线性代数。&lt;/p></description></item><item><title>核方法（二）：数学基础——正定核与 Mercer 定理</title><link>https://www.chenk.top/zh/kernel-methods/02-%E6%A0%B8%E6%96%B9%E6%B3%95%E7%9A%84%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/</link><pubDate>Mon, 29 Nov 2021 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/kernel-methods/02-%E6%A0%B8%E6%96%B9%E6%B3%95%E7%9A%84%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/</guid><description>&lt;p>写核 SVM 的第一周，我自信地造了一个相似度函数 &lt;code>tanh(1.5 * x.dot(y) - 2.0)&lt;/code>：对称、有界、看起来一切都很正常。然后 sklearn 给我吐了一句 &lt;code>ValueError: kernel matrix is not positive semidefinite&lt;/code>，模型效果比瞎猜还差。&lt;/p></description></item><item><title>核方法（一）：为什么需要它——从线性算法的天花板说起</title><link>https://www.chenk.top/zh/kernel-methods/01-%E4%B8%BA%E4%BB%80%E4%B9%88%E9%9C%80%E8%A6%81%E6%A0%B8%E6%96%B9%E6%B3%95/</link><pubDate>Wed, 24 Nov 2021 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/kernel-methods/01-%E4%B8%BA%E4%BB%80%E4%B9%88%E9%9C%80%E8%A6%81%E6%A0%B8%E6%96%B9%E6%B3%95/</guid><description>&lt;p>我第一次想把逻辑回归扔到一对交错的螺旋数据上时，整整一个下午都在折腾正则化系数、换求解器、归一化输入——一直觉得是哪里写错了。准确率始终徘徊在 50% 上下，跟掷硬币没区别。换句话说，模型什么都没学到。&lt;/p></description></item></channel></rss>