<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>PCA on Chen Kai Blog</title><link>https://www.chenk.top/zh/tags/pca/</link><description>Recent content in PCA on Chen Kai Blog</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Thu, 05 Feb 2026 09:00:00 +0000</lastBuildDate><atom:link href="https://www.chenk.top/zh/tags/pca/index.xml" rel="self" type="application/rss+xml"/><item><title>机器学习数学推导（十七）：降维与主成分分析</title><link>https://www.chenk.top/zh/ml-math-derivations/17-%E9%99%8D%E7%BB%B4%E4%B8%8E%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90/</link><pubDate>Thu, 05 Feb 2026 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/ml-math-derivations/17-%E9%99%8D%E7%BB%B4%E4%B8%8E%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90/</guid><description>&lt;h2 id="你将学到什么" class="heading-anchor">你将学到什么&lt;a href="#%e4%bd%a0%e5%b0%86%e5%ad%a6%e5%88%b0%e4%bb%80%e4%b9%88" class="heading-link" aria-label="Permalink to this section" title="Copy link to this section">#&lt;/a>
&lt;/h2>&lt;p>给聚类算法输入 10,000 维的数据，它大概率会失败——问题不在于算法本身，而在于&lt;strong>高维空间对基于距离的学习方法天然不友好&lt;/strong>。体积几乎都集中在球壳上，最近邻和最远邻的距离比值趋近于 &lt;span class="math-inline">$1$&lt;/span>
，“近”这个概念变得毫无意义。降维的目的正是将数据投影到低维空间，同时保留其关键结构。&lt;/p></description></item><item><title>线性代数（十五）：机器学习中的线性代数——从 PCA 到推荐系统</title><link>https://www.chenk.top/zh/linear-algebra/15-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E4%B8%AD%E7%9A%84%E7%BA%BF%E6%80%A7%E4%BB%A3%E6%95%B0/</link><pubDate>Wed, 09 Apr 2025 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/linear-algebra/15-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E4%B8%AD%E7%9A%84%E7%BA%BF%E6%80%A7%E4%BB%A3%E6%95%B0/</guid><description>&lt;p>随便找个资深机器学习工程师问一句：“你每天实际用得最多的数学是什么？”答案几乎肯定是&lt;strong>线性代数&lt;/strong>。微积分用于推导公式，概率用于建模，但在实际运行 ML 系统时，大部分时间都花在矩阵向量乘法、分解和投影上。PyTorch 的 &lt;code>Linear&lt;/code>、scikit-learn 的 &lt;code>PCA&lt;/code>、Spark MLlib 的 &lt;code>ALS&lt;/code>，还有 Transformer 的注意力头，其实都是同一个线性代数基本操作换了个马甲。&lt;/p></description></item><item><title>线性代数（九）：奇异值分解 SVD</title><link>https://www.chenk.top/zh/linear-algebra/09-%E5%A5%87%E5%BC%82%E5%80%BC%E5%88%86%E8%A7%A3svd/</link><pubDate>Wed, 26 Feb 2025 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/linear-algebra/09-%E5%A5%87%E5%BC%82%E5%80%BC%E5%88%86%E8%A7%A3svd/</guid><description>&lt;h2 id="一为什么-svd-配得上皇冠二字" class="heading-anchor">一、为什么 SVD 配得上“皇冠”二字&lt;a href="#%e4%b8%80%e4%b8%ba%e4%bb%80%e4%b9%88-svd-%e9%85%8d%e5%be%97%e4%b8%8a%e7%9a%87%e5%86%a0%e4%ba%8c%e5%ad%97" class="heading-link" aria-label="Permalink to this section" title="Copy link to this section">#&lt;/a>
&lt;/h2>&lt;p>&lt;a href="https://www.chenk.top/zh/linear-algebra/08-%e5%af%b9%e7%a7%b0%e7%9f%a9%e9%98%b5%e4%b8%8e%e4%ba%8c%e6%ac%a1%e5%9e%8b/">第 8 章&lt;/a>
的谱定理给出了 &lt;span class="math-inline">$A = Q\Lambda Q^{\!\top}$&lt;/span>
，形式简洁优美，但有个硬性限制：&lt;strong>仅适用于对称矩阵&lt;/strong>。而现实中遇到的矩阵大多不对称，甚至根本不是方阵：&lt;/p></description></item><item><title>核方法（五）：核 SVM、核 PCA 与核岭回归</title><link>https://www.chenk.top/zh/kernel-methods/05-%E6%A0%B8svm%E6%A0%B8pca%E6%A0%B8%E5%B2%AD%E5%9B%9E%E5%BD%92/</link><pubDate>Tue, 14 Dec 2021 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/kernel-methods/05-%E6%A0%B8svm%E6%A0%B8pca%E6%A0%B8%E5%B2%AD%E5%9B%9E%E5%BD%92/</guid><description>&lt;p>你的特征只有二维，数据明明是一个圆环套一个圆环，而 &lt;code>LinearSVC&lt;/code> 在 50% 准确率上瞪着你——一副&amp;quot;我真心觉得直线就是答案&amp;quot;的天真神情。你盯着散点图，又盯着模型，脑子后台终于冒出&amp;quot;核 SVM&amp;quot;三个字。改成 &lt;code>kernel='rbf'&lt;/code>，准确率瞬间跳到 0.98，整个下午你都在琢磨：刚才那一手到底是什么魔法？为什么同样的招数还能让核 PCA 把瑞士卷展平，让核岭回归三行代码拟合一个正弦波？&lt;/p></description></item></channel></rss>