<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>词向量 on Chen Kai Blog</title><link>https://www.chenk.top/zh/tags/%E8%AF%8D%E5%90%91%E9%87%8F/</link><description>Recent content in 词向量 on Chen Kai Blog</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Mon, 06 Oct 2025 09:00:00 +0000</lastBuildDate><atom:link href="https://www.chenk.top/zh/tags/%E8%AF%8D%E5%90%91%E9%87%8F/index.xml" rel="self" type="application/rss+xml"/><item><title>自然语言处理（二）：词向量与语言模型</title><link>https://www.chenk.top/zh/nlp/02-%E8%AF%8D%E5%90%91%E9%87%8F%E4%B8%8E%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B/</link><pubDate>Mon, 06 Oct 2025 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/nlp/02-%E8%AF%8D%E5%90%91%E9%87%8F%E4%B8%8E%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B/</guid><description>&lt;span class="math-block">$$\vec{\text{king}} - \vec{\text{man}} &amp;#43; \vec{\text{woman}} \approx \vec{\text{queen}}$$&lt;/span>
&lt;p>
自然语言处理（NLP）的发展轨迹因此发生了根本性转变，进入了“表示学习”的时代。本文将沿着这条脉络展开：从独热编码为何失效，到 Word2Vec 如何通过浅层神经网络打开新思路；从 GloVe 如何利用全局统计信息，到 FastText 如何借助子词 n-gram 处理未见过的词；最终，词嵌入与催生它们的语言模型联系起来，揭示两者之间的深层关系。&lt;/p></description></item></channel></rss>