<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>文本预处理 on Chen Kai Blog</title><link>https://www.chenk.top/zh/tags/%E6%96%87%E6%9C%AC%E9%A2%84%E5%A4%84%E7%90%86/</link><description>Recent content in 文本预处理 on Chen Kai Blog</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Wed, 01 Oct 2025 09:00:00 +0000</lastBuildDate><atom:link href="https://www.chenk.top/zh/tags/%E6%96%87%E6%9C%AC%E9%A2%84%E5%A4%84%E7%90%86/index.xml" rel="self" type="application/rss+xml"/><item><title>自然语言处理（一）：NLP 入门与文本预处理</title><link>https://www.chenk.top/zh/nlp/01-nlp%E5%85%A5%E9%97%A8%E4%B8%8E%E6%96%87%E6%9C%AC%E9%A2%84%E5%A4%84%E7%90%86/</link><pubDate>Wed, 01 Oct 2025 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/nlp/01-nlp%E5%85%A5%E9%97%A8%E4%B8%8E%E6%96%87%E6%9C%AC%E9%A2%84%E5%A4%84%E7%90%86/</guid><description>&lt;p>每当你向通义千问提问、让 GitHub Copilot 补全代码，或浏览 Google 翻译结果时，实际上都在使用一套凝聚了七十年技术积累的系统——自然语言处理（NLP）。NLP 教会机器如何阅读、评分、转换和生成人类语言。尽管现代技术体系复杂，其底层仍然广泛依赖于几十年前发明的基础预处理方法。&lt;/p></description></item></channel></rss>