<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Embeddings on Chen Kai Blog</title><link>https://www.chenk.top/zh/tags/embeddings/</link><description>Recent content in Embeddings on Chen Kai Blog</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Fri, 03 Apr 2026 09:00:00 +0000</lastBuildDate><atom:link href="https://www.chenk.top/zh/tags/embeddings/index.xml" rel="self" type="application/rss+xml"/><item><title>大模型工程（八）：RAG 架构与落地</title><link>https://www.chenk.top/zh/llm-engineering/08-rag/</link><pubDate>Fri, 03 Apr 2026 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/llm-engineering/08-rag/</guid><description>&lt;p>RAG 是当前 LLM 应用中部署最广泛，却工程实践最不成熟的范式。2024 年流行的 Demo 套路——用 &lt;code>text-embedding-3-large&lt;/code> 把所有内容向量化，扔进 pgvector，再取 cosine 相似度 top-5——在千篇量级文档和对答案容错率较高的演示场景下尚可应付；但一旦面对十万级真实业务文档，且客户对答案准确性有严格要求时，这套方案便难以为继。本章内容，正是我希望更多团队在构建第二代 RAG 系统前就能掌握的关键认知。&lt;/p></description></item><item><title>推荐系统（三）—— 深度学习基础模型</title><link>https://www.chenk.top/zh/recommendation-systems/03-%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80%E6%A8%A1%E5%9E%8B/</link><pubDate>Sun, 07 Dec 2025 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/recommendation-systems/03-%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80%E6%A8%A1%E5%9E%8B/</guid><description>&lt;p>2016 年 6 月，Google 发表了一篇仅一页的论文，悄然重塑了推荐系统的格局。该文介绍了 &lt;strong>Wide &amp;amp; Deep Learning&lt;/strong>——当时正驱动着十亿用户规模的 Google Play 应用商店推荐。短短一年内，各大科技公司纷纷将深度模型投入生产；到 2019 年，行业标准已然转变：矩阵分解不再是核心系统，而仅作为基线方法。&lt;/p></description></item></channel></rss>