标签

RAG

May 6, 2026 阿里云全栈实战 40 分钟

阿里云全栈实战（九）：OpenSearch 与 AI 搜索

从关键词搜索到 AI 驱动检索：OpenSearch 服务、向量搜索 RAG、LLM 查询重写、混合搜索。结合向量和关键词构建产品搜索引擎。

Apr 3, 2026 大模型工程 34 分钟

大模型工程（八）：RAG 架构与落地

切分策略、dense vs sparse vs 混合检索、reranker 选型、2026 年长上下文 vs RAG 的取舍，以及 10 万文档以上才会冒头的失败模式。

Nov 15, 2025 NLP 技术前沿 28 分钟

自然语言处理（十）：RAG 与知识增强系统

从第一性原理构建生产级 RAG 系统：retrieve-then-generate 概率分解、向量索引（FAISS / Milvus / Chroma / Weaviate / Pinecone）、稠密+稀疏混合检索与 RRF 融合、Cross-encoder 重排、切块策略、查询改写、HyDE，以及 Self-RAG / Corrective-RAG。

Jul 31, 2025 单点深潜 26 分钟

LLM 工作流与应用架构：企业级实战指南

从一次 API 调用到一个生产级 LLM 平台：工作流模式、RAG、模型路由、部署拓扑、成本杠杆、可观测性、企业集成——以及那些真正决定成败的取舍。