标签

RAG

May 6, 2026 阿里云全栈实战 40 分钟

阿里云全栈实战(九):OpenSearch 与 AI 搜索

从关键词搜索到 AI 驱动检索:OpenSearch 服务、向量搜索 RAG、LLM 查询重写、混合搜索。结合向量和关键词构建产品搜索引擎。

Apr 3, 2026 大模型工程 30 分钟

大模型工程(八):RAG 架构与落地

切分策略、dense vs sparse vs 混合检索、reranker 选型、2026 年长上下文 vs RAG 的取舍,以及 10 万文档以上才会冒头的失败模式。

Nov 15, 2025 NLP 技术前沿 28 分钟

自然语言处理(十):RAG 与知识增强系统

从第一性原理构建生产级 RAG 系统:retrieve-then-generate 概率分解、向量索引(FAISS / Milvus / Chroma / Weaviate / Pinecone)、稠密+稀疏混合检索与 RRF 融合、Cross-encoder 重排、切块策略、查询改写、HyDE,以及 Self-RAG / Corrective-RAG。

Jul 31, 2025 单点深潜 26 分钟

LLM 工作流与应用架构:企业级实战指南

从一次 API 调用到一个生产级 LLM 平台:工作流模式、RAG、模型路由、部署拓扑、成本杠杆、可观测性、企业集成——以及那些真正决定成败的取舍。