Tagged

LLM

Mar 22, 2026 Terraform Agents 6 min read

用 Terraform 给 AI Agent 上云(六):LLM 网关与密钥管理

把所有 LLM 访问收敛到一个网关:按 Agent 限流、请求落 SLS 日志、KMS 之外不留密钥。Terraform 配 API Gateway + ECS 上自托管 LiteLLM,DashScope/OpenAI/Anthropic 的 key 通过 KMS Secrets Manager 自动轮转。

Mar 7, 2026 Aliyun PAI 4 min read

阿里云 PAI 实战(三):PAI-DLC——不用通宵刨坑的分布式训练

在 PAI-DLC 上提交真实多卡训练任务、看懂三种资源池(灵骏、通用、抢占)、用好 AIMaster + EasyCKPT 让一台抽风节点不会让你白干一天。

Feb 26, 2026 Aliyun Bailian 5 min read

阿里云百炼实战(二):Qwen 文本大模型在生产环境的用法

按延迟和成本选 Qwen 变体、function calling 写对、JSON mode 不再哭、enable_thinking + 流式必绑这条文档没明说的事。

Feb 25, 2026 Aliyun Bailian 6 min read

阿里云百炼实战(一):平台总览与第一个请求

一个工程师视角的阿里云百炼(DashScope)导览——模型目录里真正能用的东西、两种 endpoint 形态、异步任务模式,以及一个 hello-world 请求把后续文章的基础铺好。

Jan 3, 2026 Recommendation Systems 14 min read

推荐系统(十二)—— 大语言模型与推荐系统

LLM 如何重塑推荐系统:增强器(P5、M6Rec)、预测器(TallRec、GenRec)、智能体(LlamaRec、ChatREC)三种角色,混合管线、冷启动突破、Prompt 设计与成本/质量帕累托前沿。

Nov 25, 2025 NLP 16 min read

自然语言处理(十二):前沿技术与实战应用

系列收官:Agent 与工具调用(Function Calling、ReAct)、代码生成(Code Llama、Codex)、长上下文(Longformer、Infini-attention)、推理模型(o1、R1)、安全对齐、评估体系,以及基于 FastAPI + vLLM + Docker 的生产级部署。

Nov 20, 2025 NLP 14 min read

自然语言处理(十一):多模态大模型

多模态大模型深度解析:CLIP的对比学习、BLIP-2的Q-Former桥接架构、LLaVA的视觉指令微调、Whisper语音识别、GPT-4V能力图谱以及MMBench/MME/MMMU评测体系——配可运行代码。

Nov 15, 2025 NLP 14 min read

自然语言处理(十):RAG与知识增强系统

从第一性原理构建生产级 RAG 系统:retrieve-then-generate 概率分解、向量索引(FAISS / Milvus / Chroma / Weaviate / Pinecone)、稠密+稀疏混合检索与 RRF 融合、Cross-encoder 重排、切块策略、查询改写、HyDE,以及 Self-RAG / Corrective-RAG。

Nov 10, 2025 NLP 13 min read

自然语言处理(九):大语言模型架构深度解析

拆解现代 LLM 的内部结构:Pre-norm + RMSNorm + SwiGLU + RoPE + GQA、KV Cache 机制、FlashAttention 的 IO 调度、稀疏 MoE,以及 INT8/INT4 量化。

Nov 5, 2025 NLP 11 min read

自然语言处理(八):模型微调与PEFT

深入参数高效微调:LoRA 为什么用低秩更新就够、QLoRA 把 7B 模型塞进 6GB 显存的内存账本、Adapter 与 Prefix-Tuning 的取舍,以及生产环境怎么选。

Oct 31, 2025 NLP 16 min read

自然语言处理(七):提示工程与In-Context Learning

从提示结构、思维链到 Self-Consistency 与 ReAct:一套关于 In-Context Learning 的工作原理、必须正面应对的方差问题,以及能扩展到生产系统的提示模式。

Sep 25, 2025 Reinforcement Learning 2 min read

强化学习(十二):RLHF与大语言模型应用

RLHF 把基础语言模型变成 ChatGPT 与 Claude 的完整路径:SFT→奖励模型→PPO 三阶段流程、Bradley-Terry 偏好模型、DPO 闭式解推导、RLAIF 与 Constitutional AI、Goodhart 定律下的奖励黑客,以及强化学习在具身智能与推理时搜索中的下一步。

Sep 19, 2025 Standalone 18 min read

AI Agent 完全指南:从理论到工业实践

面向工程师的 AI Agent 实战指南:规划(CoT/ReAct/ToT)、记忆体系、工具调用、自我反思、多 Agent 协作、主流框架(LangChain、LangGraph、AutoGen、CrewAI)、评估方法与生产部署的全部坑。

Jun 3, 2025 Standalone 11 min read

浅谈位置编码:从 Sinusoidal 到 RoPE 与 ALiBi

系统梳理 Transformer 位置编码:为什么 Attention 需要它、绝对/相对/RoPE/ALiBi 各方案怎么算、长上下文外推时哪种最稳,以及如何为新模型选型。

Oct 13, 2024 Standalone 11 min read

Integrating Large Language Models with Graphical Session-Based Recommendation

会话推荐(Session-based Recommendation, SBR)本质上是一个"短历史"问题:你只看到用户在一次会话里很短的一段点击序列(通常 3-20 次),就要预测下一个最可能点击的物品。难点不在概念,而在工程现实——会话短、长尾多、冷启动多,纯靠交互图(ID + 转移边)经常学不稳:新物品几乎没有边,长尾物品的边稀疏且不可靠,再叠加一层用户随手点击的噪声。

May 5, 2024 Standalone 21 min read

多模态大模型与下游任务研究

梳理多模态大模型的核心技术:视觉-语言对齐、跨模态融合、多模态预训练,以及 LLM 在传统 NLP 任务中的应用与优化(提示/微调/蒸馏/检索增强)。

Dec 22, 2023 Standalone 13 min read

LLM 工作流与应用架构:企业级实战指南

从一次 API 调用到一个生产级 LLM 平台:工作流模式、RAG、模型路由、部署拓扑、成本杠杆、可观测性、企业集成——以及那些真正决定成败的取舍。

Nov 24, 2023 Standalone 24 min read

提示词工程完全指南:从零基础到高级优化

从零样本基础到思维树、DSPy 和自动化优化,掌握提示词工程。包含基准测试、代码示例和调试工具箱。

Dec 16, 2022 Standalone 10 min read

优化算法的演进:从梯度下降到 Adam(再到 2025 之后)

一篇文章串起 GD → SGD → Momentum → NAG → AdaGrad → RMSProp → Adam → AdamW,再到 Lion / Sophia / Schedule-Free 的完整脉络:每一步解决了前一步的什么痛点?为什么大模型几乎都在用 AdamW?以及 2023 年之后我们究竟走到了哪里。