标签

Deployment

Apr 7, 2026 大模型工程 30 分钟

大模型工程(十二):生产落地与监控

服务栈选型细化、给 LLM 做 autoscaling、延迟预算、prompt+completion 成本跟踪、多模型路由、FrugalGPT 级联、第一天就要的可观测性,以及能用的 on-call 模式。