Tagged

推理

Mar 8, 2026 Aliyun PAI 4 min read

阿里云 PAI 实战(四):PAI-EAS——模型部署、冷启动、以及 TPS 谎言

PAI-EAS 端到端:基于镜像 + OSS 挂权重的部署、三种推理模式、不让账单爆炸的扩缩容、用服务组做灰度发布。配上来自官方 Quick Start 的 vLLM Qwen3 完整部署示例。