<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Aliyun-Pai on Chen Kai Blog</title><link>https://www.chenk.top/zh/series/aliyun-pai/</link><description>Recent content in Aliyun-Pai on Chen Kai Blog</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Mon, 09 Mar 2026 09:00:00 +0000</lastBuildDate><atom:link href="https://www.chenk.top/zh/series/aliyun-pai/index.xml" rel="self" type="application/rss+xml"/><item><title>阿里云 PAI（五）：Designer vs Model Gallery</title><link>https://www.chenk.top/zh/aliyun-pai/05-pai-designer-vs-quickstart/</link><pubDate>Mon, 09 Mar 2026 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/aliyun-pai/05-pai-designer-vs-quickstart/</guid><description>&lt;p>前四篇文章介绍了底层原语——DSW、DLC、EAS——以及如何用 Python 对它们进行编排；本文则聚焦于两个 GUI 产品：&lt;strong>PAI-Designer&lt;/strong>（拖拽式表格 pipeline 构建）和 &lt;strong>Model Gallery&lt;/strong>（零代码部署与微调开源模型）。这两个工具将底层原语封装为开箱即用的解决方案，专为不想写 Python 的用户设计。尽管资深工程师未必会首选它们，但在两种特定场景下，它们恰恰是最合适的选择。&lt;/p></description></item><item><title>阿里云 PAI（四）：EAS 部署与冷启动真相</title><link>https://www.chenk.top/zh/aliyun-pai/04-pai-eas-model-serving/</link><pubDate>Sun, 08 Mar 2026 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/aliyun-pai/04-pai-eas-model-serving/</guid><description>&lt;p>钱主要花在 EAS 上：DSW 开发每月只需几百元，DLC 训练属于脉冲式消费，而 EAS 则是 24/7 持续计费——服务一旦进入 Running 状态，费用便持续产生。自动伸缩配置中的 &lt;code>min_replicas&lt;/code>（最小副本数）是整个平台最关键的杠杆。这篇文章汇总了我在部署首个生产端点前最希望掌握的关键信息。&lt;/p></description></item><item><title>阿里云 PAI（三）：DLC 分布式训练</title><link>https://www.chenk.top/zh/aliyun-pai/03-pai-dlc-distributed-training/</link><pubDate>Sat, 07 Mar 2026 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/aliyun-pai/03-pai-dlc-distributed-training/</guid><description>&lt;p>DSW 笔记本适合单人单卡的场景；一旦你需要八张 GPU 跨两个节点训练，或者训练时长超过八小时（也就是你愿意为一个浏览器标签页持续守候的极限），就该切换到 &lt;strong>DLC&lt;/strong>。DLC 是 PAI 面向托管 Kubernetes 集群的作业提交入口：你只需声明需求（镜像、命令、资源规格、数据挂载路径），它就会自动调度 Pod、运行至完成、持久化日志并返回结果。官方文档称其为 &lt;em>Deep Learning Containers&lt;/em>，但我们日常交流中统一简称为“DLC 任务”。&lt;/p></description></item><item><title>阿里云 PAI（二）：DSW Notebook 避坑指南</title><link>https://www.chenk.top/zh/aliyun-pai/02-pai-dsw-notebook/</link><pubDate>Fri, 06 Mar 2026 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/aliyun-pai/02-pai-dsw-notebook/</guid><description>&lt;p>每次带新人上手 PAI，第一天的剧本都差不多：启动 DSW 实例，&lt;code>pip install&lt;/code> 一通依赖，训练一小时，不知为何重启了 kernel，然后一脸茫然地问我模型文件去哪了。实话实说——“在 &lt;code>/root&lt;/code> 下，但那台节点已经没了”——这种教训一次就够了。这篇文章就是让你提前避坑的版本。&lt;/p></description></item><item><title>阿里云 PAI（一）：平台概览与产品地图</title><link>https://www.chenk.top/zh/aliyun-pai/01-platform-overview/</link><pubDate>Thu, 05 Mar 2026 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/aliyun-pai/01-platform-overview/</guid><description>&lt;p>只要你的团队在阿里云上训练或部署模型，迟早会用到 PAI 控制台。PAI 是一个平台级整合层（umbrella），真正干活的是它底下的核心产品：笔记本（DSW）、分布式训练服务（DLC）、模型推理服务（EAS），以及两个面向快速交付的 GUI 层——Designer 和 Model Gallery。我在一个 AI 营销平台上用 PAI 跑了大约十八个月的真实 LLM 负载，写下这个系列，就是希望你在部署第一个 endpoint 前，能少踩些我踩过的坑。&lt;/p></description></item></channel></rss>