Alibaba Cloud
阿里云全栈实战(十二):Terraform 全栈统一交付
终极整合:将第 1-11 部分的所有内容编码为 Terraform 模块。VPC、ECS、RDS、OSS、RAM、SLS、Function Compute — 一键部署。加上 GitHub Actions 的 CI/CD 和成本优化。
阿里云全栈实战(十一):PAI 打造机器学习平台
阿里云完整 ML 平台:PAI-DSW 笔记本、PAI-DLC 分布式训练、PAI-EAS 模型服务、Designer 可视化工作流、Model Gallery。端到端训练和部署自定义模型。
阿里云全栈实战(十):DashScope 与大模型层
阿里云完整 LLM 工具包:Qwen 模型系列、DashScope API(兼容 OpenAI)、万象图像/视频生成、Qwen TTS、异步任务模式、微调。构建多模态 AI 流水线。
阿里云全栈实战(九):OpenSearch 与 AI 搜索
从关键词搜索到 AI 驱动检索:OpenSearch 服务、向量搜索 RAG、LLM 查询重写、混合搜索。结合向量和关键词构建产品搜索引擎。
阿里云全栈实战(八):Serverless 与事件驱动
在阿里云上无服务器化:Function Compute 触发器、运行时、冷启动、定价。EventBridge 事件路由。API Gateway 集成。构建事件驱动的图像处理流水线。
阿里云全栈实战(七):SLS 打造可观测性体系
构建全栈可观测性:SLS 日志收集和查询、CloudMonitor 指标和告警、ARMS 分布式追踪。为生产 Web 应用设置完整的监控堆栈。
阿里云全栈实战(六):RAM、KMS 筑牢云安全
锁定云安全:RAM 用户、组、角色和策略。STS 临时凭证。KMS 加密。ActionTrail 审计日志。构建最小权限的多团队访问模型。
阿里云全栈实战(五):RDS 与 PolarDB 数据基石
RDS MySQL 与 PolarDB 对比:何时使用哪个。实例规格、读副本、代理端点、备份/恢复、监控、慢查询分析。构建高可用性和读扩展的生产数据库。
阿里云全栈实战(四):OSS——对象存储最佳实践
掌握阿里云 OSS:存储桶类型、存储类别、访问控制(ACL、RAM、STS、签名 URL)、生命周期规则、跨区域复制、CDN 集成、自定义域名。构建完整的媒体存储后端。
阿里云全栈实战(三):VPC、SLB 构建网络基石
从零开始构建生产网络:VPC 架构、CIDR 规划、跨可用区 VSwitch、安全组防火墙、SLB 负载均衡、NAT 网关出站流量、EIP 公网访问。
阿里云全栈实战(二):ECS——让计算回归本质
了解 ECS 所需的一切:实例系列(g8、c8、r8、GPU)、定价模型、cloud-init 自动化、安全组、密钥对。从零部署生产就绪的应用服务器。
阿里云全栈实战(一):生态全景图——阿里云到底是什么
阿里云产品生态实战指南。将每个核心服务映射到 AWS/Azure/GCP 对标产品,从零开通账号,部署第一台 ECS 实例——一小时搞定。
Terraform 实战(八):一条命令拉起全栈
把七个 module 拼到一个仓库,跑一次 terraform apply,看一个完整的 Agent runtime——VPC、ECS、RDS、OpenSearch、OSS、LLM 网关、SLS 观测、成本告警——七分钟内起来。真实 apply 输出、module DAG、生产环境完整成本核算,以及可 fork 的起手仓库。
Terraform 实战(七):可观测与成本告警
日志进 SLS、Trace 进 ARMS、指标进 CloudMonitor——全部用 HCL 配,新环境天生带观测。真实救过我项目的四条告警,再加上 SLS 驱动的成本看板,发薪日之前告诉你哪个 Agent 在烧预算。
Terraform 实战(六):LLM Gateway 与密钥管理
把所有 LLM 访问收敛到一个网关:按 Agent 限流、请求落 SLS 日志、KMS 之外不留密钥。Terraform 配 API Gateway + ECS 上自托管 LiteLLM,DashScope/OpenAI/Anthropic 的 key 通过 KMS Secrets Manager 自动轮转。
Terraform 实战(五):向量库、RDS 与对象存储
Agent 有三种记忆,分别落到三个阿里云服务上:会话用 PolarDB/RDS,embedding 用 OpenSearch 向量版或 pgvector,产物用 OSS。每一层的真实 Terraform,再加上让账单不暴涨的 lifecycle 和备份规则。
Terraform 实战(四):ECS、ACK 还是函数计算
Agent 主循环在阿里云上有三个合理落点:长跑 ECS + pm2、ACK 上的 Kubernetes Pod、函数计算触发式调用。我用来挑选的成本拐点模型,再加一段真实的 cloud-init 脚本,从裸 Ubuntu 到 Agent 跑起来 90 秒搞定。
Terraform 实战(三):复用 VPC 与安全基线
第一个可复用 module——三可用区 VPC,公私网交换机分层,NAT 出网,按 tier 分层的安全组,再加上按数据域分的 KMS 主密钥。同样的代码出现在我交付过的每一个 Agent stack 里,参数化但本体不变。
Terraform 实战(二):Provider 认证与 State
钉死 alicloud provider 版本,在 AK/SK、AssumeRole、ECS RAM role 三种认证方式之间正确选择,把 tfstate 放到 OSS 并用 Tablestore 加锁,再加上让 dev/staging/prod 不互相踩脚的 workspace 模式。还有初学者第一天必踩的十几个坑。
Terraform 实战(一):为何 IaC 是唯一出路
Agent 系统是个移动靶——每个月都有新工具、新记忆库、新区域。手动点控制台撑不到第二个同事入职。本系列第一篇讲为什么要在阿里云上用 Terraform,盘点 alicloud provider 真正覆盖了哪些资源,并把它和 Pulumi、Crossplane、ROS 摆在一起对比,让你第一次就选对。



















