AI Agents
Terraform 实战(八):一条命令拉起全栈
把七个 module 拼到一个仓库,跑一次 terraform apply,看一个完整的 Agent runtime——VPC、ECS、RDS、OpenSearch、OSS、LLM 网关、SLS 观测、成本告警——七分钟内起来。真实 apply 输出、module DAG、生产环境完整成本核算,以及可 fork 的起手仓库。
Terraform 实战(七):可观测与成本告警
日志进 SLS、Trace 进 ARMS、指标进 CloudMonitor——全部用 HCL 配,新环境天生带观测。真实救过我项目的四条告警,再加上 SLS 驱动的成本看板,发薪日之前告诉你哪个 Agent 在烧预算。
Terraform 实战(六):LLM Gateway 与密钥管理
把所有 LLM 访问收敛到一个网关:按 Agent 限流、请求落 SLS 日志、KMS 之外不留密钥。Terraform 配 API Gateway + ECS 上自托管 LiteLLM,DashScope/OpenAI/Anthropic 的 key 通过 KMS Secrets Manager 自动轮转。
Terraform 实战(五):向量库、RDS 与对象存储
Agent 有三种记忆,分别落到三个阿里云服务上:会话用 PolarDB/RDS,embedding 用 OpenSearch 向量版或 pgvector,产物用 OSS。每一层的真实 Terraform,再加上让账单不暴涨的 lifecycle 和备份规则。
Terraform 实战(四):ECS、ACK 还是函数计算
Agent 主循环在阿里云上有三个合理落点:长跑 ECS + pm2、ACK 上的 Kubernetes Pod、函数计算触发式调用。我用来挑选的成本拐点模型,再加一段真实的 cloud-init 脚本,从裸 Ubuntu 到 Agent 跑起来 90 秒搞定。
Terraform 实战(三):复用 VPC 与安全基线
第一个可复用 module——三可用区 VPC,公私网交换机分层,NAT 出网,按 tier 分层的安全组,再加上按数据域分的 KMS 主密钥。同样的代码出现在我交付过的每一个 Agent stack 里,参数化但本体不变。
Terraform 实战(二):Provider 认证与 State
钉死 alicloud provider 版本,在 AK/SK、AssumeRole、ECS RAM role 三种认证方式之间正确选择,把 tfstate 放到 OSS 并用 Tablestore 加锁,再加上让 dev/staging/prod 不互相踩脚的 workspace 模式。还有初学者第一天必踩的十几个坑。
Terraform 实战(一):为何 IaC 是唯一出路
Agent 系统是个移动靶——每个月都有新工具、新记忆库、新区域。手动点控制台撑不到第二个同事入职。本系列第一篇讲为什么要在阿里云上用 Terraform,盘点 alicloud provider 真正覆盖了哪些资源,并把它和 Pulumi、Crossplane、ROS 摆在一起对比,让你第一次就选对。
AI Agent 完全指南:从理论到工业实践
面向工程师的 AI Agent 实战指南:规划(CoT/ReAct/ToT)、记忆体系、工具调用、自我反思、多 Agent 协作、主流框架(LangChain、LangGraph、AutoGen、CrewAI)、评估方法与生产部署的全部坑。







