chenk
.
top
首页
系列
项目
归档
关于
EN
esc
搜索
标签
MBPO
Aug 21, 2025
强化学习
24 分钟
强化学习(五):Model-Based 强化学习与世界模型
从 Dyna、MBPO 到 World Models、Dreamer 和 MuZero——学一个环境模型,让智能体在想象中规划,把样本效率提高 10-100 倍。