Tagged

层次化RL

Sep 20, 2025 Reinforcement Learning 12 min read

强化学习(十一):层次化强化学习与元学习

层次化强化学习(Options、MAXQ、Feudal Networks、目标条件策略)与元强化学习(MAML、FOMAML、RL²)的系统讲解:时序抽象、半马尔可夫过程、Manager-Worker 架构、二阶元梯度与循环式元学习器,附带 PyTorch 实现。