Tagged

层次化RL

Sep 20, 2025 Reinforcement Learning 12 min read

层次化强化学习（Options、MAXQ、Feudal Networks、目标条件策略）与元强化学习（MAML、FOMAML、RL²）的系统讲解：时序抽象、半马尔可夫过程、Manager-Worker 架构、二阶元梯度与循环式元学习器，附带 PyTorch 实现。