BCQ

Sep 15, 2025 Reinforcement Learning 26 min read

Reinforcement Learning (10): Offline Reinforcement Learning

Master offline RL: learn policies from fixed datasets without environment interaction. Covers distributional shift, Conservative Q-Learning (CQL), BCQ, Implicit Q-Learning (IQL), Decision Transformer, with a complete CQL …