Tagged

内在奖励

Aug 16, 2025 Reinforcement Learning 16 min read

强化学习（四）：探索策略与好奇心驱动学习

在几乎没有奖励反馈的环境中，智能体如何发现回报？从计数型方法到 ICM、RND、NGU——好奇心驱动探索的完整脉络与工程实践。