chenk
.
top
Home
Series
Projects
Archives
About
EN
esc
Search articles, series, and tags…
Tagged
AlphaGo
Sep 5, 2025
Reinforcement Learning
12 min read
强化学习(八):AlphaGo与蒙特卡洛树搜索
从 MCTS 到 AlphaGo、AlphaGo Zero、AlphaZero 与 MuZero:UCT 探索-利用、自我对弈训练、在学到的世界模型里规划。附五子棋上的 AlphaZero 完整实现。