Tagged

动态规划

Aug 1, 2025 Reinforcement Learning 16 min read

强化学习(一):基础与核心概念

用骑自行车的类比把强化学习从零讲清楚:MDP、Bellman 方程、动态规划、蒙特卡洛、时序差分(TD),附带可直接运行的 Python 代码。

Jul 30, 2022 LeetCode Patterns 12 min read

LeetCode(七)—— 动态规划入门

动态规划在算法学习里有种被神化的气质,听起来高深莫测,做起来又总像在凑公式。其实它一点都不玄。DP 就是一个非常朴素的想法:把同样的子问题算一次就够了,别反复算。所有让人头大的「状态转移方程」「滚动数组」「区间 DP」,归根结底都是围绕这一个想法在打转。