
强化学习代码集(DP, MC, TD, DQN, PG, AC, A3C, DDPG).zip
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本资源包含多种经典强化学习算法的Python实现代码,包括动态规划、蒙特卡洛方法、时序差分学习以及DQN、策略梯度、AC、A3C和DDPG等先进模型。
这段文字提到了多种算法和技术,包括DP(动态规划)、MC(蒙特卡洛方法)、TD(时序差分学习)、TD-lambda、DQN(深度Q网络)、PG(策略梯度法)、AC(优势 Actor-Critic 方法)、A3C(异步AdvantageActor-Critic), DDPG (分布式深度确定性策略梯度), Dyna_Q, Bandit,以及AlphaGoZero,并且还提到了一些仿真游戏的源代码。
全部评论 (0)
还没有任何评论哟~


