
该存储库涵盖了大量基于PyTorch实现的经典深度强化学习算法,例如DQN和DDQN,以及Dualling Netw...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该存储库将运用PyTorch来构建和实现一系列具有代表性的深度强化学习算法。 核心目标是为学习者提供易于理解的代码示例,从而帮助他们深入掌握深度强化学习的原理和实践。 未来的规划包括持续增加算法的种类,并对现有代码进行维护和优化。 目前已包含以下深度强化学习算法:深度Q学习网络(DQN),基本DQN,双Q网络,决斗网络架构,深度确定性策略梯度(DDPG),优势演员评判(A2C),信任区域策略梯度(TRPO),以及近端政策优化(PPO)。此外,还集成了使用克罗内克因素信任区域(ACKTR)的演员评论家和软演员评论(SAC)更新信息。 在2018年10月17日的更新中,大部分算法均得到了显著改进,并且增加了关于图的实验研究(除DDPG算法外)。 PPO算法现在能够兼容atari游戏和mujoco-env环境的使用。 TRPO算法表现出更高的稳定性,并能产生更优异的结果! 2019年7月15日的更新则取消了对OpenAI基准测试环境的依赖。 我在rl__utils模块中添加了诸多实用的功能,同时DDPG也进行了重新实现并扩展了其支持的结果类型。 自述文件已经过修订,并且代码结构也进行了细微的调整以提升可读性和组织性。
全部评论 (0)
还没有任何评论哟~


