
深度Q学习:张量流中DQN、DDQN和决斗DQN的实现
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文章介绍在张量流环境中实现深度Q网络(DQN)、双层DQN(DDQN)及决斗DQN的技术细节与实践方法,旨在帮助读者深入理解强化学习算法。
深度Q学习在OpenAI Gym上测试了具有基本或双重Q-learning训练算法的深度Q网络,并实现了对决Q-network的功能。该项目使用Python 3.5和TensorFlow(通过tensorflow-gpu 1.2.1版本)实现。环境来自OpenAi Gym。
要安装Gym,请访问其官方网站获取相关文档。
项目运行需要从atari_wrappers.py训练网络并使用train.py模块执行网络培训,要求提供一个将被学习的体育馆环境作为参数。可选地可以指定使用的网络类型和学习算法。可以通过--checkpoint参数提供网络权重,并通过--training_info参数提供培训状态(例如当前步骤、总步骤数以及经验重播缓冲区数据)以从检查点重新开始训练。
使用--checkpoint_step可以设定保存检查点的步长,格式如下:python train.py --...
全部评论 (0)
还没有任何评论哟~


