
强化学习的DQN算法,使用PyTorch在OpenAI ...中实现。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Atari Pong项目旨在评估深度Q学习(DQN)在OpenAI环境中对Atari 1600游戏中的准确性和有效性。 为了进一步提升性能,该研究对DQN算法进行了多项改进,包括多步DQN、Double DQN和Dueling DQN等策略。 图表显示,基于基本DQN的方法,仅需大约110场游戏训练便可实现与人类玩家相当的准确率水平;而经过300场游戏的训练后,其准确性则显著提高至极高的水平。 本研究中探索的DQN改进版本在效率和准确性方面均展现出了一定的进步。 具体而言,第一集与第216集在OpenAI制作的环保环境Atari 1600仿真器中进行测试,涵盖了59种不同的游戏场景。 深度强化学习采用了RGB图像作为输入,该图像具有210x160x3的像素维度,由于计算量较大,因此被转换为灰度图像。 随后,图像进行了下采样处理并裁剪至84x84x1的大小以适应播放需求。
全部评论 (0)
还没有任何评论哟~


