
RL-MPE: 在OpenAI MPE环境中使用DDPG, MADDPG, DQN, MADDPG+Advantage进行实验
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
本文介绍了在OpenAI多智能体环境(MPE)中,采用DDPG、MADDPG和DQN等算法进行的RL-MPE实验,并探讨了MADDPG结合优势法的效果。
在RL-MPE实验中使用了DDPG、MADDPG、DQN以及MADDPG+advantage算法,在OpenAI的多智能体环境(Multi-Agent Particle Environment, MPE)下进行测试。我们在此基础上加入了自己的改进,包括引入DQN和优势函数(Advantage Function),但最终发现其性能不如原始的MADDPG算法。此外,我们在游戏中添加了“吃掉消失”的机制,然而这一改动对训练策略及游戏得分产生了较大影响,并且在增加“吃掉消失”与“输赢”评判后,整体训练效果有所下降。
全部评论 (0)
还没有任何评论哟~


