
Multi-Agent Deep Deterministic Policy Gradients (MADPGs) 是...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该算法,即多代理深确定性策略梯度多主体深度确定性策略梯度(MADDPG)算法,以PyTorch实现呈现。这代表我在论文中提出的“针对混合合作竞争环境的多主体Actor评论家”算法的具体实现。 您可以参考本文: 。 为了运行此程序,您需要安装多代理粒子环境(MAPE),其相关信息可以在这里找到: 。 务必创建一个包含MAPE依赖项的虚拟环境,因为部分版本可能存在过时问题。 我建议使用PyTorch 1.4.0版本进行运行,因为较新版本(1.8)在计算批评者损失时可能与就地操作产生冲突。 将主存储库克隆到与MAPE相同的目录中通常是最便捷的方式,因为主文件依赖于MAPE中的`make_env`函数。 此外,您可以在以下链接找到本教程的视频演示:
全部评论 (0)
还没有任何评论哟~


