
基于MADRL的多智能体深度确定性策略梯度(MADDPG)算法
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
本研究提出一种基于模型自适应深度强化学习(MADRL)的改进型多智能体深度确定性策略梯度(MADDPG)算法,提升复杂环境下的协作效率与稳定性。
MADDPG(多智能体深度确定性策略梯度)是一种应用于多智能体强化学习环境的算法。该算法由2017年发表的论文《Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments》提出,它结合了深度确定性策略梯度(DDPG)算法的思想,并针对多智能体场景进行了扩展,能够处理混合协作与竞争的复杂环境。
全部评论 (0)
还没有任何评论哟~


