
软演员关键及扩展:基于PyTorch的PER与ERE、蒙克豪森RL及D2RL的实现与应用探讨
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文深入探讨并实现了软演员关键及扩展技术,结合PyTorch框架,详细研究了PER、ERE、蒙克豪森RL和D2RL等算法的应用及其在实践中的效果。
软演员关键扩展了PyTorch实现的具有优先级经验回放(PER)、强调最近经历而不忘过去的经验强化学习(ERE)以及曼努欣斯RL的Soft-Actor-Critic算法,并提供了多环境选项以支持并行数据收集和加速训练过程。该存储库包含了最新的SAC版本,同时实现了按比例调整优先级的PER功能。
在ERE的具体实现中,作者使用的是较旧版本的SAC,而此存储库则包含最新版的SAC及其扩展内容。此外,需要完成的任务包括:将IQN评论家与现有系统集成,并减慢其运行速度十倍;修复相关问题以添加D2RL IQN评论家功能;利用ray创建分布式SAC版本并加入N步自举机制。
所有附件均需检查确保没有遗漏或错误。
全部评论 (0)
还没有任何评论哟~


