
MBPO_PyTorch: 基于模型的强化学习算法MBPO的PyTorch实现副本
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
简介:MBPO_PyTorch是基于模型的强化学习算法MBPO在PyTorch框架下的实现版本,为研究者和开发者提供高效的环境模拟与策略优化工具。
这是对PyTorch中的基于模型的强化学习算法MBPO的重新实现概述。原代码使用TensorFlow集成模型重现了结果,但在采用PyTorch集成模型的情况下性能有所下降。这段新代码利用PyTorch重做了集成动力学模型,并缩小了与原始版本之间的差距。性能比较是在两个特定任务上进行的,其余的任务没有经过测试。然而,在已经测试过的这两个任务中,相比于官方提供的TensorFlow实现,该使用PyTorch实现得到了类似的结果。
依赖关系:MuJoCo 1.5和2.0
用法:
- python main_mbpo.py --env_name Walker2d-v2 --num_epoch 300 --model_type pytorch
- python main_mbpo.py --env_name Hopper-v2 --num_epoch 300 --model_type pytorch
全部评论 (0)
还没有任何评论哟~


