
TorchRL:基于Pytorch的强化学习算法实现(包括SAC、DDPG、TD3、DQN、A2C、PPO和TRPO)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
TorchRL是一个使用Pytorch开发的库,实现了多种经典强化学习算法,如SAC、DDPG、TD3、DQN、A2C、PPO及TRPO。
火炬RL RL方法的Pytorch实现支持具有连续和离散动作空间的环境,并且可以处理1d和3d观察空间的环境。为了满足多进程环境的要求,一般需要使用Torch 1.7、Gym(0.10.9)以及Mujoco(1.50.1)。此外还需要安装列表用于日志记录,tensorboardX用于输出日志文件。
Tensorflow是运行TensorBoard或读取tf记录中的日志所需的。可以使用environment.yml创建虚拟环境或者手动安装所有需要的库来设置这个环境。
```
conda create -f environment.yml
source activate py_off
```
在配置参数和指定的日志目录、种子以及设备后,可以通过以下命令启动程序:
```python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah
```
查看示例文件夹以获取更多详细信息。目前支持的策略方法包括强化学习中的A2C(演员评论家)和PPO(近端政策优化)。
全部评论 (0)
还没有任何评论哟~


