
实践:在Python TensorFlow中实现逆向强化学习(IRL)算法——深度MaxEnt、MaxEnt、LPIRL
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目深入探索并实现了三种逆向强化学习(IRMV, MaxEnt, LPIRL)算法,尤其是聚焦于深度最大熵方法,利用Python和TensorFlow框架进行高效实践。
在Python/TensorFlow环境中实现选定的逆向强化学习(IRL)算法。使用`python demo.py`可以运行线性逆向强化学习(Ng & Russell 2000)、最大熵逆向强化学习(Ziebart et al. 2008)以及最大熵深度逆向强化学习(Wulfmeier et al. 2015)。这些算法在MDP和求解器中得到了实现,包括二维网格世界和一维网格世界的环境。此外,还实现了价值迭代方法。
所需依赖关系为:
- Python 2.7
- cvxopt
- TensorFlow 0.12.1
- matplotlib
线性逆向强化学习的算法基于Ng & Russell(2000)的工作,并通过`linear_irl.py`文件实现。
全部评论 (0)
还没有任何评论哟~


