
深度强化学习被用于稳定手推车上的倒立摆。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
深度Q学习方法被应用于稳定推车上的倒立摆系统。该项目采用了深度强化学习技术,并利用了OpenAI健身房提供的Cartpole-v1环境进行训练。该环境模拟了一个场景,其中一个杆通过未操作的接头连接到手推车,手推车沿着光滑的轨道移动。系统通过施加+1或-1的力来控制手推车,旨在保持杆子直立。钟摆初始状态为直立,其主要目的是防止其倾倒。每次杆子保持直立的时间段,都会获得+1的奖励。然而,如果杆子与垂直方向的夹角超过15度,或者手推车从其中心位置偏离超过2.4个单位以上,则情节将会结束。为了获取更详细的信息,您可以查阅与该项目相关的Jupyter笔记本。该项目是在使用Anaconda发行版安装的Jupyter Notebook中开发的,该Anaconda Distribution包含了Python、Jupyter Notebook以及其他用于科学计算和数据科学的常用软件包。关于安装的具体说明,请参考Python的相关文档。此外, 该项目使用了Python 3.5版本, Anaconda安装包含了Python和Keras。
全部评论 (0)
还没有任何评论哟~


