
学习强化学习,并在 MATLAB 环境中进行开发。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该软件构建了一个专门的游乐场,旨在强化学习(RL),尤其针对那些包含多种复杂设置的场景。 游乐场的核心架构建立在一款移动机器人模型之上,这个模型被称为“扩展非完整双积分器”(ENDI)。 更多关于该模型的详细说明,请参考提供的注释。 整个代码的流程图可以查阅相关资源。 简而言之,代理——通常被称为“控制器”——被连接到环境(即系统),并负责生成动作,其目标是在无限的时间范围内最大限度地降低运行成本,这个成本也常被称为奖励或阶段成本。 该软件包的具体任务是引导机器人完成自动泊车操作。 控制器具备多模态特性,能够与一系列基线进行对比评估,例如传统的停车控制器以及带有和不带有动态模型估计的模型预测控制器。
全部评论 (0)
还没有任何评论哟~


