
CQL: 稳健的Q学习代码-源代码。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
CQL 离线强化学习的保守Q学习代码( ) 位于本存储库中,我们提供了该论文中详细阐述的CQL算法代码。 我们将代码组织成两个子目录进行呈现:一个用于Atari实验,另一个则专门用于D4RL实验。 鉴于D4RL数据集中的变化,我们期望新的D4RL数据集将对CQL的性能产生影响,因此,本自述文件中将很快提供一个包含新性能指标编号的表格。 我们将持续在此处更新这些数字。 如果您认为此存储库对您的研究有所裨益,请务必引用: @article{kumar2020conservative, author = {Aviral Kumar and Aurick Zhou and George Tucker and Sergey Levine}, title = {Conservative Q-Learning for Offline Reinf
全部评论 (0)
还没有任何评论哟~


