
深度强化学习框架及相关算法的源代码。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
胡斯卡尔 (Huskarl) 是一款专门为模块化设计和快速原型开发而设计的深度强化学习框架。该框架以 TensorFlow 2.0 为基础构建,并充分利用 tf.keras API,旨在提升其简洁性和可读性。Huskarl 简化了在多 CPU 内核环境中进行动态计算的并行化过程,这对于加速基于策略的学习算法至关重要,这些算法能够从多个并发经验来源(例如 A2C 或 PPO)中获益。尤其适用于计算密集型环境,例如基于物理模拟的环境,并且能够与环境实现无缝集成。目前,该框架已支持多代理环境以及多种演算法,并且计划进一步扩展其功能。具体而言,它包含了深度 Q 学习网络 (DQN)、多步 DQN、双 DQN、决斗架构 DQN 和优势演员评判 (A2C) 等算法,同时也在积极探索和实施更多新的算法。
全部评论 (0)
还没有任何评论哟~


