
基于PyTorch的在线强化学习11种常用算法代码实现
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目提供了基于PyTorch框架下多种在线强化学习算法的完整实现代码,包括但不限于DQN、DDPG等十一种经典模型。每种算法都经过详细设计与调试,可直接应用于实际问题解决中。
这个资源包含了一个使用 PyTorch 实现的11种常见在线强化学习算法的代码集合。每个算法都有独立的文件夹,并且可以单独运行以测试其在不同环境中的性能。以下是该资源中包括的具体算法:
1. Q-learning
2. SARSA
3. DQN (Deep Q-Network)
4. Double-DQN
5. Dueling-DQN
6. PG (Policy Gradient)
7. AC (Actor-Critic)
8. PPO (Proximal Policy Optimization)
9. DDPG (Deep Deterministic Policy Gradient)
10. TD3 (Twin Delayed DDPG)
11. SAC (Soft Actor-Critic)
全部评论 (0)
还没有任何评论哟~


