
Keras运用REINFORCE算法进行强化学习。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Keras 提供了对 REINFORCE 算法进行强化学习的实现:# Policy Gradient 这是一个 Keras 中最小化实现的随机策略梯度算法。## Pong Agent

The PG agent demonstrates a noticeable trend of achieving more frequent victories approximately 8000 episodes into the simulation. The accompanying score graph illustrates this progression in detail.
全部评论 (0)
还没有任何评论哟~


