
利用 Caffe 和 C++ 实现 AlphaZero 算法(Deepmind)
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
本项目基于Caffe和C++实现AlphaZero算法,借鉴了Deepmind的研究成果,旨在探索强化学习在棋类游戏中应用的深度与广度。
这是我用 Caffe 实现的 AlphaZero 算法。我尽量遵循了论文中的指导原则。与我的代码的不同之处列在差异部分中。核心算法是模板化的,并且与特定的游戏规则(AlphaZero 文件夹)分开,因此理论上可以在任何游戏(如围棋或国际象棋)上训练此代码。然而,由于计算能力的限制,我只实现了两个简单的示例游戏:井字游戏和四连线,两者都具有可变大小的板。
全部评论 (0)
还没有任何评论哟~


