
AI斗地主源码。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
斗地主deecamp项目包含一个程序引擎,该引擎能够与人工智能技术相结合,并能在next_moves中生成所有符合规则的出牌可能性。用户需要自行从这些可能性中选择要出的牌,具体方法参考myutil中的choose函数。默认情况下,该项目基于randomweb分支运行。该分支主要提供以下功能:1. 页面展示,包含可视化调试工具;2. 支持与人对战。rl_pdqn分支则模仿OpenAI的技术,它具备一个程序引擎,可以结合强化学习(RL)进行策略优化。用户可以选择对手为随机玩家(random)、陈潇(cxgz)或自身(self)。然而,在训练过程中只能训练一个玩家,且该玩家的角色为player 1。该分支使用的强化学习模型为prioritized_dqn,详细的模型结构请参考相关文档。目前,该分支在随机对手(90%胜率)和陈潇对手(44%胜率)的表现均较好。multi-rl分支同样模仿OpenAI的技术,它也提供了一个程序引擎,能够同时训练多个强化学习代理(rl playermcts分支则采用蒙特卡洛树搜索(MCTS)暴力求解策略...
全部评论 (0)
还没有任何评论哟~


