
MATLAB实现强化学习代码,采用ε-greedy策略解决多臂赌机问题。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
MATLAB强化学习代码,旨在解决多臂赌机问题,并采用ε-greedy策略。这段代码的实现思路是模拟一个听障人士的状态,或者说,应该如何行动?
全部评论 (0)
还没有任何评论哟~


简介:
MATLAB强化学习代码,旨在解决多臂赌机问题,并采用ε-greedy策略。这段代码的实现思路是模拟一个听障人士的状态,或者说,应该如何行动?


