
强化学习发展历程概述及参考资料
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文综述了强化学习的发展历程,并提供了相关领域的参考文献和资料,旨在为研究者提供全面的学习路径。
强化学习的发展历程可以追溯到控制理论、统计学以及心理学等领域。最早的研究案例是巴甫洛夫的条件反射实验。1911年,Thorndike提出了效果律(Law of Effect):在特定情境下使动物感到舒适的行为会增强该行为与情景之间的联系,并且当这种情境再次出现时,动物更可能重复这一行为;相反地,让动物感觉不舒适的行动则会导致其与相应的情景之间关联减弱,在未来的情境再现中也较难重现。Thorndike的理论强调了试错学习中的选择和联想过程,分别对应于计算搜索和记忆功能的重要性。
全部评论 (0)
还没有任何评论哟~


