
高斯扩散模型的MATLAB代码与Kalman-TD模型-Python实现:用于拟合行为数据的程序
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目包含使用MATLAB编写的高斯扩散模型和用Python实现的Kalman-TD模型,旨在为心理学中的决策过程提供数据分析工具,适用于行为数据的拟合与分析。
高斯扩散模型的Python代码可以用来使Kalman-TD模型适应模拟的行为数据。初始Matlab代码基于哈佛大学心理学系及脑科学中心Samuel Gershman的研究工作。在他的论文中,介绍了该模型,它描述了一个结合贝叶斯和强化学习理论的联想学习框架。
什么是Kalman-TD模型?
在最近关于动物如何进行有效学习的理解上,有两个概念起了重要作用:一种是基于代理估计关联强度并跟踪其不确定性的贝叶斯原理;另一种则是通过长期累积未来奖励来指导行为决策的强化学习(RL)原则。前者由卡尔曼滤波器(KF)体现,后者则以时间差分(TD)形式表示。
统一模型:
这两个理论可以被整合为Kalman-TD模型,在这个实时模型中,权重分布而非单点估计得到呈现。这一方法与规范性假设一致,即理想的学习者能够同时利用贝叶斯和强化学习的原理来优化其行为策略。
全部评论 (0)
还没有任何评论哟~


