
MATLAB中的pinv函数代码示例-R1: [R]
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本示例演示如何在MATLAB中使用pinv函数计算矩阵的摩尔-彭若斯广义逆,并探讨其应用和注意事项。
在Matlab中的pinv代码实现过程中涉及到以下几点:
- 在SimpleWalker上使用S〜AC(根据Wouter的论文)以及LWR(第三C节)的实施。
- 尝试将摆锤与LWR~AC相结合,并同样地尝试将其应用到SimpleWalker上。
需要做的是:
- 解耦每个控制步骤中的规划步数和每条计划情节中的步数,跟踪最后一个模型观察并从该点开始。
- 注意边界问题:0和2PI的值相同!
- 测试模型准确性。对于RMSE模型,请尝试不同的Alpha值(例如常规Alpha的1/10)。
- 不要在模型中使用ET,并且需要持续利用由模型生成的状态转移,直到预测出相同的轨迹为止。一旦开始预测不同模式,则应清除当前状态并重新启动。
关于如何利用过去的经验建立新的模型:
- 使用该模型产生样本数据,并用这些新产生的数据来更新演员/评论家。
- 演员、评论家和模特是相互关联的,因此为了最佳地更新它们,需要综合考虑所有三个部分的信息。
此外,在编码创建者中更改Pinv使用方法(胆固醇),并尝试使用2014版Matlab进行实验。参考文献包括免费学习率强化学习以及Grundmann关于PAC的相关研究和Degris的工作。
全部评论 (0)
还没有任何评论哟~


