
矩阵对策Matlab代码-L2RPN-A3C应用:基于Actor-Critic方法的强化学习解决方案(http...)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目提供了一种利用Matlab实现的基于Actor-Critic框架的L2RPN-A3C算法,应用于矩阵对策问题中的强化学习解决方案。
矩阵指针Matlab代码L2RPN-使用-A3C采用Actor-Critic框架进行L2RPN挑战的强化学习方法。通过该代码训练出的代理是比赛中的获胜者之一。此代码基于pypownet环境,并在LGPLv3许可下发布,要求Python版本大于等于3.6和凯拉斯库的支持,建议使用conda或venv创建虚拟环境以安装Pypownet及其文档。
文件说明:
- Amar_L2RPN_IJCNN_git.pdf:在IJCNN-2019的L2RPN研讨会上介绍该方法,概述了所采用的方法及训练过程中的想法。
- valid_actions_array_uniq.npz:包含有效且唯一的动作矩阵的数据文件。
- valid_actions_masking_subid_perm.npz:用于将变电站ID映射到参与者输出屏蔽的有效唯一动作的矩阵的数据文件。
- valid_switching_controls.py:生成上述numpy数据文件的python脚本。
- pypow_14_a3c_final.py:使用A3C训练演员的主要代码。
全部评论 (0)
还没有任何评论哟~


