
Fewer Gradients for Policy Evaluation using SVRG
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文提出了一种使用SVRG(Stochastic Variance Reduced Gradient)方法来减少策略评估中梯度计算量的方法,从而提高强化学习算法效率。
“用于梯度评估较少的政策评估的SVRG”的代码依存关系包括:blas=1.0=mkl, ca-certificates=2020.10.14=0, certifi=2020.11.8=py36hecd8cb5_0, cffi=1.14.4=py36h2125817_0, intel-openmp=2019.4=233, libcxx=10.0.0=1, libedit=3.1.20191231=h1de35cc_1, libffi=3.3=hb1e8313_2, mkl=2019.4=233, mkl-service=2.3.0=py36h9ed2024_0, mkl_fft=1.2.0=py36hc64f4ea_0, mkl_random=1.1.1=py36h959d312_0, ncurses=6.2=h0。
全部评论 (0)
还没有任何评论哟~


