码迷,mamicode.com
首页 > 编程语言 > 详细

增强学习--TRPO算法

时间:2019-05-24 19:40:41      阅读:118      评论:0      收藏:0      [点我收藏+]

标签:end   targe   git   --   ORC   you   学习   http   force   

理论部分参考

代码

增强学习--TRPO算法

标签:end   targe   git   --   ORC   you   学习   http   force   

原文地址:https://www.cnblogs.com/buyizhiyou/p/10919528.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!