码迷,mamicode.com
首页 > 其他好文 > 详细

强化学习基础介绍

时间:2018-09-06 18:11:57      阅读:120      评论:0      收藏:0      [点我收藏+]

标签:最大化   type   image   tps   src   ESS   分享   ext   .com   

概念

强化学习,主要是主体agent根据处境state,做出行为action,并且最大化奖励reward的过程。
技术分享图片
开始进行强化学习时,神经网络的系数可随机初始化。依据环境给予的反馈,神经网络可以用预测的奖励和实际奖励之差来调整权重,改进其对状态-动作对的解析。


参考:
强化学习DeepLearning4j

强化学习基础介绍

标签:最大化   type   image   tps   src   ESS   分享   ext   .com   

原文地址:http://blog.51cto.com/13927451/2171239

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!