码迷,mamicode.com
首页 > 其他好文 > 详细

学习技术

时间:2014-11-27 18:06:35      阅读:168      评论:0      收藏:0      [点我收藏+]

标签:ar   for   学习   方法   技术   机器学习   error   策略   系统   

在机器学习范畴,根据反馈的不同,学习技术可以分为监督学习(Supervised learning)、非监督学习(Unsupervised learning)和强化学习(Reinforcement learning)三大类。其中强化学习是一种以环境反馈作为输入的、特殊的、适应环境的机器学习方法。所谓强化学习是指从环境状态到行为映射的学习,以使系统行为从环境中获得的累积奖赏值最大。该方法不同与监督学习技术那样通过正例、反例来告知采取何种行为,而是通过试错(trial-and-error)的方法来发现最优行为策略[KLM96][SB98]。

学习技术

标签:ar   for   学习   方法   技术   机器学习   error   策略   系统   

原文地址:http://www.cnblogs.com/pangairu/p/4126715.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!