码迷,mamicode.com
首页 > 其他好文 > 详细

Andrew Ng机器学习课程17(2)

时间:2015-10-12 12:45:10      阅读:217      评论:0      收藏:0      [点我收藏+]

标签:

Andrew Ng机器学习课程17(2)


声明:引用请注明出处http://blog.csdn.net/lg1259156776/


说明:主要介绍了利用value iteration和policy iteration两种迭代算法求解MDP问题,还介绍了在实际应用中如何通过积累“经验”更新对转移概率和reward的估计的学习模型,并结合两种迭代算法进行求解的完整过程。


技术分享
技术分享
技术分享
技术分享


2015-10-11 艺少

版权声明:本文为博主原创文章,转载请注明出处http://blog.csdn.net/lg1259156776/。

Andrew Ng机器学习课程17(2)

标签:

原文地址:http://blog.csdn.net/lg1259156776/article/details/49053485

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!