码迷,mamicode.com
首页 > 其他好文 > 详细

数值优化-梯度下降法

时间:2014-12-09 08:11:49      阅读:330      评论:0      收藏:0      [点我收藏+]

标签:des   style   blog   http   io   ar   color   os   sp   

NG的课件1,引出常用的优化方法梯度下降法(gradient descent)

bubuko.com,布布扣

? ?

对于 ordinary least squares regression, cost function为

bubuko.com,布布扣

求最小值,意味着求导数为0的位置

? ?

考虑只有一个样本

bubuko.com,布布扣

? ?

bubuko.com,布布扣

这叫做LMS update rule (Least Mean Squares)

? ?

对应所有样本的训练集合

bubuko.com,布布扣

? ?

这种方法叫做batch gradient decent ,与之对应的在样本数目比如海量的情况下,为了计算快速,经常会每

扫描一个点就做一次update而不是扫描所有点后做一次update,对应称作stochastic gradient decent

? ?

逻辑回归中:

对应按照MLE观点看,最大化概率

bubuko.com,布布扣

? ?

bubuko.com,布布扣

? ?

bubuko.com,布布扣

? ?

bubuko.com,布布扣

bubuko.com,布布扣

? ?

数值优化-梯度下降法

标签:des   style   blog   http   io   ar   color   os   sp   

原文地址:http://www.cnblogs.com/rocketfan/p/4152386.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!