码迷,mamicode.com
首页 > 其他好文 > 详细

CS 229 notes Supervised Learning

时间:2017-11-23 08:17:54      阅读:127      评论:0      收藏:0      [点我收藏+]

标签:hbm   eee   uip   hex   bin   gps   clu   roc   1.2   

CS 229 notes Supervised Learning

标签(空格分隔): 监督学习 线性代数


Forword

the proof of Normal equation and, before that, some linear algebra equations, which will be used in the proof.

The normal equation

Linear algebra preparation

For two matrices 技术分享图片 and 技术分享图片 such that 技术分享图片 is square, 技术分享图片.

Proof:

 技术分享图片

技术分享图片

 

Some properties:
技术分享图片

 

some facts of matrix derivative:
技术分享图片

Proof:

 技术分享图片

技术分享图片
技术分享图片

Proof 1:

技术分享图片

 

Proof 2:

技术分享图片

 

技术分享图片

Proof: 技术分享图片
(技术分享图片 refers to the cofactor)

Least squares revisited

技术分享图片(if we don’t include the intercept term)

技术分享图片

since 技术分享图片,

技术分享图片

Thus,
$\frac{1}{2}(X\theta-\vec{y})^T(X\theta-\vec{y}) =
\frac{1}{2}\displaystyle{\sum{i=1}^{m}(h\theta(x^{(i)}) -y^{(i)})^2} = J(\theta) $.

Combine Equations 技术分享图片
技术分享图片

Hence

技术分享图片

Notice it is a real number, or you can see it as a 技术分享图片 matrix, so
技术分享图片

 


since 技术分享图片 and 技术分享图片 involves no 技术分享图片 elements.
then use equation 技术分享图片 with 技术分享图片

技术分享图片

 


To minmize 技术分享图片, we set its derivative to zero, and obtain the normal equation:
技术分享图片
技术分享图片

?

CS 229 notes Supervised Learning

标签:hbm   eee   uip   hex   bin   gps   clu   roc   1.2   

原文地址:http://www.cnblogs.com/EtoDemerzel/p/7881434.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!