码迷,mamicode.com
首页 > 其他好文 > 详细

机器学习笔记(九)正则化

时间:2017-05-12 23:09:34      阅读:289      评论:0      收藏:0      [点我收藏+]

标签:防止   最小   提高   解决   分类   变更   技术分享   9.png   images   

一、过拟合问题

分类模型复杂、数据资料含有噪声、数据量少的情况下能发生过拟合的现象技术分享,对于不同的模型复杂度,随着资料量的增大,模型的Ein和Eout变化为:

技术分享

噪声、模型复杂度与数据资料量三者对于过拟合的影响:

技术分享

二、正则化

对于较为复杂的模型,需要加入正则化,是高次的项系数权重为0(或接近零),使之变为较低的次方项的模型,以防止过拟合的发生。

例如,将Q为10次方的复杂模型,正则化为Q为2次方的模型技术分享,条件为技术分享

直接求解使w为0的不太容易,是一个NP-hard问题,所以转化为求技术分享,即技术分享

 

等价于求解最小的技术分享,即技术分享,其中

技术分享,对于特征值较小的维度来说,高次方的项会得到很小的数,需要对应很大的w来提高影响力,但正则化不允许有很大的w存在,解决方法变更一下特征转换的形式:

技术分享

 

机器学习笔记(九)正则化

标签:防止   最小   提高   解决   分类   变更   技术分享   9.png   images   

原文地址:http://www.cnblogs.com/zsw900610/p/6847442.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!