码迷,mamicode.com
首页 > 其他好文 > 详细

过度拟合(overfilting)

时间:2015-04-19 17:41:42      阅读:137      评论:0      收藏:0      [点我收藏+]

标签:

  过拟合概念:是指分类器能够百分之百的正确分类样本数据(训练集中的样本数据),对训练集以外的数据却不能够正确分类。

 原因:1:模型(算法)太过复杂,比如神经网络,算法太过精细复杂,规则太过严格,以至于任何与样本数据稍有不同的文档它全都认为不属于这个类别,即在训练样本中拟合的很好,在训练样本外拟合的很差,过拟合最早就是从神经网络中发现出来的。策略树深度过深、回归参数过多,都会造成过拟合。

2:训练集中存在噪音,为了拟合异常点,偏离了正常分布。

3:训练集太小或不具有代表性

 训练集与测试集互不相交,前者用来构造分类器,后者用来验证分类器的准确性。如果用整个数据集去构造分类器,并用该数据集去验证分类器性能,则不能保证分类器未产生过拟合。

过度拟合(overfilting)

标签:

原文地址:http://www.cnblogs.com/mlj5288/p/4439298.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!