在训练集上有个好的效果不见得在测试集中效果就好,因为可能存在过拟合(over-fitting)的问题。如果训练集的数据质量很好,那我们只需对这些有效数据训练处一堆模型,或者对一个模型给定系列的参数值,然后再根据测试集进行验证,选择效果最好的即可;大多数情况下,数据集大小是有限的或质量不高,那么需要有...
分类:
其他好文 时间:
2015-06-16 16:33:09
阅读次数:
210
模型选择问题(Model Selection Problem)
我们在之前得知,通过最小化Ein来选择最好的模型不是一个正确的办法,因为这样可能会付出模型复杂度的代价、造成泛化效果差、造成过拟合的发生。
为了解决这个问题,我们的想法是找一些测试数据来看看哪种模型对应测试数据的效果更好,但是用新的测试数据来作这个事情,实际上是做不到的自欺欺人的办法。
我们对比这两种方式,用训练数据来作选择...
分类:
其他好文 时间:
2015-03-04 22:48:21
阅读次数:
184
【转载】规则化和模型选择(Regularization and model selection)
分类:
其他好文 时间:
2015-01-16 13:01:05
阅读次数:
217
主要介绍如何通过验证来评估模型的性能及如何通过验证选取模型的问题。介绍的方法有:模型选择、交叉验证。...
分类:
其他好文 时间:
2014-11-29 00:17:19
阅读次数:
202
在对数据进行拟合,学习模型的过程中,会出现以下情况:1)high variance, overfitting.过拟合2)high bias, underfiiting.欠拟合过拟合出现的原因1)太多的特征。2)过少的训练数据。如何解决?1)减少特征数2)模型选择算法(model selection ...
分类:
其他好文 时间:
2014-08-26 19:13:56
阅读次数:
310
网易公开课,第10,11课 notes,http://cs229.stanford.edu/notes/cs229-notes5.pdf Model Selection 首先需要解决的问题是,模型选择问题,如何来平衡bais和variance来自动选择模型?比如对于多项式分类,如何决定阶数k,对于l...
分类:
其他好文 时间:
2014-06-26 16:31:11
阅读次数:
181