首页 > 其他好文 > 详细

模型选择

时间：2019-05-02 18:54:12 阅读：152 评论：0 收藏：0 [点我收藏+]

标签：9.png 算法查看 info 不用评估模型 image code

1.数据分组

将原始数据分成训练集，验证集和测试集，它们的比例分别为：60%，20%，20%。

训练集（train set） —— 用于模型拟合的数据样本。
验证集（development set）—— 是模型训练过程中单独留出的样本集，它可以用于调整模型的超参数和用于对模型的能力进行初步评估。
在神经网络中，我们用验证数据集去寻找最优的网络深度（number of hidden layers)，或者决定反向传播算法的停止点或者在神经网络中选择隐藏层神经元的数量；

测试集 —— 用来评估模最终模型的泛化能力，用来计算模型的泛化误差。但不能作为调参、选择特征等算法相关的选择的依据。

2.训练好每个模型再挑选模型

若不知道该选择下面哪个模型，可以先利用训练集对每一个模型进行训练，得到相应的参数值，随后通过计算每个训练好的模型的验证集的准确率来决定要哪个模型。

技术图片

再比如，当不知道λ该取何值时，可以采取与上面类似的方法：

技术图片

注意：当训练好模型之后，查看训练集，验证集和测试集的准确率的时候就不用λ项了，而是采取下图的方式（假定均方误差形式）：

技术图片

标签：9.png 算法查看 info 不用评估模型 image code

原文地址：https://www.cnblogs.com/pjishu/p/10802752.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！