正则化、交叉验证、泛化能力

时间：2018-05-14 10:24:37 阅读：232 评论：0 收藏：0 [点我收藏+]

一、正则化
1、模型选择典型的方式就是正则化。正则化就是结构风险最小化策略的实现，就是在经验风险项中添加一个郑泽华想或者叫做惩罚项。
正则化项与模型的关系一般是模型复杂度越高，正则化项的值就会越大。
正则化项的作用就是平衡经验风险较小与模型复杂度较小。最好的结果就是经验风险和模型复杂度同时较小。
正则化的一般形式为：
技术分享图片

其中，第一项为经验风险项，第二项为正则化项。值λ是为了调整两者关系的系数。

二、交叉验证
通常情况下，我们做模型选择的时候将数据分为训练集、验证集和测试集。但是实际应用中，往往数据并不是很充足，这就导致分为三部分后每一部分数据量不足，这样计算选择得到的模型往往是不可用的。因此我们在这种情况下，可以选择使用交叉验证的方式解决数据量不足的情况。
1、简单地交叉验证
简单地交叉验证，就是指随机的将数据分为两部分，一部分为训练数据，一部分为测试数据，一般情况下比例为7:3。使用训练数据应用到各种模型的训练上得到多个不同的模型，然后利用测试数据计算每个模型的计算误差，最终选择误差最小的模型即为最优的模型。
2、S折交叉验证
S折交叉验证，就是将数据等比例的分为S份，然后选择其中的S-1份数据作为训练数据，剩余的一份作为测试数据，这样训练数据及测试数据就有S中选择，于是最终选择通过S次评测平均测试误差最小的模型为最优模型。

三、泛化能力
1、定义：泛化能力就是指所学到的模型对未知数据的预测能力，通常情况我们使用测试数据来验证模型的泛化能力，但是由于数据集有线，其并不能包含数据所有的可能情况，因此测试数据的测试结果并不能完全体现模型的泛化能力，这种评测结果并不可靠。
2、泛化误差
假设学到的模型为技术分享图片，则模型的泛化误差为：

技术分享图片

泛化误差反映了模型的泛化能力，模型选择中，泛化误差越小则模型越好。
3、泛化误差上界
通常学习方法的泛化能力分析是研究泛化误差得概率上界。比较两个学习方法的泛化误差上界来确定两个学习方法的优劣。其性质如下：
（1）泛化误差上界是样本容量的函数，样本容量越大，则泛化误差上界越趋于0。
（2）泛化误差上界是函数空间的函数，假设空间容量越大，模型就越难学，泛化误差上界就越大。

正则化、交叉验证、泛化能力

标签：比例 info 随机包含 alt ali 测试数据最小技术分享

原文地址：https://www.cnblogs.com/aurorablog/p/9034529.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行