标签:test lin 结果 集成 file eth mod uda 测试
到现在为止我们还剩一种集成学习的算法还没有涉及到,那就是Stacking。Stacking是一个与Bagging和Boosting都不一样的算法。它的主要突破点在如何集成之前的所有算法的结果,简单的说就是在弱学习器的基础上再套一个算法。
Stacking是在弱学习器的基础上再套一个算法,用机器学习算法自动去结合之前的弱学习器。
Stacking方法中,我们把个体学习器叫做初级学习器,用于结合的学习器叫做次级学习器,次级学习器用于训练的数据叫做次级训练集。次级训练集是在训练集上用初级学习器得到的。
如下图所示:
数据集为\(D\),样本数量为\(m\),分为\(D_{train}\)和\(D_{test}\)。
Stacking的思想也是非常的简单,但是有时候在机器学习中特征工程处理的好,简单的算法也能发挥强大的作用。
(欢迎转载,转载请注明出处。欢迎沟通交流: 339408769@qq.com)
7. 集成学习(Ensemble Learning)Stacking
标签:test lin 结果 集成 file eth mod uda 测试
原文地址:https://www.cnblogs.com/huangyc/p/9975183.html