梯度提升树GBDT原理

时间：2016-04-19 19:43:45 阅读：328 评论：0 收藏：0 [点我收藏+]

标签：

1.模型
提升方法实际采用加法模型（即基函数的线性组合）与前向分布算法。以决策树为基函数的提升方法称为提升树（boosting tree)。对分类问题决策树是二叉分类树，对回归问题决策树是二叉决策树。提升树模型可以表示为决策树的加法模型：技术分享
其中，表示决策树；为决策树的参数；M为树的个数
2.学习过程
回归问题提升树使用以下前向分布算法：

在前向分布算法的第m步，给定当前模型，需求解

得到，即第m棵树的参数
当采用平方误差损失函数时，技术分享
其损失变为
其中,是当前模型拟合数据的残差（residual）。对于平方损失函数，拟合的就是残差；对于一般损失函数（梯度下降），拟合的就是残差的近似值
3.算法
输入：训练数据集
输出：提升树
（1）初始化技术分享
（2）对m = 1,2,…，M