码迷,mamicode.com
首页 > 其他好文 > 详细

CART-GBRT-GBDT

时间:2015-07-15 01:10:41      阅读:338      评论:0      收藏:0      [点我收藏+]

标签:

CART:分类回归树

分类树和回归树的区别:分裂节点时使用的节点非纯度量(最小化准则、特征选择)不一样,修剪树的准则不一样

分类树:

  节点非纯度量:平方误差和

  区域估计值:均值(在给定的划分下,均值带来的平方误差和最小)

回归树:

  节点非纯度量:误分类误差、Gini指数、熵

      区域估计值:多数类

GBRT/GBDT:第m次训练使用的数据集为(xi,rmi),i=1...N,其中rmi表示前m-1棵树组成的模型fm-1在样本(xi,yi)上损失函数的负梯度(延f(x)方向)

问题:

GBRT中的损失函数跟节点非纯度量有关系吗?

GBRT中的区域估计值跟CART中的区域估计值有关系吗?

为什么不使用CART的区域估计值作为GBRT中的区域估计值?是因为损失函数的问题吗?

按维基百科的说法,γ实际是权重,bjm才是真正的区域估计,这又是怎么回事?维基

 

CART-GBRT-GBDT

标签:

原文地址:http://www.cnblogs.com/xiangzhi/p/4646978.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!