码迷,mamicode.com
首页 > 其他好文 > 详细

决策树的剪枝

时间:2019-04-24 20:54:18      阅读:212      评论:0      收藏:0      [点我收藏+]

标签:http   函数   bsp   等价   mic   预测   简单的   htm   blank   

决策树算法原理(ID3,C4.5)

决策树算法原理(CART分类树)

CART回归树

 

  决策树的剪枝是通过极小化决策树整体的损失函数。(决策树的生成只考虑局部最优,决策树的剪枝考虑全局最优)

  设树T的叶节点为 t,个数为 |T|,该叶节点有 Nt 个样本点,其中 k 类的样本点有 Ntk 个,k = 1,2,...,K,Ht(T)为叶节点 t 上的经验熵,α≥0为参数,则决策树的损失函数:

技术图片

其中经验熵Ht(T),也称特征熵

技术图片

在损失函数中,式子右端的第一项记作:

技术图片

这时损失函数为:

Cα(T) = C(T) + α|T|

C(T) 表示模型对训练数据的预测误差即模型与训练数据拟合程度,|T| 表示模型复杂度,参数 α≥0控制两者之间的影响。较大的α促使选择简单的模型(树),较小的α促使选择复杂的模型(树),α=0只考虑模型与训练数据的拟合程度,不考虑模型的复杂度。

  当α确定时,子树越大,与训练数据拟合越好,但模型复杂度越高;相反,子树越小,与训练数据拟合不好,但模型复杂度低。

  上面两个决策树损失函数的极小化等价于正则化的极大似然估计。所以,利用损失函数最小原则进行剪枝就是用正则化的极大似然估计进行模型选择。

 

决策树的剪枝

标签:http   函数   bsp   等价   mic   预测   简单的   htm   blank   

原文地址:https://www.cnblogs.com/keye/p/10762671.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!