码迷,mamicode.com
首页 > 其他好文 > 详细

决策树学习

时间:2018-03-07 18:56:45      阅读:162      评论:0      收藏:0      [点我收藏+]

标签:迭代   tle   表达   src   AC   com   算法   优缺点   信息   

 id3  信息增益

c4.5  信息增益比

CART  基尼指数

 

参考  

优缺点:  决策树算法原理 (上)   决策树算法原理 (下)

简略介绍:   [Machine Learning & Algorithm] 决策树与迭代决策树(GBDT)

1.熵的概念

首先,我们需要熟悉信息论中熵的概念。熵度量了事物的不确定性,越不确定的事物,它的熵就越大。具体的,随机变量 X 的熵的表达式如下:

技术分享图片

熟悉了一个变量 X 的熵,很容易推广到多个个变量的联合熵,这里给出两个变量 X 和 Y 的联合熵表达式:

技术分享图片

有了联合熵,又可以得到条件熵的表达式 H(X|Y),条件熵类似于条件概率, 它度量了我们的 X 在知道 Y 以后剩下的不确定性。表达式如下:

技术分享图片

技术分享图片

 

决策树学习

标签:迭代   tle   表达   src   AC   com   算法   优缺点   信息   

原文地址:https://www.cnblogs.com/dahu-daqing/p/8523739.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!