码迷,mamicode.com
首页 > 其他好文 > 详细

决策树细节

时间:2020-05-26 15:04:01      阅读:58      评论:0      收藏:0      [点我收藏+]

标签:das   ted   ash   意义   展开   sse   分类   perfect   http   

https://zhuanlan.zhihu.com/p/85374168

 

基尼指数gini index本身是一个概念,它可以用来描述集合里面分类的混乱程度,和信息熵的意义非常接近,用泰勒展开可以得到是信息熵的近似值。

它可以用来描述很多个分类的集合,不光是2分类。

但是如果应用在CART树上,因为CART树是二叉树,尽分为a和非a,所以CART树上,gini index最大是1-0.5**2-0.5**2=0.5, 基尼指数越大,表明不确定性越高。最小是0.

 

而如果多分类的情况下,最大就不是0.5,而是

  • Perfectly classified, Gini Index would be zero.
  • Evenly distributed would be 1 – (1/# Classes).

决策树细节

标签:das   ted   ash   意义   展开   sse   分类   perfect   http   

原文地址:https://www.cnblogs.com/yjybupt/p/12965461.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!