码迷,mamicode.com
首页 > 其他好文 > 详细

决策树的可视化解读

时间:2020-01-28 23:25:04      阅读:163      评论:0      收藏:0      [点我收藏+]

标签:middle   方法   learning   sklearn   uri   tree   环境   alt   配置   

浏览过网上的其他帖子,发现大多都是进行环境的配置,并没有对结果进行分析。故写此文(其他文章写过的内容,我就不赘述了)。

环境:Python 3.6
源代码:https://gitee.com/zhyantao/DeepLearning/tree/master/DecisionTree

使用工具Graphviz可视化决策树后,可以得到如下所示的一个PDF文件:
技术图片

与之对应的CSV表格如下所示:
技术图片

解析

  1. 信息熵(entropy)作为不确定性的度量,其值越大,代表不确定性越强。因此当entropy=0时,结果时一个确定的值。
  2. 对于决策树,通过 sklearn 自带的方法,确定了age作为根节点,
    • age == middle_aged 时,标签值 class_buys_computer 肯定为 yes ,即 False 指向的方块(这种肯定是因为 entropy = 0 )。
    • age != middle_aged 时,需要看其他因素,当 student == yes 时,不能确定标签值是否唯一(因为entropy != 0),还是需要看其他因素,
    • student == yes && age == senior 时,可以肯定标签值为 yes
    • student == yes 但是 age != senior 时,又不能确定标签值是否唯一,因此又需要看其他因素(credit_rating ?= excellent
    • ... 以此类推。

决策树的可视化解读

标签:middle   方法   learning   sklearn   uri   tree   环境   alt   配置   

原文地址:https://www.cnblogs.com/zhyantao/p/12239173.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!