标签:连续 函数 lazy 错误 idt 能力 属性 png loading
决策树:逼近离散值目标函数
适用问题:离散值分类
选择分类能力最好的属性根节点
度量: 熵
正例反例
同属于一类0,正=反 1
优选偏置,限定偏置
过度拟合:随机错误,噪声 数据太少
解决:
尽早停止树增长
修剪:
1.错误率降低修剪
2.规则后修剪 转换成规则
合并连续值属性
定义新属性,区间中值
增益比率
缺少属性值处理:
直接赋值,概率
标签:连续 函数 lazy 错误 idt 能力 属性 png loading
原文地址:https://www.cnblogs.com/jieyi/p/13324023.html