标签:个人 jpg row title font core str normal 影响


熵:值越大,不确定性因素越大;条件熵:条件对结果的影响不确定性;信息增益;信息增益比



1,ID3算法


2,c4.5算法







回归树生成

分类树生成





举个例子:

第一种划分方法:{“学生”}、{“老师”、“上班族”} 来预测婚姻

第二种划分方法:{“老师”}、{“学生”、“上班族”}

第三种划分方法:{“上班族”}、{“学生”、“老师”}


例如:图1中ti表示决策树中第i个节点,A、B表示训练集中的两个类别,A、B之后的数据表示落入该节点分别属于A类、B类的样本个数。



个人认为算法通过使用训练集构建一个决策树后,获得一系列的规则,输入测试集后,按照规则获取到叶节点,然后根据叶节点最大占有比的那个类为该测试集所属的类,从而达到分类效果
1,cart例子
2,剪枝例子
3,决策树比较
标签:个人 jpg row title font core str normal 影响
原文地址:http://www.cnblogs.com/ksWorld/p/7468068.html