与KNN比较:
KNN是计算未知类型数据与已知类型数据之间的距离,与数值计算相关。
Decision Tree 先是在已知数据集上构造好一棵决策树,树中的每个分叉会用到一个特征,这就需要用到信息熵的概念,对每个特征计算信息熵 来使得分叉处选取到最好的特征对数据进行分类,(训练集选取好最佳特征,测试集就按照构造好的树结构进行分类)。直到未知数据达到叶子结点则分类完毕。
Machine Learning in Action -Decision Tree
原文地址:http://www.cnblogs.com/cnblogs-learn/p/3931059.html