C4.5算法介绍C4.5算法与ID3算法不同的是采用了信息增益比作为特征的选择,原因是:信息增益在选择属性时偏向于选择取值较多的属性。信息增益比特征A对训练数据集D的信息增益比定义为其信息增益g(D,A)与特征A的熵HA(D)之比(计算方式请看上一篇):CART算法介绍CART算法使用Gini指数作为特征的选择,并且使用平方误差最小化原则对连续型特征进行离散化,所以CART算法既可以用于分类,也可
分类:
其他好文 时间:
2019-01-28 19:21:38
阅读次数:
196
上面每个属性,都是枚举的 上面每个属性,有可以按下面的树来表达: ...
分类:
其他好文 时间:
2019-01-28 15:10:28
阅读次数:
127
一、分类和回归 回归分析研究的范围大致如下: 1、逻辑回归 2、决策树 运行上述代码,生成tree.dot文件,对其稍作修改 得到决策树的可视化 3、人工神经网络 二、评价指标 三、聚类分析 聚类效果评价 聚类可视化——TSNE ...
分类:
编程语言 时间:
2019-01-28 01:02:51
阅读次数:
228
K-近邻算法(K Nearest Neighbors) 参考:机器学习实战教程(一):K-近邻算法(史诗级干货长文) 决策树算法(Decision Tree) 参考:机器学习实战教程(二):决策树基础篇之让我们从相亲说起 参考:机器学习实战教程(三):决策树实战篇之为自己配个隐形眼镜 朴素贝叶斯算法 ...
分类:
编程语言 时间:
2019-01-26 15:55:25
阅读次数:
191
一、从LR到决策树 0.思考一些一个分类问题:是否去相亲,LR解决的问题可能是这样的 在下面各个特征下给定w1,w2,w3,w4等参数值,将wx+b送到sigmoid函数中去,拿到一个概率p,我们在使用这个函数的时候会有一个损失函数loss function,对于这个代价函数通过GD梯度下降完成优化 ...
分类:
其他好文 时间:
2019-01-26 13:14:30
阅读次数:
199
Python 简介 Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。 Python 的设计: Python 是一种解释型语言: 这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。 Python 是交互式语言: 这意味着,您可以在一个Python提示符,直 ...
分类:
编程语言 时间:
2019-01-24 21:51:56
阅读次数:
180
本次的分享主要围绕以下五个方面:
2018 OceanBase大促概述
百万支付&OceanBase2.0
容器化
平台智能化
未来发展规划
分类:
其他好文 时间:
2019-01-21 16:03:41
阅读次数:
185
分类算法非常适合预测或描述标签为二元或标称类型的数据集,对于标签为序数类型的数据集,分类技术则不太有效,因为分类技术不考虑隐藏在序数中的“序”关系,对于标签其他形式的联系如子类与超类(包含的关系),分类技术也不太适合。 本文是分类模型系列的初篇,先介绍最基本的分类/回归模型——决策树模型。决策树分类 ...
分类:
其他好文 时间:
2019-01-19 21:16:39
阅读次数:
178
现在这本书已经看完70%,在看完后我将会将每一章的内容按照自己的理解并结合其他书籍包括<<统计机器学习导论>>[1] ,<<机器学习>>[2],<<大数据分析>>[3]这三本书总结经典的几大算法原理与代码实现。下面是预计的写作思路: 一、分类学习 1.SVM 2.决策树 3.Logistic 回归 ...
分类:
其他好文 时间:
2019-01-19 13:22:46
阅读次数:
300