K 近邻算法 作用:分类算法 优点:最简单、不需要训练、容易理解 缺点:计算复杂度高、空间复杂度高 原理:计算新数据与样本集中所有数据的欧式距离,提取距离最近的 K 个样本的标签,取 K 个样本里出现次数最多的标签,作为新数据的分类标签 决策树 ID3 作用:分类算法 优点:计算复杂度不高、容易理解 ...
分类:
编程语言 时间:
2020-02-09 09:54:44
阅读次数:
61
随机森林我们对使用决策树随机取样的集成学习有个形象的名字–随机森林。scikit-learn 中封装的随机森林,在决策树的节点划分上,在随机的特征子集上寻找最优划分特征。import numpy as npimport matplotlib.pyplot as pltfrom sklearn imp... ...
分类:
其他好文 时间:
2020-02-08 11:42:30
阅读次数:
117
小编也是最近在学习数据挖掘,看到了第三章用决策树预测获胜的球队。然而,NBA官网早就改版了,Export不能全部下载一年的数据记录,只能按月,而且我也下载不了。想了想,就只能爬取了。话不多说。 小编最开始用的Xpath,感觉路径有点麻烦,而且速度好像也没有BeautifulSoup快,所以小编就选用 ...
分类:
其他好文 时间:
2020-02-05 20:35:17
阅读次数:
75
什么是判定树? 又称决策树,是一种描述加工的图形工具,适合描述问题处理中具有多个判断,而且每个决策与若干条件有关。使用判定树进行描述时,应该从问题的文字描述中分清哪些是判定条件,哪些是判定的决策,根据描述材料中的联结词找出判定条件的从属关系、并列关系、选择关系,根据它们构造判定树。 判定树能清晰的表 ...
分类:
其他好文 时间:
2020-02-04 16:07:56
阅读次数:
113
# 介绍 决策树是监督学习的分类算法,关键在于决策树树的构造。构造决策树的算法有:ID3、C4.5、CART。 ID3算法的构造决策树的过程如下: # 选择特征 因为有好几个特征,依据哪一个特征划分,如,形如['四条腿','会叫','狗'],是依据有几条腿的特征,还是会不会叫的特征,所以要有评判标准... ...
分类:
其他好文 时间:
2020-02-03 22:44:21
阅读次数:
98
2019 10 16 14:46:06 仅供学习使用 aijiaoai 人工智能主要应用 1. 图像识别 识别图片中的内容、对象。 KNN 卷积神经网络 2. 情感分析 分析文本中包含的 文本,是正面的、负面的、中性的。 文本的表示:词向量、TFIDF 文本预处理、清洗 分类算法,逻辑回归、决策树、 ...
分类:
其他好文 时间:
2020-02-02 21:39:26
阅读次数:
124
决策树在分类、预测、规则提取等领域有着广泛的应用。决策树是一种树状结果,它的每一个叶节点对应一个分类。构造决策树的核心问题是:在每一步如何选择适当的属性对样本做拆分。对于分类问题,从已知类标记的训练样本中学习并构造出决策树是一个自上而下,分而治之的过程。常见的决策树算法如下:ID3算法C4.5算法C ...
分类:
其他好文 时间:
2020-01-30 17:31:55
阅读次数:
118
浏览过网上的其他帖子,发现大多都是进行环境的配置,并没有对结果进行分析。故写此文(其他文章写过的内容,我就不赘述了)。 环境:Python 3.6 源代码:https://gitee.com/zhyantao/DeepLearning/tree/master/DecisionTree 使用工具Gra ...
分类:
其他好文 时间:
2020-01-28 23:25:04
阅读次数:
163
前面一节咱们已经介绍了决策树的原理已经在sklearn中的应用。那么这里还有两个数据处理和sklearn应用中的小知识点咱们还没有讲,但是在实践中却会经常要用到的,那就是交叉验证cross_validation和Pipeline。cross_validation是保证了咱们的模型不受数据分布的影响, ...
分类:
其他好文 时间:
2020-01-26 22:21:38
阅读次数:
96
咱们正式进入了机器学习的模型的部分,虽然现在最火的的机器学习方面的库是Tensorflow, 但是这里还是先简单介绍一下另一个数据处理方面很火的库叫做sklearn。其实咱们在前面已经介绍了一点点sklearn,主要是在categorical data encoding那一块。其实sklearn在数 ...
分类:
其他好文 时间:
2020-01-22 01:12:04
阅读次数:
101