1. Python 2. Python机器学习的库:scikit-learn 2.1: 特性: 简单高效的数据挖掘和机器学习分析 对所有用户开放,根据不同需求高度可重用性 基于Numpy, SciPy和matplotlib 开源,商用级别:获得 BSD许可 2.2 覆盖问题领域: 分类(classi ...
分类:
编程语言 时间:
2018-04-17 22:18:47
阅读次数:
152
下载地址:网盘下载 内容简介 · · · · · · 本书面向所有对机器学习与数据挖掘的实践及竞赛感兴趣的读者,从零开始,以Python编程语言为基础,在不涉及大量数学模型与复杂编程知识的前提下,逐步带领读者熟悉并且掌握当下最流行的机器学习、数据挖掘与自然语言处理工具,如Scikitlearn、N ...
分类:
编程语言 时间:
2018-04-15 14:58:03
阅读次数:
193
# Most scikit-learn objects are either transformers or models. # Transformers are for pre-processing before modeling. The Imputer class (for filling i ...
分类:
其他好文 时间:
2018-04-14 12:43:04
阅读次数:
174
从网上看到一篇总结的很不错的sklearn使用文档,备份勿忘。 引言 对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库 ...
分类:
其他好文 时间:
2018-04-12 20:47:23
阅读次数:
224
原帖地址:https://www.jiqizhixin.com/articles/2018-04-03-5 K 近邻算法,简称 K-NN。在如今深度学习盛行的时代,这个经典的机器学习算法经常被轻视。本篇教程将带你使用 Scikit-Learn 构建 K 近邻算法,并应用于 MNIST 数据集。然后, ...
分类:
编程语言 时间:
2018-04-03 12:50:28
阅读次数:
158
官网http://scikit-learn.org/stable/auto_examples/applications/plot_out_of_core_classification.html
分类:
其他好文 时间:
2018-03-26 10:57:40
阅读次数:
125
目的 将gensim输出的格式转化为numpy array格式,支持作为scikit learn,tensorflow的输入 实施 使用nltk库的停用词和网上收集的资料整合成一份新的停用词表,用来过滤文档中的停用词,也去除了数字和特殊的标点符号,最后将所有字母转化为小写形式。 以下是原文: Sub ...
分类:
其他好文 时间:
2018-03-20 15:21:49
阅读次数:
231
集成学习实践部分也分成三块来讲解: sklearn官方文档:http://scikit-learn.org/stable/modules/ensemble.html#ensemble 1、GBDT 2、XGBoost 3、Adaboost 在sklearn中Adaboost库分成两个,分别是分类和回 ...
分类:
其他好文 时间:
2018-03-17 10:49:31
阅读次数:
290
对于集成学习,由于是多个基学习期共同作用结果,因此在做参数调节时候就有基学习器的参数和集成学习的参数两类 在scikit-learn中,RF的分类类是RandomForestClassifier,回归类是RandomForestRegressor 官方文档:http://scikit-learn.o ...
分类:
其他好文 时间:
2018-03-16 17:15:13
阅读次数:
1544
官方文档:http://scikit-learn.org/stable/modules/tree.html scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法,既可以做分类,又可以做回归。分类决策树的类对应的是DecisionTreeClassifier,而回归决策树的类对 ...
分类:
其他好文 时间:
2018-03-14 16:57:07
阅读次数:
239