# Most scikit-learn objects are either transformers or models. # Transformers are for pre-processing before modeling. The Imputer class (for filling i ...
分类:
其他好文 时间:
2018-04-14 12:43:04
阅读次数:
174
从网上看到一篇总结的很不错的sklearn使用文档,备份勿忘。 引言 对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库 ...
分类:
其他好文 时间:
2018-04-12 20:47:23
阅读次数:
224
昨天(2018/4/6)花了几乎一天的时间打包我的桌面应用“标注器”。下午3点完成最后的编写之后,准备在女朋友雅喻的电脑上配环境打包(我的电脑不能用pyinstaller打包,重装也不行,玄学错误。)。雅喻的电脑上缺少scikit-image这个包,然后我就下了一个。但是主程序不能运行,报错,tra ...
分类:
其他好文 时间:
2018-04-07 17:33:15
阅读次数:
184
原帖地址:https://www.jiqizhixin.com/articles/2018-04-03-5 K 近邻算法,简称 K-NN。在如今深度学习盛行的时代,这个经典的机器学习算法经常被轻视。本篇教程将带你使用 Scikit-Learn 构建 K 近邻算法,并应用于 MNIST 数据集。然后, ...
分类:
编程语言 时间:
2018-04-03 12:50:28
阅读次数:
158
官网http://scikit-learn.org/stable/auto_examples/applications/plot_out_of_core_classification.html
分类:
其他好文 时间:
2018-03-26 10:57:40
阅读次数:
125
目的 将gensim输出的格式转化为numpy array格式,支持作为scikit learn,tensorflow的输入 实施 使用nltk库的停用词和网上收集的资料整合成一份新的停用词表,用来过滤文档中的停用词,也去除了数字和特殊的标点符号,最后将所有字母转化为小写形式。 以下是原文: Sub ...
分类:
其他好文 时间:
2018-03-20 15:21:49
阅读次数:
231
集成学习实践部分也分成三块来讲解: sklearn官方文档:http://scikit-learn.org/stable/modules/ensemble.html#ensemble 1、GBDT 2、XGBoost 3、Adaboost 在sklearn中Adaboost库分成两个,分别是分类和回 ...
分类:
其他好文 时间:
2018-03-17 10:49:31
阅读次数:
290
对于集成学习,由于是多个基学习期共同作用结果,因此在做参数调节时候就有基学习器的参数和集成学习的参数两类 在scikit-learn中,RF的分类类是RandomForestClassifier,回归类是RandomForestRegressor 官方文档:http://scikit-learn.o ...
分类:
其他好文 时间:
2018-03-16 17:15:13
阅读次数:
1544
官方文档:http://scikit-learn.org/stable/modules/tree.html scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法,既可以做分类,又可以做回归。分类决策树的类对应的是DecisionTreeClassifier,而回归决策树的类对 ...
分类:
其他好文 时间:
2018-03-14 16:57:07
阅读次数:
239
1. Adaboost类库概述 scikit-learn中Adaboost类库比较直接,就是AdaBoostClassifier和AdaBoostRegressor两个,从名字就可以看出AdaBoostClassifier用于分类,AdaBoostRegressor用于回归。 AdaBoostCla ...
分类:
编程语言 时间:
2018-03-08 15:58:58
阅读次数:
562