《Python 机器学习及实践–从零开始通往kaggle竞赛之路》很基础 主要介绍了Scikit-learn,顺带介绍了pandas、numpy、matplotlib、scipy。 本书代码基于python2.x。不过大部分可以通过修改print()来适应python3.5.x。 提供的代码默认使用 ...
分类:
编程语言 时间:
2017-04-18 10:10:44
阅读次数:
1459
python安装好后,库安装走了很多弯路,查了很多资料,终于安装成功,并且保存了该文章的地址,分享给大家 本人电脑windows 7,64位系统,安装的Python是3.5的,因此下载的库也是对应版本的 安装方式:同过命令行提示符,安装后缀是.whl的文件 原博客中还有测试程序,都很好用 希望能帮助 ...
分类:
编程语言 时间:
2017-04-16 17:45:11
阅读次数:
174
1.11. Ensemble methods(集成学习) 目标: 相对于当个学习器,集成学习通过使用多个基学习器的预测结果来来提高学习预测的泛化性能以及鲁棒性; 集成学习的两个思路: 1)、通过使用并行的学习,得到多个学习模型然后取其平均结果目的在于减少方差,代表算法有随机森林。通常来说多个学习器的 ...
分类:
其他好文 时间:
2017-04-13 22:53:19
阅读次数:
801
Hyperparameter Optimization In the context of machine learning, hyperparameter optimization or model selection is the problem of choosing a set of hyp ...
分类:
编程语言 时间:
2017-04-12 10:05:30
阅读次数:
285
基于scikit-learn包实现机器学习之KNN(K近邻) scikit-learn(简称sklearn)是目前最受欢迎,也是功能最强大的一个用于机器学习的Python库件。它广泛地支持各种分 类、聚类以及回归分析方法比如支持向量机、随机森林、DBSCAN等等,由于其强大的功能、优异的拓展性以及易 ...
分类:
其他好文 时间:
2017-04-09 11:45:15
阅读次数:
1360
在FP Tree算法原理总结和PrefixSpan算法原理总结中,我们对FP Tree和PrefixSpan这两种关联算法的原理做了总结,这里就从实践的角度介绍如何使用这两个算法。由于scikit-learn中没有关联算法的类库,而Spark MLlib有,本文的使用以Spark MLlib作为使用 ...
分类:
编程语言 时间:
2017-04-07 18:22:19
阅读次数:
225
scikit-learn官网:http://scikit-learn.org/stable/ 通常情况下,一个学习问题会包含一组学习样本数据,计算机通过对样本数据的学习,尝试对未知数据进行预测。 学习问题一般可以分为: 监督学习(supervised learning) 分类(classificat ...
分类:
其他好文 时间:
2017-04-07 12:24:11
阅读次数:
320
http://scikit-learn.org/dev/_downloads/scikit-learn-docs.pdf http://scikit-learn.org/stable/tutorial/ http://scikit-learn.org/stable/tutorial/basic/tu ...
分类:
其他好文 时间:
2017-04-06 15:36:04
阅读次数:
229
对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。 1. 获取数据,定义问题 没有数据,当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。 数据的介绍在这: http://ar ...
分类:
其他好文 时间:
2017-04-05 22:17:46
阅读次数:
245
scikit-learn对于线性回归提供了比较多的类库,这些类库都可以用来做线性回归分析,本文就对这些类库的使用做一个总结,重点讲述这些线性回归算法库的不同和各自的使用场景。 线性回归的目的是要得到输出向量YY和输入特征XX之间的线性关系,求出线性回归系数θθ,也就是 Y=XθY=Xθ。其中YY的维 ...
分类:
编程语言 时间:
2017-04-05 22:02:10
阅读次数:
302