对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。# 一、获取数据,定义问题 没有数据,当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。 数据的介绍在这:http://arc... ...
分类:
其他好文 时间:
2019-07-19 19:12:46
阅读次数:
91
之前对决策树的算法原理做了总结,包括决策树算法原理(上)和决策树算法原理(下)。今天就从实践的角度来介绍决策树算法,主要是讲解使用scikit-learn来跑决策树算法,结果的可视化以及一些参数调参的关键点。# 一、1.scikit-learn决策树算法类库介绍 scikit-learn决策树算法类... ...
分类:
编程语言 时间:
2019-07-19 19:12:06
阅读次数:
111
在梯度提升树(GBDT)原理小结中,我们对GBDT的原理做了总结,本文我们就从scikit-learn里GBDT的类库使用方法作一个总结,主要会关注调参中的一些要点。# 一、1.scikit-learn GBDT类库概述 在sacikit-learn中,GradientBoostingClassif... ...
分类:
其他好文 时间:
2019-07-19 19:07:58
阅读次数:
97
在DBSCAN密度聚类算法中,我们对DBSCAN聚类算法的原理做了总结,本文就对如何用scikit-learn来学习DBSCAN聚类做一个总结,重点讲述参数的意义和需要调参的参数。# 一、scikit-learn中的DBSCAN类 在scikit-learn中,DBSCAN算法类为sklearn.c... ...
分类:
数据库 时间:
2019-07-19 19:06:48
阅读次数:
126
在线性判别分析LDA原理总结中,我们对LDA降维的原理做了总结,这里我们就对scikit-learn中LDA的降维使用做一个总结。# 一、1.对scikit-learn中LDA类概述 在scikit-learn中, LDA类是sklearn.discriminant_analysis.LinearD... ...
分类:
其他好文 时间:
2019-07-19 19:05:26
阅读次数:
98
在学习机器学习算法的过程中,我们经常需要数据来验证算法,调试参数。但是找到一组十分合适某种特定算法类型的数据样本却不那么容易。还好numpy, scikit-learn都提供了随机数据生成的功能,我们可以自己生成适合某一种模型的数据,用随机数据来做清洗,归一化,转换,然后选择模型与算法做拟合和预测。... ...
分类:
编程语言 时间:
2019-07-19 19:04:43
阅读次数:
90
在主成分分析(PCA)原理总结中,我们对主成分分析(以下简称PCA)的原理做了总结,下面我们就总结下如何使用scikit-learn工具来进行PCA降维。# 一、scikit-learn PCA类介绍 在scikit-learn中,与PCA相关的类都在sklearn.decomposition包中。... ...
分类:
其他好文 时间:
2019-07-19 19:03:33
阅读次数:
95
在FP Tree算法原理总结和PrefixSpan算法原理总结中,我们对FP Tree和PrefixSpan这两种关联算法的原理做了总结,这里就从实践的角度介绍如何使用这两个算法。由于scikit-learn中没有关联算法的类库,而Spark MLlib有,本文的使用以Spark MLlib作为使用... ...
分类:
编程语言 时间:
2019-07-19 18:55:36
阅读次数:
123
在局部线性嵌入(LLE)原理总结中,我们对流形学习中的局部线性嵌入(LLE)算法做了原理总结。这里我们就对scikit-learn中流形学习的一些算法做一个介绍,并着重对其中LLE算法的使用方法做一个实践上的总结。# 一、1.scikit-learn流形学习库概述 在scikit-learn中,流形... ...
分类:
其他好文 时间:
2019-07-19 18:44:29
阅读次数:
85
在Bagging与随机森林算法原理小结中,我们对随机森林(Random Forest, 以下简称RF)的原理做了总结。本文就从实践的角度对RF做一个总结。重点讲述scikit-learn中RF的调参注意事项,以及和GBDT调参的异同点。# 一、scikit-learn随机森林类库概述 在scikit... ...
分类:
其他好文 时间:
2019-07-19 18:44:10
阅读次数:
80