原文链接:http://scikit-learn.github.io/dev/tutorial/basic/tutorial.html章节内容在这个章节中,我们主要介绍关于scikit-learn机器学习词库,并且将给出一个学习样例。机器学习:问题设置通常,一个学习问题是通过一系列的n个样本数据来学习然后尝试预测未知数据的属性。如果每一个样本超过一个单一的数值,例如多维输入(也叫做多维数据),那么它...
分类:
其他好文 时间:
2015-07-20 23:43:35
阅读次数:
174
具体代码实现参考:手动设置选择特征的个数http://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFE.html#sklearn.feature_selection.RFE通过交叉验证自动选择最优特征个数:...
分类:
其他好文 时间:
2015-07-16 21:23:41
阅读次数:
130
http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html#sklearn.feature_extraction.text.CountVectorizer
class sklearn.feature_extraction.text.C...
分类:
其他好文 时间:
2015-07-13 22:35:59
阅读次数:
778
Python source code:gradient_boosting_regression.pyfrom sklearn import ensemblefrom sklearn.metrics import mean_squared_error# Fit regression modelpara...
分类:
编程语言 时间:
2015-07-05 23:50:23
阅读次数:
166
http://blog.csdn.net/pipisorry/article/details/41957763文本特征提取词袋(Bag of Words)表征文本分析是机器学习算法的主要应用领域。可是,文本分析的原始数据无法直接丢给算法。这些原始数据是一组符号,由于大多数算法期望的输入是固定长度的数...
分类:
其他好文 时间:
2015-07-01 13:39:28
阅读次数:
3843
# -*- coding: utf-8 -*-"""Created on Tue Jun 23 15:24:19 2015@author: hd"""from sklearn import cross_validationc = []j=0filename = r'C:\Users\hd\Deskt...
分类:
编程语言 时间:
2015-06-23 19:57:01
阅读次数:
471
GridSearchCV详细地址:http://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html#examples-using-sklearn-grid-search-gridsearchc...
分类:
其他好文 时间:
2015-06-15 18:27:57
阅读次数:
269
目前,Python的IDE发行版有很多,大牛们推荐的也不相同,而我用的是winpython,它轻巧方便,无需安装,解压即可,主要是它还包含了常用的科学计算工具包numpy,scipy,sklearn,matplotlib,还有可以调用C动态库的扩展包ctypes,更好的是它有32位和64位,我选择的是64位版本。截图看一下Lib\site-packages文件夹下模块
当然...
分类:
编程语言 时间:
2015-06-13 15:42:55
阅读次数:
642
谱聚类一般会先对两两样本间求相似度, 然后根据相似度矩阵求出拉普拉斯矩阵,然后将每个样本映射到拉普拉斯矩阵特诊向量中,最后使用k-means聚类。
scikit-learn开源包中已经有现成的接口可以使用,具体见
http://scikit-learn.org/dev/modules/generated/sklearn.cluster.SpectralClustering.html#sklea...
分类:
其他好文 时间:
2015-06-02 21:59:56
阅读次数:
219
参考:http://my.oschina.net/u/175377/blog/84420第一个:利用sklearn导入非常简单的著名的花朵数据——安德森鸢尾花卉数据集。我们有一百五十个鸢尾花的一些尺寸的观测值:萼片长度、宽度,花瓣长度和宽度。还有它们的亚属:山鸢尾(Iris setosa)、变色鸢尾...
分类:
编程语言 时间:
2015-06-02 10:45:47
阅读次数:
157