import sklearn报错:Traceback (most recent call last): File "", line 1, in import sklearn File "D:\Python27\lib\site-packages\scikit_learn-0.15.2-py...
分类:
其他好文 时间:
2015-03-08 06:43:24
阅读次数:
1454
from matplotlib import pyplot as pltfrom sklearn.datasets import load_irisimport numpy as npdata=load_iris()feature_names=data['featrue_names']target=...
分类:
Windows程序 时间:
2015-03-07 22:37:34
阅读次数:
1231
有了数据,剩下的就是流水线上的活:利用某种机器学习算法学习得到模型,在用模型进行预测,评价模型的性能。1 分割训练集和测试集Python的机器学习包sklearn非常强大,它不仅包含了不论监督学习、非监督学习的算法,同时包括了进行常用预处理和其他流程的函数。分割训练集和测试集的函数虽然很简单,但也包...
分类:
其他好文 时间:
2015-03-04 22:37:23
阅读次数:
837
Classification with HDF5 data1.导入库 1 import os 2 import h5py 3 import shutil 4 import sklearn 5 import tempfile 6 import numpy as np 7 import pandas a...
分类:
其他好文 时间:
2015-02-23 06:27:19
阅读次数:
354
1 鸢尾花数据集背景鸢尾花数据集是原则20世纪30年代的经典数据集。它是用统计进行分类的鼻祖。sklearn包不仅囊括很多机器学习的算法,也自带了许多经典的数据集,鸢尾花数据集就是其中之一。导入的方法很简单,不过我比较好奇它是如何来存储这些数据的,于是我决定去背后看一看from sklearn.da...
分类:
其他好文 时间:
2015-02-04 14:15:48
阅读次数:
3790
转自:http://blog.csdn.net/liuxuejiang158blog/article/details/31360765?utm_source=tuicool 在文本处理中,TF-IDF可以说是一个简单粗暴的东西。它可以用作特征抽取,关键词筛选等。 以网页搜索“核能的应...
分类:
其他好文 时间:
2015-02-03 21:07:54
阅读次数:
2058
一、标准化,均值去除和按方差比例缩放 数据集的标准化:当个体特征太过或明显不遵从高斯正态分布时,标准化表现的效果较差。实际操作中,经常忽略特征数据的分布形状,移除每个特征均值,划分离散特征的标准差,从而等级化,进而实现数据中心化。 scale 1 >>> from sklearn import .....
分类:
其他好文 时间:
2015-02-02 19:49:43
阅读次数:
345
调用python的sklearn实现Logistic Reression算法
先说如何实现,其中的导入数据库和类、方法的关系,之前不是很清楚,现在知道了。。。
from numpy import *
from sklearn.datasets import load_iris # import datasets
# load the dataset...
分类:
编程语言 时间:
2015-01-21 20:14:19
阅读次数:
1118
reference :http://my.oschina.net/u/175377/blog/84420目录[-]Scikit Learn: 在python中机器学习载入示例数据一个改变数据集大小的示例:数码数据集(digits datasets)学习和预测分类K最近邻(KNN)分类器训练集和测试集...
分类:
其他好文 时间:
2015-01-03 17:05:35
阅读次数:
694
reference :http://www.csdn.net/article/2012-12-28/2813275-Support-Vector-MachineSVM是什么?SVM是一种训练机器学习的算法,可以用于解决分类和回归问题,同时还使用了一种称之为kernel trick的技术进行数据的转换...
分类:
其他好文 时间:
2015-01-03 15:50:33
阅读次数:
442