码迷,mamicode.com
首页 >  
搜索关键字:scikit    ( 627个结果
应用scikit-learn做文本分类
http://blog.csdn.net/abcjennifer/article/details/23615947文本挖掘的paper没找到统一的benchmark,只好自己跑程序,走过路过的前辈如果知道20newsgroups或者其它好用的公共数据集的分类(最好要所有类分类结果,全部或取部分特征无...
分类:其他好文   时间:2015-01-06 21:27:47    阅读次数:221
[Example of Sklearn] - Example
reference :http://my.oschina.net/u/175377/blog/84420目录[-]Scikit Learn: 在python中机器学习载入示例数据一个改变数据集大小的示例:数码数据集(digits datasets)学习和预测分类K最近邻(KNN)分类器训练集和测试集...
分类:其他好文   时间:2015-01-03 17:05:35    阅读次数:694
[Scikit-Learn] - 数据预处理 - 归一化/标准化/正则化
reference:http://www.cnblogs.com/chaosimple/p/4153167.html一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,...
分类:其他好文   时间:2015-01-03 14:36:44    阅读次数:241
[Scikit-Learn] - introduction
scikit-learn是一个用于机器学习的 Python 模块,建立在SciPy基础之上.主要特点:操作简单、高效的数据挖掘和数据分析无访问限制,在任何情况下可重新使用建立在NumPy、SciPy 和 matplotlib基础上使用商业开源协议——BSD许可证重要链接:官方源代码报告:https:...
分类:其他好文   时间:2015-01-03 14:31:43    阅读次数:157
[Scikit-Learn] - 数据预处理 - 缺失值(Missing Value)处理
reference :http://www.cnblogs.com/chaosimple/p/4153158.html关于缺失值(missing value)的处理在sklearn的preprocessing包中包含了对数据集中缺失值的处理,主要是应用Imputer类进行处理。首先需要说明的是,nu...
分类:其他好文   时间:2015-01-03 14:31:39    阅读次数:221
scikit-learn中PCA的使用方法
scikit-learn中PCA的使用方法 @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/42192293 在前一篇文章 主成分分析(PCA) 中,我基于python和numpy实现了PCA算法,主要是为了加深对算法的理解,算法的实现很粗糙,实际应用中我们一般调用成熟的包,本文就结束...
分类:其他好文   时间:2014-12-27 17:40:42    阅读次数:497
【scikit-learn】学习Python来分类现实世界的数据
引入 一个机器可以根据照片来辨别鲜花的品种吗?在机器学习角度,这其实是一个分类问题,即机器根据不同品种鲜花的数据进行学习,使其可以对未标记的测试图片数据进行分类。 这一小节,我们还是从scikit-learn出发,理解基本的分类原则,多动手实践。 Iris数据集 Iris flower数据集是1936年由Sir Ronald Fisher引入的经典多维数据集,可以作为判别分析(...
分类:编程语言   时间:2014-12-25 11:19:34    阅读次数:402
【scikit-learn】用Python进行机器学习实验
本文是用Python编程语言来进行机器学习小实验的第一篇。主要内容如下: 读入数据并清洗数据 探索理解输入数据的特点 分析如何为学习算法呈现数据 选择正确的模型和学习算法 评估程序表现的准确性...
分类:编程语言   时间:2014-12-17 09:49:44    阅读次数:223
Feature extraction - sklearn文本特征提取
文本特征提取 词袋(Bag of Words)表征 文本分析是机器学习算法的主要应用领域。但是,文本分析的原始数据无法直接丢给算法,这些原始数据是一组符号,因为大多数算法期望的输入是固定长度的数值特征向量而不是不同长度的文本文件。为了解决这个问题,scikit-learn提供了一些实用工具可以用最常见的方式从文本内容中抽取数值特征,比如说: 标记(tokenizing)文本以及为每一...
分类:其他好文   时间:2014-12-16 11:46:54    阅读次数:203
Python之扩展包安装(scikit learn)
scikit learn 是Python下开源的机器学习包。(安装环境:win7.0 32bit和Python2.7)Python安装第三方扩展包较为方便的方法:easy_install + packages name在官网 https://pypi.python.org/pypi/setuptoo...
分类:编程语言   时间:2014-12-15 18:35:44    阅读次数:160
627条   上一页 1 ... 59 60 61 62 63 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!