码迷,mamicode.com
首页 >  
搜索关键字:scikit    ( 627个结果
python data analysis | python数据预处理(基于scikit-learn模块)
原文:http://www.jianshu.com/p/94516a58314d Dataset transformations| 数据转换 Combining estimators|组合学习器 Feature extration|特征提取 Preprocessing data|数据预处理 1 Da ...
分类:编程语言   时间:2016-06-03 21:17:36    阅读次数:879
机器学习基础
本章我们简要介绍下机器学习(Machine Learning)的基本概念。主要介绍机器学习算法的应用,监督学习和无监督学习(supervised-unsupervised learning)的应用场景,训练和测试数据的用法,学习效果评估方式。最后,对scikit-learn进行一些简单的介绍。 自计算机问世以来,计算机可以学习和模仿人类智慧的观点,可谓“引无数英雄竞折腰”...
分类:其他好文   时间:2016-06-02 14:10:41    阅读次数:310
《Python数据分析常用手册》一、NumPy和Pandas篇
一、常用链接: 1.Python官网:https://www.python.org/ 2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn 一、常用链接: 3.数据分析常用库的离线安装包(pip+wheels)( ...
分类:编程语言   时间:2016-05-30 00:49:24    阅读次数:17677
Bagging(Bootstrap aggregating)、随机森林(random forests)、AdaBoost
在这篇文章中,我会详细地介绍Bagging、随机森林和AdaBoost算法的实现,并比较它们之间的优缺点,并用scikit-learn分别实现了这3种算法来拟合Wine数据集。全篇文章伴随着实例,由浅入深,看过这篇文章以后,相信大家一定对ensemble的这些方法有了很清晰地了解。...
分类:其他好文   时间:2016-05-27 12:52:54    阅读次数:856
python 安装scikit!!!
首先,吐槽一下,真的是折腾好几天,一会更新这个,一会更新那个,总是各种奇葩问题诸如此类: cannot import check-build pip有新版本,需要更新(黄字) 其中scipy出错最多,但是还是可安装的 找不到指定模块 no model XXX 诸如此类,各种更新就是不行 但是下边的这 ...
分类:编程语言   时间:2016-05-15 21:32:05    阅读次数:599
地铁译:Spark for python developers --- 搭建Spark虚拟环境1
一个多月的地铁阅读时光,阅读《Spark for python developers》电子书,不动笔墨不看书,随手在evernote中做了一下翻译,多年不习英语,自娱自乐。周末整理了一下,发现再多做一点就可基本成文了,于是开始这个地铁译系列。 为开发搭建一个独立的虚拟环境,通过Spark和Anaconda提供的PyData 库为该环境补充能力。 这些库包括Pandas,Scikit-Learn, Blaze,...
分类:编程语言   时间:2016-05-12 22:46:40    阅读次数:299
机器学习系统模型调优实战--所有调优技术都附相应的scikit-learn实现
引言如果你对机器学习算法已经很熟悉了,但是有时候你的模型并没有很好的预测效果或者你想要追求更好地模型性能。那么这篇文章会告诉你一些最实用的技术诊断你的模型出了什么样的问题,并用什么的方法来解决出现的问题,并通过一些有效的方法可以让你的模型具有更好地性能。介绍数据集这个数据集有569个样本,它的前两列为唯一的ID号和诊断结果 (M = malignant, B = benign) ,它的3->32列为...
分类:其他好文   时间:2016-05-12 20:09:55    阅读次数:495
windows下安装python科学计算环境,numpy scipy scikit等
背景: 目的:要用Python下的DBSCAN聚类算法。 scikit-learn 是一个基于SciPy和Numpy的开源机器学习模块,包括分类、回归、聚类系列算法,主要算法有SVM、逻辑回归、朴素贝叶斯、Kmeans、DBSCAN等,目前由INRI 资助,偶尔Google也资助一点。 SciPy是 ...
分类:编程语言   时间:2016-05-06 20:18:39    阅读次数:284
scikit-learn学习之SVM算法
分隔超平面:将数据集分割开来的直线叫做分隔超平面。 超平面:如果数据集是N维的,那么就需要N-1维的某对象来对数据进行分割。该对象叫做超平面,也就是分类的决策边界。 间隔: 一个点到分割面的距离,称为点相对于分割面的距离。 数据集中所有的点到分割面的最小间隔的2倍,称为分类器或数据集的间隔。 最大间隔:SVM分类器是要找最大的数据集间隔。 支持向量:坐落在数据边际的两边超平面上的点被称为支持向量...
分类:编程语言   时间:2016-05-06 15:50:39    阅读次数:308
SVM详解(包含它的参数C为什么影响着分类器行为)-scikit-learn拟合线性和非线性的SVM
引言这篇文章详细地介绍了SVM背后的原理,它为什么是大间距分类器?分类器的参数C为什么影响着分类器的行为?核函数背后采用了什么样的技术,看过这篇文章以后,相信你能很好地理解这些问题。最后,我用scikit-learn来分别来拟合线性和非线性的SVM,让大家对SVM分类器有更加深刻的理解。找寻最优化目标相信所有用过SVM的人都知道它是一个大间距分类器。但是,它的原理是什么?它为什么可以最大化决策边界与...
分类:其他好文   时间:2016-05-06 15:16:01    阅读次数:641
627条   上一页 1 ... 47 48 49 50 51 ... 63 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!