Python scikit-learn 学习笔记—环境篇
近来闲来无事,也面临毕业季。这段时间除了做毕业设计,和同学再多吃几顿饭玩玩游戏之外。剩下的时间浪费着实可惜。想着以后研究生还要读三年,不如现在多看看书或者别的资料。正逢最近参加阿里巴巴大数据比赛,趁机学了一阵Python 数据挖掘包scikit learn,估计以后说不定会用到,所以先行记录下来,分享给大家。
先说...
分类:
编程语言 时间:
2015-04-28 11:50:03
阅读次数:
145
注:原文代码链接http://scikit-learn.org/stable/auto_examples/text/mlcomp_sparse_document_classification.html运行结果为:Loading 20 newsgroups training set... 20 new...
分类:
其他好文 时间:
2015-04-25 18:13:29
阅读次数:
205
python scikit包使用遇到问题和解决办法。...
分类:
其他好文 时间:
2015-04-21 20:45:23
阅读次数:
179
引言对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。
在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们假设输入时一个特征矩阵或者csv文件。
首先,数据应该被载入内存中。
scikit-learn的...
分类:
其他好文 时间:
2015-04-19 11:37:16
阅读次数:
241
preface:最近《生物信息学》多次谈到AUC,ROC这两个指标,正在做的project,要求画ROC曲线,sklearn里面有相应的函数,故学习学习。
AUC:
ROC:
具体使用参考sklearn:
http://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_curve.html
http://sciki...
分类:
编程语言 时间:
2015-04-17 18:21:40
阅读次数:
2029
1.import matplotlib.pyplot as pltplt.scatter(x,y)先查scikit-learn安装在哪个python版本里面,查找之后就进入python根目录下如 Python27\Lib\site-packages\matplotlib 目录下 这样就找到了那个py...
分类:
其他好文 时间:
2015-04-12 16:10:43
阅读次数:
222
1.http://scikit-learn.org/stable/ 官网:关于scikit-learn介绍等2.http://stackoverflow.com/questions/tagged/scikit-learn stackoverflow下使用scikit-learn出现错误的解决方...
分类:
其他好文 时间:
2015-04-12 16:03:10
阅读次数:
111
缺失值填充之后,就要对其他格式有问题的属性进行处理了。比如Sex Embarked这些属性的值都是字符串类型的,而scikit learn中的模型都只能处理数值型的数据,需要将这些原始的字符串类型的数据转为数值型数据。所有数据通常可以分成两种类型:定量与定性。定量的属性(数值属性)通常蕴涵着可排序性...
分类:
其他好文 时间:
2015-03-20 23:44:48
阅读次数:
197
最近用来做实验,使用python时发现scikit-learn提供的库非常好用。因此,在电脑上果断下载安装:step1:sudo easy_install pipstep2:sudo pip install -U numpy scipy scikit-learnstep3:测试python -c "...
分类:
系统相关 时间:
2015-03-17 17:34:38
阅读次数:
1904
引入一个机器可以根据照片来辨别鲜花的品种吗?在机器学习角度,这其实是一个分类问题,即机器根据不同品种鲜花的数据进行学习,使其可以对未标记的测试图片数据进行分类。
这一小节,我们还是从scikit-learn出发,理解基本的分类原则,多动手实践。Iris数据集Iris flower数据集是1936年由Sir Ronald Fisher引入的经典多维数据集,可以作为判别分析(discriminant...
分类:
编程语言 时间:
2015-03-12 17:09:08
阅读次数:
197