PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。 在Scikit中运用PCA很简单: 以上代码是将含有4个特征的数据经过PCA压缩为3个特征。P ...
分类:
其他好文 时间:
2017-05-08 01:26:35
阅读次数:
865
自己写的计算auc的代码,用scikit-learn的auc计算函数sklearn.metrics.auc(x, y, reorder=False)做了一些测试,结果是一样的 思路:1.首先对预测值进行排序,排序的方式用了python自带的函数sorted,详见注释。 2.对所有样本按照预测值从小到 ...
分类:
编程语言 时间:
2017-05-04 12:05:40
阅读次数:
902
对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。1.获取数据,定义问题没有数据,当然没法研究机器学习啦。:)这里我们用UCI大学公开的机器学习数据来跑线性回归。数据的介绍在这:http:/..
分类:
其他好文 时间:
2017-05-03 19:21:44
阅读次数:
241
对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。 1. 获取数据,定义问题 没有数据,当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。 数据的介绍在这: http://ar ...
分类:
其他好文 时间:
2017-05-03 17:30:00
阅读次数:
225
很多朋友想学习机器学习,却苦于环境的搭建,这里给出windows上scikit-learn研究开发环境的搭建步骤。 Step 1. Python的安装 python有2.x和3.x的版本之分,但是很多好的机器学习python库都不支持3.x,因此,推荐安装2.7版本的python。当前最新的pyth ...
Scikit-Learn总结 Scikit-Learn(基于Python的工具包)1.是一个基于Numpy,Scipy,Matplotlib的开源机器学习工具包。2.该包于2007年发起,基本功能包涵了6个方面:分类、回归、聚类、数据降维、模型选择、预处理包括了大量常用的算法::SVM,逻辑回归,朴 ...
分类:
其他好文 时间:
2017-05-03 09:20:36
阅读次数:
1030
1 首先须要安装Cython。网上下载后进行本地安装 python setup.py install 2 下载Sklearn包,https://pypi.python.org/pypi/scikit-learn/0.14.1 。进行本地安装(使用pip或easy_install总是出错。如can n ...
分类:
编程语言 时间:
2017-04-30 18:29:37
阅读次数:
233
零、全部项目通用的: http://blog.csdn.net/mmc2015/article/details/46851245(数据集格式和预測器) http://blog.csdn.net/mmc2015/article/details/46852755(载入自己的原始数据) (适合文本分类问题 ...
分类:
其他好文 时间:
2017-04-24 12:37:09
阅读次数:
240
scikit-learn这个非常强大的python机器学习工具包 http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html S1. 导入数据 大多数数据的格式都是M个N维向量,分为训练集和测试集。所以,知道如何导入向量 ...
分类:
编程语言 时间:
2017-04-23 15:03:50
阅读次数:
184
python 篇: http://machinelearningmastery.com/ensemble-machine-learning-algorithms-python-scikit-learn/ R 篇: http://machinelearningmastery.com/machine-l ...
分类:
其他好文 时间:
2017-04-18 18:14:46
阅读次数:
148