来自 http://blog.csdn.net/jasonding1354/article/details/46340729 内容概要 如何使用pandas读入数据 如何使用seaborn进行数据的可视化 scikit-learn的线性回归模型和使用方法 线性回归模型的评估测度 特征选择的方法 内容 ...
分类:
其他好文 时间:
2017-07-18 15:29:36
阅读次数:
275
1.安装scikit-learn 1.1Scikit-learn 依赖 Python (>= 2.6 or >= 3.3), NumPy (>= 1.6.1), SciPy (>= 0.9). 分别查看上述三个依赖的版本, python -V 结果:Python 2.7.3 python -c 'i ...
分类:
编程语言 时间:
2017-07-12 20:04:53
阅读次数:
412
參考:http://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter 三种方法评估模型的预測质量: Estimator score method: Estimators都有 score method作为默认 ...
分类:
其他好文 时间:
2017-07-08 13:18:12
阅读次数:
319
1 Introduction 1.1 Dataset scikit-learn提供了一些标准数据集(datasets),比如用于分类学习的iris 和 digits 数据集,还有用于归约的boston house prices 数据集。 其使用方式非常简单如下所示: $ python >>> fro ...
分类:
其他好文 时间:
2017-07-06 22:52:58
阅读次数:
235
之前写过两篇文章。各自是 1)矩阵分解的综述:scikit-learn:2.5.矩阵因子分解问题 2)关于TruncatedSVD的简介:scikit-learn:通过TruncatedSVD实现LSA(隐含语义分析) 今天发现NMF也是一个非常好非常有用的模型,就简介一下。它也属于scikit-l ...
分类:
其他好文 时间:
2017-07-01 21:44:50
阅读次数:
181
一、R2 决定系数(拟合优度) 它是表征回归方程在多大程度上解释了因变量的变化,或者说方程对观测值的拟合程度如何。 因为如果单纯用残差平方和会受到你因变量和自变量绝对值大小的影响,不利于在不同模型之间进行相对比较.而用拟合优度就可以解决这个问题。例如一个模型中的因变量:10000、20000….., ...
分类:
其他好文 时间:
2017-06-26 12:40:53
阅读次数:
152
http://scikit-learn.org/stable/modules/feature_extraction.html 4.2节内容太多,因此将文本特征提取单独作为一块。 1、the bag of words representation 将raw data表示成长度固定的数字特征向量。sci ...
分类:
其他好文 时间:
2017-06-24 21:04:00
阅读次数:
238
?? 内容概要¶ 训练集/測试集切割用于模型验证的缺点K折交叉验证是怎样克服之前的不足交叉验证怎样用于选择调节參数、选择模型、选择特征改善交叉验证 1. 模型验证回想¶ 进行模型验证的一个重要目的是要选出一个最合适的模型,对于监督学习而言,我们希望模型对于未知数据的泛化能力强,所以就须要模型验证这一 ...
分类:
其他好文 时间:
2017-06-23 14:14:54
阅读次数:
1121
前言 Numpy是一个开源的Python科学计算库,它是python科学计算库的基础库,许多其他著名的科学计算库如Pandas,Scikit-learn等都要用到Numpy库的一些功能。 本文主要内容如下: Numpy数组对象 创建ndarray数组 Numpy的数值类型 ndarray数组的属性 ...
分类:
编程语言 时间:
2017-06-18 13:28:39
阅读次数:
4701
一、常用链接: 1.Python官网:https://www.python.org/2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn 一、常用链接: 3.数据分析常用库的离线安装包(pip+wheels)(百 ...
分类:
编程语言 时间:
2017-06-13 12:47:12
阅读次数:
240