安装python-2.7.13.msi(到C:\Python27),把C:\Python27和C:\Python27\Scripts添加到系统环境变量 安装numpy:下载numpy-1.11.3+mkl-cp27-cp27m-win32.whl mkl即intel的math kernel lib ...
sklearn模块提供了决策树的解决方案,不用自己去造轮子了(不会造,感觉略复杂): 下面是笔记: Sklearn.tree参数介绍及使用建议 参数介绍及使用建议官网: http://scikit-learn.org/stable/modules/generated/sklearn.tree.Dec ...
分类:
编程语言 时间:
2017-03-30 19:46:18
阅读次数:
472
a) https://github.com/bakwc/PornDetector 封装了两个库,opencv与scikit-learn 另外一种法师封装了opencv与tensorflow ...
分类:
其他好文 时间:
2017-03-24 12:20:41
阅读次数:
138
Windows下安装scikit-learn 准备工作 Python (>= 2.6 or >= 3.3), Numpy (>= 1.6.1) Scipy (>= 0.9), Matplotlib(可选). NumPy NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大 ...
分类:
其他好文 时间:
2017-03-22 00:04:46
阅读次数:
430
PyODPS,拥有对于Python用户传统的数据分析和机器学习愉快的体验,包括了DataFrame框架和机器学习模块,它们类似于pandas+scikit-learn,能用它们进行数据分析、绘图、机器学习等等。 ...
分类:
其他好文 时间:
2017-03-17 17:36:29
阅读次数:
232
现实世界中多数特征都不是连续变量,比如分类、文字、图像等,为了对非连续变量做特征表述,需要对这些特征做数学化表述,因此就用到了特征提取。 1、分类变量的特征提取 比如城市作为一个特征,那么就是一系列散列的城市标记,这类特征我们用二进制编码来表示,是这个城市为1,不是这个城市为0 比如有三个城市:北京 ...
分类:
其他好文 时间:
2017-03-13 14:56:20
阅读次数:
242
1、综述 scikit-learn的线性回归模型都是通过最小化成本函数来计算参数的,通过矩阵乘法和求逆运算来计算参数。当变量很多的时候计算量会非常大,因此我们改用梯度下降法,批量梯度下降法每次迭代都用所有样本,快速收敛但性能不高,随机梯度下降法每次用一个样本调整参数,逐渐逼近,效率高,本节我们来利用 ...
分类:
其他好文 时间:
2017-03-13 13:15:21
阅读次数:
401
撰写日期:2017-03-12 多元真实情况未必是线性的,有时需要增加指数项,也就是多项式回归,现实世界的曲线关系都是通过增加多项式实现的,本节介绍用scikit-learn解决多项式回归问题。 1、住房价格成本 样本 面积(平方米) 价格(万元) 2、绘图 1 import sys 2 reloa ...
分类:
其他好文 时间:
2017-03-12 10:49:21
阅读次数:
136
一般情况下,一个因变量是和多个自变量有关的,比如一个商品的价格和原料价格、加工方法、上市时间、品牌价值等有关,也就是多元线性,本节介绍如何用scikit-learn解决多元线性回归问题。 1、多元线性回归模型 方程:Y=Xβ 求解多元线性回归问题就是求解β: 因为X不一定是方阵,所以不能直接β=X- ...
分类:
其他好文 时间:
2017-03-12 10:47:25
阅读次数:
205
1、概念 一元线性回归是最简单的一种模型,但应用广泛,比如简单地预测商品价格、成本评估等,都可以用一元线性模型,本节主要讲解scikit-learn一元线性回归的使用以及作图说明。 y=f(x)叫做一元函数,回归的意思就是根据已知数据复原某些值,线性回归(regression)就是用线性的模型做回归 ...
分类:
其他好文 时间:
2017-03-11 23:35:33
阅读次数:
253