1.anaconda与pycharm的关系 1、python python自身缺少numpy、matplotlib、scipy、scikit-learn....等一系列包,需要我们安装pip来导入这些包才能进行相应运算(python3.5自带了get-pip.py,不需额外下载安装),在cmd终端输 ...
分类:
其他好文 时间:
2020-06-03 10:45:20
阅读次数:
115
决策树 https://www.cnblogs.com/molieren/articles/10664954.html http://scikit-learn.org/stable/modules/tree.html ...
分类:
其他好文 时间:
2020-06-02 23:04:22
阅读次数:
97
有时提升一个模型的准确度很困难,尝试所有曾学习过的策略和算法,但模型的正确率并没有改善。 前面介绍的算法中,每种算法都有不同的适用范围,可以把多种机器学习算法组合在一起,这时提高算法准确度的有效方法之一。 接下来介绍如何通过scikit-learn来实现集成算法,包括: 装袋(Bagging)算法: ...
分类:
编程语言 时间:
2020-05-22 09:26:55
阅读次数:
52
解决办法: 更新sklearn库 具体方法: 1.打开anaconda下的anaconda的Promote 2.输入 pip list 可以查看当前已经安装的包和版本 3.更新sklearn: 输入”conda update scikit-learn” 参考: https://blog.csdn.n ...
分类:
Web程序 时间:
2020-05-17 17:55:46
阅读次数:
208
1. scikit learn PCA类介绍 在scikit learn中,与PCA相关的类都在sklearn.decomposition包中。最常用的PCA类就是sklearn.decomposition.PCA,我们下面主要也会讲解基于这个类的使用的方法。 除了PCA类以外,最常用的PCA相关类 ...
分类:
其他好文 时间:
2020-05-03 20:29:40
阅读次数:
70
TF IDF基础: TF IDF(Term Frequency InversDocument Frequency)是一种常用于信息处理和数据挖掘的加权技术。该技术采用一种统计方法,根据字词的在文本中出现的次数和在整个语料中出现的文档频率来计算一个字词在整个语料中的重要程度。它的优点是能过滤掉一些常见 ...
分类:
其他好文 时间:
2020-04-30 12:01:23
阅读次数:
88
1. 机器学习的步骤 数据,模型选择,训练,测试,预测 2. 安装机器学习库sklearn pip list 查看版本 python -m pip install --upgrade pip pip install -U scikit-learn pip uninstall sklearn pip ...
分类:
编程语言 时间:
2020-04-16 16:55:07
阅读次数:
128
1 分类 分类是将事物按特性进行分类,例如将手写数字图片分类为对应的数字。 1.1 MINIST数字图片集分类 MINST就是一个70000张规格较小的手写数字图片,如何将他们分类为对应的数字?MINIST这个数据集是由矩阵数组结构,70000个矩阵,每个矩阵28*28=784,每个点代表一个像素值 ...
分类:
其他好文 时间:
2020-04-07 22:24:32
阅读次数:
105
在梯度提升树(GBDT)原理小结中,我们对GBDT的原理做了总结,本文我们就从scikit-learn里GBDT的类库使用方法作一个总结,主要会关注调参中的一些要点。 1. scikit-learn GBDT类库概述 在sacikit-learn中,GradientBoostingClassifie ...
分类:
其他好文 时间:
2020-03-31 23:06:06
阅读次数:
105
本篇文章基于 著作《Hands-On Machine Learning with Scikit-learn,Keras and TensorFlow 2nd edition》,主要介绍分类模型。 1. MNIST数据集: MNIST数据集是一组70000张小数字图像,由高中生和美国人口普查局员工手写 ...
分类:
其他好文 时间:
2020-03-31 10:25:00
阅读次数:
73