```python
from numpy import *
from os import listdir
import operator def createDataSet(): group = array([[1.0, 1.1], [1.0, 1.0], [0, 0], [0, 0.1]]) la... ...
分类:
其他好文 时间:
2018-04-20 00:16:23
阅读次数:
195
数据是很重要的,机器学习实战的源代码提供了数据,这点是非常好的 将图像转化为文本,读进向量里,就可以使用前面写的分类器 理解程序没有什么问题,很多函数前面也都学习过了,这里学习一下读取一个文件夹里的所有文件名 使用listdir()需要从os模块导入 os.listdir() 方法用于返回指定的文件 ...
分类:
编程语言 时间:
2018-04-12 20:48:54
阅读次数:
214
问题一: >>>import matplotlib 出现 No module named ’matplotlib‘ 解决过程 >pip install matplotlib 出现 pip版本升级以后再导入matplotlib,仍然出现上图情况 在pycharm中选择2.7.14版本的project ...
分类:
编程语言 时间:
2018-04-04 23:29:14
阅读次数:
432
2.预测数据分类时,出现 ‘dict’ object has no attribute ‘iteritems‘ 如: 最常见的解决办法是 更改环境变量顺序 如 注意:哪个版本在上面,cmd 中的python版本即是谁。 如 又如: 然后 预测数据所在分类 即可实现: ...
分类:
编程语言 时间:
2018-04-04 15:07:27
阅读次数:
187
问题背景:平常用cmd运行python代码问题不大,我在学习《机器学习实战》这本书时,发现cmd无法运行 这条语句,原因是没有安装numpy。虽然用Anaconda的prompt以及Spyder等都可以成功运行,但如何在cmd环境下使用代码中含有numpy的文件呢? 答: 用 命令即可,以下是效果: ...
分类:
其他好文 时间:
2018-03-29 19:02:15
阅读次数:
5446
概要 把常用的机器学习算法:$k$ 近邻算法、决策树、朴素贝叶斯、$K$ 均值聚类其思想有及 python 代码实现总结一下。做到既要知其然又要知其所以然。参考《机器学习实战》。 $k$ 近邻算法 基本原理 $k$ 近邻算法是分类数据最简单有效 ...
分类:
编程语言 时间:
2018-03-26 19:07:02
阅读次数:
215
在 8.4.2 lasso 的 函数里使用到了一个用于标准化的函数 ,这个函数是需要自定义的,但是书中没有给出来。 在示例代码中有,是这样子的: ...
分类:
其他好文 时间:
2018-03-24 11:32:49
阅读次数:
168
在实现《机器学习实战》中kNN代码时遇到需要将计算好的距离进行排序,即可使用argsort()函数,在此依据个人理解对该函数进行简单的介绍。 总的来说,argsort()函数是对数组中的元素进行从小到大排序,并返回相应序列元素的数组下标。 以下通过例子进行详细解释。 1. 先定义一个数组 2. 调用 ...
分类:
编程语言 时间:
2018-03-23 13:03:51
阅读次数:
527
朴素贝叶斯(naive bayes) 标签: Python 机器学习 主要參考资料:《机器学习实战》《统计学习方法》 1.朴素贝叶斯分类原理 朴素贝叶斯法是基于贝叶斯定理和特征条件独立假设(称为朴素的原因)的分类方法。先看看维基百科中贝叶斯定理的描写叙述: 贝叶斯定理(维基百科) 通常,事件A在事件 ...
分类:
其他好文 时间:
2018-03-21 11:36:14
阅读次数:
253
P120 程序清单7 1 单层决策树生成函数 在3.6版本的anaconda下执行会提示错误: 解决方法: 也就是把labelMat转置,出现这个错误原因是 和`labelMat`的shape不同导致的 ...
分类:
其他好文 时间:
2018-03-19 22:43:18
阅读次数:
616