详细要学习的书籍就是《机器学习实战》Machine Learning in Action,Peter HarringtonWindows下要安装3个文件,各自是;1.Python(因为python不是向下兼容的,所以推荐2.7版本号),网址:http://www.python.org2.numpy(...
分类:
编程语言 时间:
2014-07-01 17:52:50
阅读次数:
441
k邻近算法采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、没有数据输入假定;缺点:计算复杂度高、空间复杂度高(占内存);使用数据范围:数值型和标称型。
k-邻近算法的工作原理是:存在一个训练样本集,并且每个数据都存在标签,即我们知道每个数据都对应的哪个分类。输入一个没有标签的新数据,将新数据的每个特征和样本集中的所有数据进行笔记哦啊,提取出样本集中特征最相似(邻近)的分类...
分类:
编程语言 时间:
2014-05-20 16:54:05
阅读次数:
534
具体要学习的书籍就是《机器学习实战》Machine Learning in Action,Peter Harrington
Windows下要安装3个文件,分别是;
1.Python(由于python不是向下兼容的,所以推荐2.7版本),网址:http://www.python.org
2.numpy(python的科学计算包),网址:http://sourceforge.net/proje...
分类:
编程语言 时间:
2014-05-18 09:24:06
阅读次数:
303
1.机器学习的真实含义是利用数据来彰显数据背后的真实含义。
2.机器学习的一般用例:人脸识别、手写数字识别、垃圾邮件过滤、产品推荐等等。
3.机器学习的主要任务是分类,即将实例数据划分到合适的分类中。另一项任务是回归,主要用于预测数值型数据。分类和回归属于监督学习,之所以称为监督学习,是因为这类算法必须知道预测什么,即目标的分类信息。另一种机器学习方式是无监督学习,此时数据没有类别信息,也没有...
分类:
编程语言 时间:
2014-05-18 08:05:07
阅读次数:
320
Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括:一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数、傅里叶变换和随机数生成函数。
SciPy是....
分类:
编程语言 时间:
2014-05-15 14:06:15
阅读次数:
505