网易公开课学习笔记机器学习的定义 Arthur
Samuel:“在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域” 让计算机学会如何下棋,并超过自己 Tom
Mitchell:给计算机一个任务T和性能测试方法P,如果在经验E的影响下,P对T的测量结果得到了改...
分类:
其他好文 时间:
2014-05-27 02:41:19
阅读次数:
296
第一部分:
学习Mahout必须要知道的资料查找技能:
学会查官方帮助文档:
解压用于安装文件(mahout-distribution-0.6.tar.gz),找到如下位置,我将该文件解压到win7的G盘mahout文件夹下,路径如下所示:
G:\mahout\mahout-distribution-0.6\docs
学会查源代码的注释文档:
方案一:用ma...
分类:
其他好文 时间:
2014-05-22 10:37:07
阅读次数:
388
SVM(Support Vector Machine),中文名为 支持向量机,就像自动机一样,听起来异常神气,最初总是纠结于不是机器怎么能叫“机”,后来才知道其实此处的“机”实际上是算法的意思。
支持向量机一般用于分类,基本上,在我的理解范围内,所有的机器学习问题都是分类问题。而据说,SVM是效果最好而成本最低的分类算法。
SVM是从线性可分的情况下最优分类面发展而来的,其基本思想可以用下图表...
分类:
其他好文 时间:
2014-05-18 10:17:23
阅读次数:
309
具体要学习的书籍就是《机器学习实战》Machine Learning in Action,Peter Harrington
Windows下要安装3个文件,分别是;
1.Python(由于python不是向下兼容的,所以推荐2.7版本),网址:http://www.python.org
2.numpy(python的科学计算包),网址:http://sourceforge.net/proje...
分类:
编程语言 时间:
2014-05-18 09:24:06
阅读次数:
303
1.机器学习的真实含义是利用数据来彰显数据背后的真实含义。
2.机器学习的一般用例:人脸识别、手写数字识别、垃圾邮件过滤、产品推荐等等。
3.机器学习的主要任务是分类,即将实例数据划分到合适的分类中。另一项任务是回归,主要用于预测数值型数据。分类和回归属于监督学习,之所以称为监督学习,是因为这类算法必须知道预测什么,即目标的分类信息。另一种机器学习方式是无监督学习,此时数据没有类别信息,也没有...
分类:
编程语言 时间:
2014-05-18 08:05:07
阅读次数:
320
(转载请注明出处:http://blog.csdn.net/buptgshengod)...
分类:
编程语言 时间:
2014-05-18 05:13:44
阅读次数:
434
本栏目来源于Andrew NG老师讲解的Machine
Learning课程,主要介绍大规模机器学习以及其应用。包括随机梯度下降法、维批量梯度下降法、梯度下降法的收敛、在线学习、map
reduce以及应用实例:photo OCR。课程地址为:https://www.coursera.org/cou...
分类:
移动开发 时间:
2014-05-18 00:36:57
阅读次数:
452
在机器学习领域,我们碰到的第一个问题就是:如何选择特征量。
可是看了一些资料,这点好像都是一笔带过,因为很多都是所谓的不可观测量,如何把不可观测量量化呢?这个或许能给机器学习带来新的契机,就像当年牛顿把力、质量、加速度等模糊的概念定义下来,经典物理出现了前所未有的发展,香农把信息量化,造就了信息革命...
分类:
其他好文 时间:
2014-05-17 23:32:17
阅读次数:
329
量子力学的发展历史真是让人唏嘘不已,从它诞生到巅峰,好像就经历了一代人,当普朗克去世的时候,爱因斯坦还在和波尔争论着量子力学的完备性。
而经典物理学的发展却经历了从阿基米德到伽利略,再到牛顿等人。 谁也想不到,晶体管的发明会这样改变世界吧?
那个年代,仿佛就是近代科学的黄金时期,人才扎堆的出现。那时...
分类:
其他好文 时间:
2014-05-17 21:23:52
阅读次数:
241
训练集上训练的模型在多大程度上能够对新的实例预测出正确输出称为泛化(generalization)
对最好的泛化来说,我们应当使假设的复杂性和潜在数据的函数的复杂性相匹配。如果假设没有函数复杂,例如,当试图用直线拟合从三次项式抽取的数据时,称为欠拟合(underfitting)。在这种情况下,随着复...
分类:
其他好文 时间:
2014-05-17 21:15:53
阅读次数:
270