在做分类时常常需要估算不同样本之间的相似性度量(Similarity
Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。
本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼....
分类:
其他好文 时间:
2014-07-22 23:15:15
阅读次数:
302
转载自:http://www.cnblogs.com/flclain/archive/2012/12/22/2829317.html入门:数据挖掘入门的书籍,中文的大体有这些:JiaweiHan的《数据挖掘概念与技术》IanH.Witten/EibeFrank的《数据挖掘实用机器学习技术》TomMi...
分类:
其他好文 时间:
2014-07-22 23:11:53
阅读次数:
345
转载自:http://www.cnblogs.com/jilichuan/archive/2012/12/07/2807897.html【1】Yizhou
Sun(DM)UIUC,今年毕业,应该去美国的东北大学,在异构网络上做了很多工作。http://web.engr.illinois.edu/~s...
分类:
其他好文 时间:
2014-07-22 23:11:53
阅读次数:
261
AdviceforapplyingmachinelearningDeciding what
to try next
现在我们已学习了线性回归、逻辑回归、神经网络等机器学习算法,接下来我们要做的是高效地利用这些算法去解决实际问题,尽量不要把时间浪费在没有多大意义的尝试上,Advice
for appl...
分类:
移动开发 时间:
2014-04-29 12:11:47
阅读次数:
756
http://blog.csdn.net/v_july_v/article/details/7577684
分类:
其他好文 时间:
2014-04-29 11:23:47
阅读次数:
266
废话:和上一次的文章确实隔了太久,希望趁暑期打酱油的时间,将之前学习的东西深入理解一下,同时尝试用Python写相关的机器学习代码。一 PGM模型的分类
通过上一篇文章的介绍,相信大家对PGM的定义和大致应用场景有了粗略的了解。那么接下来我们来深入了解下PGM。首先要介绍的是Probabilist....
分类:
其他好文 时间:
2014-04-29 09:48:47
阅读次数:
457
一 课程基本信息 本课程是由Prof.Daphne Koller主讲,同时得到了Prof.
Kevin Murphy的支持,在coursera上公开传播。在本课程中,你将学习到PGM(Probabilistic Graphical
Models)表示的基本理论,以及如何利用人类自身的知识和机器学习技...
分类:
其他好文 时间:
2014-04-29 09:23:46
阅读次数:
490
今天看了两集Stanford 的Machine
Learning,先说说感受,在看的过程中,脑海里冒出来一个念头:在中国的大学里,教授们都是好像在做研究,而学生们都是好像在上课,到头来不知道学到了什么,我在屏幕的这边都能感受到他们和我们的不一样。
其实对于机器学习,我是真心不懂,也不知道为什么忽然就...
分类:
其他好文 时间:
2014-04-28 05:32:20
阅读次数:
443
《Introduction to Data Mining》 《Data Mining :
Concepts and Techniques》 《Introduction to Machine Learning》 《机器学习:实用案例解析》
《Pattern Recognition and Machin...
分类:
其他好文 时间:
2014-04-27 23:32:07
阅读次数:
526
一、Mahout简介
查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...
附logo:
(就是他,骑在象头上的那个Mahout)
步入正文:
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚...
分类:
其他好文 时间:
2014-04-27 19:59:55
阅读次数:
569