在做分类时常常需要估算不同样本之间的相似性度量(Similarity
Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。
本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼....
分类:
其他好文 时间:
2014-07-22 23:15:15
阅读次数:
302
转载自:http://www.cnblogs.com/flclain/archive/2012/12/22/2829317.html入门:数据挖掘入门的书籍,中文的大体有这些:JiaweiHan的《数据挖掘概念与技术》IanH.Witten/EibeFrank的《数据挖掘实用机器学习技术》TomMi...
分类:
其他好文 时间:
2014-07-22 23:11:53
阅读次数:
345
转载自:http://www.cnblogs.com/jilichuan/archive/2012/12/07/2807897.html【1】Yizhou
Sun(DM)UIUC,今年毕业,应该去美国的东北大学,在异构网络上做了很多工作。http://web.engr.illinois.edu/~s...
分类:
其他好文 时间:
2014-07-22 23:11:53
阅读次数:
261
听着the
mass,大气磅礴,心潮澎湃,不由得想写点什么。很长时间没有写写了,十分必要自己看看自己,变帅了还是变丑了。春天的北京,飘扬着柳絮,呼吸困难,心跳加速。还是先说正事。一、这几个月干了什么最主要的是完成了coursera上的几门课程:machine
learning, 机器学习基石, da...
分类:
其他好文 时间:
2014-07-22 23:08:32
阅读次数:
389
入门实例:一个购物车产品清单,可以自行改变数量,总价自动计算的小例子:代码如下: 1.1实例:购物车
your shopping cart {{item.title}} {{item.price|curren...
分类:
其他好文 时间:
2014-05-01 13:50:25
阅读次数:
346
AdviceforapplyingmachinelearningDeciding what
to try next
现在我们已学习了线性回归、逻辑回归、神经网络等机器学习算法,接下来我们要做的是高效地利用这些算法去解决实际问题,尽量不要把时间浪费在没有多大意义的尝试上,Advice
for appl...
分类:
移动开发 时间:
2014-04-29 12:11:47
阅读次数:
756
http://blog.csdn.net/v_july_v/article/details/7577684
分类:
其他好文 时间:
2014-04-29 11:23:47
阅读次数:
266
系列文章:数据挖掘算法之决策树算法 [QQ群:
189191838,对算法和C++感兴趣可以进来]
k-means算法可以说是数据挖掘中十大经典算法之一了,属于无监督的学习。该算法由此衍生出了很多类k-means算法,比如k中心点等等,在数据挖掘领域,很多地方都会用到该算法,他能够把相似...
分类:
其他好文 时间:
2014-04-29 10:26:46
阅读次数:
491
废话:和上一次的文章确实隔了太久,希望趁暑期打酱油的时间,将之前学习的东西深入理解一下,同时尝试用Python写相关的机器学习代码。一 PGM模型的分类
通过上一篇文章的介绍,相信大家对PGM的定义和大致应用场景有了粗略的了解。那么接下来我们来深入了解下PGM。首先要介绍的是Probabilist....
分类:
其他好文 时间:
2014-04-29 09:48:47
阅读次数:
457