在做分类时常常需要估算不同样本之间的相似性度量(Similarity
Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。
本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼....
分类:
其他好文 时间:
2014-07-22 23:15:15
阅读次数:
302
转载自:http://www.cnblogs.com/flclain/archive/2012/12/22/2829317.html入门:数据挖掘入门的书籍,中文的大体有这些:JiaweiHan的《数据挖掘概念与技术》IanH.Witten/EibeFrank的《数据挖掘实用机器学习技术》TomMi...
分类:
其他好文 时间:
2014-07-22 23:11:53
阅读次数:
345
转载自:http://www.cnblogs.com/jilichuan/archive/2012/12/07/2807897.html【1】Yizhou
Sun(DM)UIUC,今年毕业,应该去美国的东北大学,在异构网络上做了很多工作。http://web.engr.illinois.edu/~s...
分类:
其他好文 时间:
2014-07-22 23:11:53
阅读次数:
261
听着the
mass,大气磅礴,心潮澎湃,不由得想写点什么。很长时间没有写写了,十分必要自己看看自己,变帅了还是变丑了。春天的北京,飘扬着柳絮,呼吸困难,心跳加速。还是先说正事。一、这几个月干了什么最主要的是完成了coursera上的几门课程:machine
learning, 机器学习基石, da...
分类:
其他好文 时间:
2014-07-22 23:08:32
阅读次数:
389
ps:作为目前人工智能和数据库领域研究的热点问题,数据挖掘从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘(Data
Mining,DM),又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研...
分类:
其他好文 时间:
2014-05-01 06:55:40
阅读次数:
254
(转载请注明出处:http://blog.csdn.net/buptgshengod)
1.背景
以前我在外面公司实习的时候,一个大神跟我说过,学计算机就是要一个一个贝叶斯公式的套用来套用去。嗯,现在终于用到了。朴素贝叶斯分类器据说是好多扫黄软件使用的算法,贝叶斯公式也比较简单,大学做概率题经常会用到。核心思想就是找出特征值对结果影响概率最大的项。公式如下:...
分类:
编程语言 时间:
2014-04-29 13:15:21
阅读次数:
297
AdviceforapplyingmachinelearningDeciding what
to try next
现在我们已学习了线性回归、逻辑回归、神经网络等机器学习算法,接下来我们要做的是高效地利用这些算法去解决实际问题,尽量不要把时间浪费在没有多大意义的尝试上,Advice
for appl...
分类:
移动开发 时间:
2014-04-29 12:11:47
阅读次数:
756
http://blog.csdn.net/v_july_v/article/details/7577684
分类:
其他好文 时间:
2014-04-29 11:23:47
阅读次数:
266