在做分类时常常需要估算不同样本之间的相似性度量(Similarity
Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。
本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼....
分类:
其他好文 时间:
2014-07-22 23:15:15
阅读次数:
302
转载自:http://www.cnblogs.com/flclain/archive/2012/12/22/2829317.html入门:数据挖掘入门的书籍,中文的大体有这些:JiaweiHan的《数据挖掘概念与技术》IanH.Witten/EibeFrank的《数据挖掘实用机器学习技术》TomMi...
分类:
其他好文 时间:
2014-07-22 23:11:53
阅读次数:
345
转载自:http://www.cnblogs.com/jilichuan/archive/2012/12/07/2807897.html【1】Yizhou
Sun(DM)UIUC,今年毕业,应该去美国的东北大学,在异构网络上做了很多工作。http://web.engr.illinois.edu/~s...
分类:
其他好文 时间:
2014-07-22 23:11:53
阅读次数:
261
听着the
mass,大气磅礴,心潮澎湃,不由得想写点什么。很长时间没有写写了,十分必要自己看看自己,变帅了还是变丑了。春天的北京,飘扬着柳絮,呼吸困难,心跳加速。还是先说正事。一、这几个月干了什么最主要的是完成了coursera上的几门课程:machine
learning, 机器学习基石, da...
分类:
其他好文 时间:
2014-07-22 23:08:32
阅读次数:
389
ps:作为目前人工智能和数据库领域研究的热点问题,数据挖掘从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘(Data
Mining,DM),又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研...
分类:
其他好文 时间:
2014-05-01 06:55:40
阅读次数:
254
http://blog.csdn.net/zhouyong0/article/details/8281192/*references:感谢资源分享者。info:简单记录如何通过工具从源码生成类图,便于分析代码结构,对源码阅读挺有用。*/看点开源代码学习下,本想找个代码查看方便点的工具,便于理清代码层...
分类:
其他好文 时间:
2014-04-30 23:54:39
阅读次数:
551
我是2013.04.01左右的时候开始准备找工作的,找工作的时候自己有些迷茫:1.不知道想要从事什么方向的工作;2.不知道要去哪里工作。
于是我在网上搜了很多的面经,另外找了几本书看了下,后来决定了以下几个方向:1.图像、视觉;2.分布式计算或存储;3.机器学习;4.北美求职。
虽然上面列了这么多条,但是这些方向的面试都会有算法面试,所以我首先就开始了算法的练习,在这里我推荐几个不错的网站:1...
分类:
其他好文 时间:
2014-04-29 13:34:22
阅读次数:
274
(转载请注明出处:http://blog.csdn.net/buptgshengod)
1.背景
以前我在外面公司实习的时候,一个大神跟我说过,学计算机就是要一个一个贝叶斯公式的套用来套用去。嗯,现在终于用到了。朴素贝叶斯分类器据说是好多扫黄软件使用的算法,贝叶斯公式也比较简单,大学做概率题经常会用到。核心思想就是找出特征值对结果影响概率最大的项。公式如下:...
分类:
编程语言 时间:
2014-04-29 13:15:21
阅读次数:
297