聚类与分类聚类(clustering)是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述的过程。
在分类( classification )中,对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记出来。
聚类分析也称无监督学习, 因为和分类学习相比,聚类的样本没有标记,需要由聚类学习算法来自动确定。...
分类:
其他好文 时间:
2016-05-18 19:18:17
阅读次数:
291
这只是老师安排的一个实验,准备过程中遇到各种问题,现在贴出来供大家参考,是Andrew Ng参与的研究, 论文依据如下,第二篇是一篇相关的论文, Learning Feature Representations with K-means, Adam Coates and Andrew Y. Ng. ...
分类:
其他好文 时间:
2016-05-16 17:40:50
阅读次数:
227
9. Clustering Content 9. Clustering 9.1 Supervised Learning and Unsupervised Learning 9.2 K-means algorithm 9.3 Optimization objective 9.4 Random Init ...
分类:
其他好文 时间:
2016-05-15 02:09:58
阅读次数:
230
这题要仔细体会下哈希表的用法,要注意的是数组本身是无序的,因此需要向左右进行扩张。 另外这个思路可以进行聚类,把连续的标记为一类。 int longestConsecutive(const vector<int> &num) { unordered_map<int, bool> used; for ...
分类:
其他好文 时间:
2016-05-14 15:23:15
阅读次数:
166
参考文献
Mean Shift Clustering
Meanshift,聚类算法...
分类:
编程语言 时间:
2016-05-13 15:05:30
阅读次数:
351
1. 聚类:将拥有最相似属性的数据归为一类. K-means聚类: python调用格式:compacness, labels, centers = cv2.kmeans(data, K, criteria, bestLabels=None, attempts, flags, centers=Non ...
分类:
其他好文 时间:
2016-05-13 12:09:09
阅读次数:
114
python环境下的测试程序 import numpy as np import cv2 import matplotlib.pyplot as plt #in this example, we test Kmeans clutering algorithm under python. ''' #f ...
分类:
编程语言 时间:
2016-05-13 11:26:53
阅读次数:
308
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探 探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤 探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类 ...
分类:
其他好文 时间:
2016-05-13 10:20:29
阅读次数:
136
1.定义 :将数据分成多个类别,在同一个类内,对象(实体)之间具有较高的相似性,不同类对象之间的差异性较大。 对一批没有类别标签的样本集,按照样本之间的相似程度分类,相似的归为一类,不相似的归为其它类。这种分类称为聚类分析,也称为无监督分类。 2.结果取决于两个因素:第一个是任务的选择,同样的样本不 ...
分类:
其他好文 时间:
2016-05-13 07:42:30
阅读次数:
254
Amazon.com Recommendations Item-to-Item Collaborative Filtering个人感受:这篇论文首先介绍了历史上的三种算法:传统协同过滤、聚类、基于搜索的算法。第一种方法在计算效率、少量数据上表现欠佳;第二种方法准确率欠佳;第三种方法比较“简单”,因此提出了大量计算在线下的物品-物品的相似记录进行推荐。揣测一下作者的思路,计算量大是因为数据量大,但是...
分类:
其他好文 时间:
2016-05-13 02:44:59
阅读次数:
162