标签:算法 文档 项目 方法 过程 集合 sp 参数
聚类:
是否可以将事物归为一个簇,完全取决于我们在考量它们之间相似性时所选择的特征参数。
聚类,就是将一个给定文档中的相似项目分成不同簇的过程,我们可以将这些簇看做一组簇内相似而簇间有别的项目的集合。
1、一个算法,将书组织在一起的方法
2、相似性和不相似性的概念
3、停止的条件
簇的中心点为簇的中心,或平均值(mean,average).
mahout聚类1,布布扣,bubuko.com
mahout聚类1
原文地址:http://www.cnblogs.com/jsunday/p/3890353.html