鉴于DBSCAN算法对输入参数,领域半径E和阈值M比较敏感,在参数调优时比较麻烦,因此本文对另一种基于密度的聚类算法OPTICS(Ordering Points To Identify the Clustering Structure)展开研究,其为DBSCAN的改进算法,与DBSCAN相比,该算法...
分类:
其他好文 时间:
2015-11-09 20:39:59
阅读次数:
312
鉴于基于划分的文本聚类方法只能识别球形的聚类,因此本文对基于密度的文本聚类算法展开研究。DBSCAN是一种典型的基于密度的聚类方法,可以找出形状不规则的聚类,而且聚类时无需事先知道聚类的个数。
分类:
数据库 时间:
2015-11-09 18:46:18
阅读次数:
272
Part3文本聚类分类和聚类算法,都是数据挖掘中最常接触到的算法,分类聚类算法分别有很多种。可以看下下面两篇文章对常见的分类聚类算法的简介:分类算法:http://blog.csdn.net/chl033/article/details/5204220聚类算法:http://blog.chinaun...
分类:
编程语言 时间:
2015-11-09 13:56:14
阅读次数:
1365
在文本相似度判定中,作者将该算法用于文本聚类中,其核心思想通过比较两个文本向量中元素的相似度,即向量中所含的元素相似个数越多,则两个向量越相似,继而上述文本越相似。作者在短文本相似判定中采用了余弦相似度该算法来实现,本文借鉴数学集合取交集,借用现有组件来实现上述算法功能,继而减少工作量,也具备便捷性...
分类:
其他好文 时间:
2015-10-25 12:03:30
阅读次数:
292
1.物流管理系统2.Android天气预报和日程管理3.宠物交易4.粒子群优化5.文本聚类软件设计与实现 FCM+Kmeans + TFIDF6.遗传算法优化Kmeans7.遗传算法优化资源调度8.仿今日头条的个性化推荐APP+后台9.银行信贷系统10.博客系统QQ:在博客右侧
分类:
编程语言 时间:
2015-10-22 15:42:52
阅读次数:
156
本文实现基于SVD奇异矩阵分解的PCA主成分分析,使用该算法来完成对人脸图像的识别,主要讲解SVD实现PCA的原理,如何利用SVD实现图像特征的降维,以及SVD在文本聚类方面的使用,例如弱化同义词、多...
分类:
其他好文 时间:
2015-10-04 01:39:04
阅读次数:
331
结合之前对TF-IDF算法的分析,本文采用python对算法加以实现,并结合k-means算法实现简单的文本聚类。
分类:
编程语言 时间:
2015-09-21 01:20:14
阅读次数:
242
Part4文本分类Part3文本聚类提到过。与聚类分类的简单差异。那么,我们需要理清训练集的分类,有明白分类的文本;測试集,能够就用训练集来替代。预測集,就是未分类的文本。是分类方法最后的应用实现。1. 数据准备训练集准备是一个非常繁琐的功能,临时没发现什么省力的办法,依据文本内容去手动整理。这里还...
分类:
编程语言 时间:
2015-09-10 13:05:44
阅读次数:
1664
聚类分析初探第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题发表在 Science 上的一种新聚类算法 本文摘自中国科学院计算技术研究所周昭涛的硕士论文《文本聚类分析效果评价及文本表示研究》的.....
分类:
其他好文 时间:
2015-08-16 13:32:56
阅读次数:
200
前言:
本系列是在作者学习《机器学习系统设计》([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理,到特征工程,再到模型选择,把机器学习解决问题的过程一一呈现。书中设计的源代码和数据集已上传到我的资源:http://download.csdn.net/detail/solomon1558/8971649
第3章通过词袋模型+K均值聚类实现相关文...
分类:
其他好文 时间:
2015-08-15 16:38:33
阅读次数:
283