机器学习
数据挖掘
分类
聚类
关联
预测
神经网络
算法
云计算...
分类:
其他好文 时间:
2015-08-21 21:31:15
阅读次数:
311
聚类算法有以下几类:一 层次方法层次方法创建给定数据对象集的层次分解。根据层次的分解的形成方式,层次的方法又可以分为凝聚和分裂方法。凝聚法:自底向上。开始将每个对象形成单独的组,然后层次合并相似的组,直到所有的组合合并成一个或者满足某个终止条件。分裂法:自顶向下。开始将所有对象置于一个簇中,每次迭代...
分类:
编程语言 时间:
2015-08-20 22:14:13
阅读次数:
223
1.聚类分析1.0 概念聚类分析简称聚类(clustering),是一个把数据集划分成子集的过程,每一个子集是一个簇(cluster),使得簇中的样本彼此相似,但与其他簇中的样本不相似。聚类分析不需要事先知道样本的类别,甚至不用知道类别个数,因此它是一种无监督的学习算法,一般用于数据探索,比如群组发现和离群点检测,还可以作为其他算法的预处理步骤。下面的动图展示的是一个聚类过程,感受一下:1.1 基本...
分类:
编程语言 时间:
2015-08-20 21:01:33
阅读次数:
1993
针对于FCM算法在很大程度上局限于处理球星星团数据的不足,本文通过引入核方法对FCM算法进行优化。
分类:
其他好文 时间:
2015-08-20 01:22:29
阅读次数:
502
原文作者:http://blog.chinaunix.net/uid-10289334-id-3758310.html(本文转自网上,具体出处忘了是哪里的,好像是上海一位女士在网上的博文,此处转载,用以备查,请原作者见谅)聚类算法总结:--------------------------------...
分类:
其他好文 时间:
2015-08-20 01:08:16
阅读次数:
200
此项目是在《Hadoop Web项目--Friend Find系统基础》之上整理Mahout0.10版本中MR程序的调用测试而成,重点演示如何调用Mahout0.10的MR算法、如何把MR算法嵌入到Web项目中,附带数据生成及数据查看、MR 任务监控等功能。里面含有了常用工具类、聚类算法、分推荐算法等的MR调用mahout命令以及其对应的实现类。...
分类:
编程语言 时间:
2015-08-18 19:24:57
阅读次数:
333
稀疏矩阵处理方法:(1) 数据平滑技术,如设定缺省值,将为评分项设为平均分或众数,回归填补法,随机填补法;聚类平滑技术,将未评分项使用聚类中心的数据经行填充。(2) 降维技术,主成分分析( PCA)和奇异值分解(SVD)(3)对已有相似度计算模型进行局部加权处理。如基于时间的加权,基于共现次数的线性...
分类:
其他好文 时间:
2015-08-16 19:33:54
阅读次数:
195
聚类分析初探第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题发表在 Science 上的一种新聚类算法 本文摘自中国科学院计算技术研究所周昭涛的硕士论文《文本聚类分析效果评价及文本表示研究》的.....
分类:
其他好文 时间:
2015-08-16 13:32:56
阅读次数:
200
一小时了解数据挖掘⑤数据挖掘步骤&常用的聚类、决策树和CRISP-DM概念接前面系列4篇:一小时了解数据挖掘①:解析常见的大数据应用案例一小时了解数据挖掘②:分类算法的应用和成熟案例解析一小时了解数据挖掘③:详解大数据挖掘の分类技术一小时了解数据挖掘④:商务智能原理解读の数据挖掘九大定律数据挖掘有很...
分类:
其他好文 时间:
2015-08-16 12:13:26
阅读次数:
190
前言:
本系列是在作者学习《机器学习系统设计》([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理,到特征工程,再到模型选择,把机器学习解决问题的过程一一呈现。书中设计的源代码和数据集已上传到我的资源:http://download.csdn.net/detail/solomon1558/8971649
第3章通过词袋模型+K均值聚类实现相关文...
分类:
其他好文 时间:
2015-08-15 16:38:33
阅读次数:
283