原文:(原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 顺序分析和聚类分析算法)前言
本篇文章继续我们的微软挖掘系列算法总结,前几篇文章已经将相关的主要算法做了详细的介绍,我为了展示方便,特地的整理了一个目录提纲篇:大数据时代:深入浅出微软数据挖掘算法总结连载,有兴趣的童...
分类:
数据库 时间:
2014-11-02 15:02:48
阅读次数:
293
原文:(原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 时序算法)前言
本篇文章同样是继续微软系列挖掘算法总结,前几篇主要是基于状态离散值或连续值进行推测和预测,所用的算法主要是三种:Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft N...
分类:
数据库 时间:
2014-11-02 15:02:05
阅读次数:
260
原文:(原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft Naive Bayes 算法)本篇文章主要是继续上两篇Microsoft决策树分析算法和Microsoft聚类分析算法后,采用另外更为简单一种分析算法对目标顾客群体的挖掘,同样的利用微软案例数据进行简要总结。有兴趣的...
分类:
数据库 时间:
2014-11-02 14:59:40
阅读次数:
348
原文:(原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 关联规则分析算法)前言
本篇继续我们的微软挖掘算法系列总结,前几篇我们分别介绍了:Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法、Microsoft...
分类:
数据库 时间:
2014-11-02 14:58:19
阅读次数:
257
阅读目的:理解quick shift,同时理解mean shift原理,mean shift用于图像聚类,优点是不需要指定聚类中心个数,缺点是计算量太大(原因)。mean shift主要用来寻找符合一些数据样本的模型,证明样本符合某一概率密度函数(PDF),是一种非参数迭代算法能够寻找模型和聚类。数...
分类:
其他好文 时间:
2014-10-31 23:38:54
阅读次数:
389
阅读导读:
1.什么是聚类分析?
2.Mahout中的kmeans算法,默认的分融符是什么?
3.用kmeans算法得到的结果有什么特点?
1.
聚类算法kmeans
聚类分析是数据挖掘及机器学习领域内的重点问题之一,在数据挖掘、模式识别、决策支持、机器学习及图像分割等领域有广泛的应用,是最重要的数据分析方法之一。聚类是在给定的数据集合中寻找同类的数据子集合,每一...
分类:
其他好文 时间:
2014-10-29 00:25:22
阅读次数:
359
给定训练集,想把这些样本分成不同的子集,即聚类,,但是这是个无标签数据集,也就是说我们再聚类的时候不能利用标签信息,所以这是一个无监督学习问题。k-means聚类算法的流程如下:1. 随机初始化聚类中心2. a. 对与每一个聚类中心,计算所有样本到该聚类中心的距离,然后选出距离该聚类中心最近的几个样...
分类:
编程语言 时间:
2014-10-28 20:02:27
阅读次数:
251
机器学习,作为门时髦、热门的计算机应用技术,特别是随着深度学习的流行,推动“大数据+深度模型”的模式,为人工智能和人机交互的发展提供巨大的空间。
和数据挖掘一样,利用大量的数据分析建立有效的模型以便提供分类或者决策支持,机器学习也是利用经典的算法(聚类,SVM,神经网络,深度学习等)建立数据模型,不同的是机器学习偏向于算法的设计;更直接的说,机器学习,就是一些建立模型进行数据分析的算法包...
分类:
其他好文 时间:
2014-10-28 09:22:49
阅读次数:
216
人生如戏!!!! 一、理论准备 输入:簇的数目k和包含n个对象的数据库。 输出:k个簇,使平方误差准则最小。 算法步骤: 1.为每个聚类确定一个初始聚类中心,这样就有K 个初始聚类中心。 2.将样本集中的样本按照最小距离原则分配到最邻近聚类 3.使用每个聚类中的样本均值作为新的聚类中心。 ...
分类:
编程语言 时间:
2014-10-27 17:32:33
阅读次数:
563
我接触过的大数据有:
1.美国棱镜计划
2.前几天新闻报道的,苹果公司窃取用户隐私
3.百度的用户搜素习惯统计分析
4.淘宝的用户购物习惯分析,智能推荐宝贝
5.浏览器的智能标签页
...
最想了解的大数据架构与算法:
1.著名的Google 网页排名算法:PageRank
2.著名的聚类算法:K-Means
7.CART
3.C4.5
4.k-Mea...
分类:
其他好文 时间:
2014-10-27 11:00:21
阅读次数:
214