码迷,mamicode.com
首页 >  
搜索关键字:fp-tree    ( 28个结果
FP-Growth 频繁项集挖掘
FP-Tree算法FPTree算法:在不生成候选项的情况下,完成Apriori算法的功能。FP-Tree:就是上面的那棵树,是把事务数据表中的各个事务数据项按照支持度排序后,把每个事务中的数据项按降序依次插入到一棵以NULL为根结点的树中,同时在每个结点处记录该结点出现的支持度。条件模式基:包含FP...
分类:其他好文   时间:2015-06-08 23:03:59    阅读次数:175
不产生候选集的关联规则挖掘算法FP-Tree
上篇博客讲述了Apriori算法的思想和java实现,http://blog.csdn.net/u010498696/article/details/45641719 Apriori算法是经典的关联规则算法,但是如上篇博客所述,它也有两个致命的性能瓶颈,一个是频繁集自连接产生候选集这一步骤中可能产生大量的候选集;另一个是从候选集得到频繁项集需要重复扫描数据库。 2000年,Han等提出了一个称为...
分类:编程语言   时间:2015-05-18 16:48:00    阅读次数:199
PFP(Parallel FPGrowth)
分布式FP-tree1.首先还是对购物篮数据进行排序,计数,假设min_sup=3.去掉支持度小于3的项。2.按照fp-tree的画法,对第二列整理过的项建树,fcamp,fcabm,fb,cbp,fcamp,建立fp-tree如下:3.第三列是从右向左遍历第二列,得到至某点的路径,例如,到p的路径...
分类:其他好文   时间:2015-04-22 23:44:39    阅读次数:293
CBA算法---基于关联规则进行分类的算法
更多数据挖掘算法:https://github.com/linyiqun/DataMiningAlgorithm 介绍 CBA算法全称是Classification base of Association,就是基于关联规则进行分类的算法,说到关联规则,我们就会想到Apriori和FP-Tree算法都是关联规则挖掘算法,而CBA算法正是利用了Apriori挖掘出的关联规则,然后做分类判断,所以在...
分类:编程语言   时间:2015-02-15 09:31:02    阅读次数:317
FP-Tree频繁模式树算法
参考资料:http://blog.csdn.net/sealyao/article/details/6460578 更多数据挖掘算法:https://github.com/linyiqun/DataMiningAlgorithm 介绍 FP-Tree算法全称是FrequentPattern Tree算法,就是频繁模式树算法,他与Apriori算法一样也是用来挖掘频繁项集的,不过不同的是,FP...
分类:编程语言   时间:2015-01-29 09:40:29    阅读次数:534
FP_Growth算法原理及实现
FP_Gwoth算法是一种不生成候选集从而寻找频繁项集的算法,主要基于树结构:包含一个一棵FP_Tree和一个项头表,每个项通过一个结点链指向它在树中出现的位置。基本结构如下所示。需要注意的是项头表需要按照支持度递减排序,在FP_Tree(有后缀的也成条件FP_Tree)中高支持度的节点只能是低支持度节点的祖先节点。这样一来可以保证尽可能的共用祖先节点,更重要的是保证正确性。...
分类:编程语言   时间:2014-12-08 19:38:23    阅读次数:306
FP-tree算法实现
支持度和置信度 严格地说Apriori和FP-Tree都是寻找频繁项集的算法,频繁项集就是所谓的“支持度”比较高的项集,下面解释一下支持度和置信度的概念。 设事务数据库为: A  E  F  G A  F  G A  B  ...
分类:编程语言   时间:2014-11-01 23:21:27    阅读次数:415
Mahout源码分析:并行化FP-Growth算法
FP-Growth是一种常被用来进行关联分析,挖掘频繁项的算法。与Aprior算法相比,FP-Growth算法采用前缀树的形式来表征数据,减少了扫描事务数据库的次数,通过递归地生成条件FP-tree来挖掘频繁项。参考资料[1]详细分析了这一过程。事实上,面对大数据量时,FP-Growth算法生成.....
分类:其他好文   时间:2014-09-13 15:46:05    阅读次数:406
28条   上一页 1 2 3
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!