码迷,mamicode.com
首页 > 编程语言 > 详细

FP-TREE 算法,频繁项集与关联规则分析

时间:2016-03-30 19:22:49      阅读:298      评论:0      收藏:0      [点我收藏+]

标签:

使用场景如:

用户频道属性分析 、用户忠诚度分析 、用户偏好路径分析、 用户偏好终端分析、 用户访问网站时间分析、 用户浏览内容分析

 

例子:一用户某次访问网站的路径示意图

                   技术分享

ABCD    ABEGH    ABEGW   AOU   AOV

Apriori算法

技术分享 技术分享

        需要扫描多个事物数据集,增加IO开销。会产生2的k次方频繁项集。

 

FP-Tree算法

概念: 树 链 节点 节点的前向路径 单支 多支 条件基

技术分享

技术分享

 


若Tree为单支,则输出整条单支和条件基BASE,支持度为单支中所有节点支持度的最小值。
 

  1. 若Tree为多支,先输出项表头HEAD中每项与条件基BASE的组合。然后,对于项表头中的每一项,取出该项在Tree中的所有前向路径,每条路径的基础支持度为该项的支持度。
  2. M条路径共M行数据,将这M行数据重新生成Tree,返回算法步骤-3中的1。

 

技术分享

技术分享

技术分享


技术分享 

 

 

--->流程参考

FP-TREE 算法,频繁项集与关联规则分析

标签:

原文地址:http://www.cnblogs.com/icyy/p/5338360.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!