码迷,mamicode.com
首页 > 其他好文 > 详细

关联规则

时间:2015-05-27 13:40:34      阅读:180      评论:0      收藏:0      [点我收藏+]

标签:

1、背景

  1993年,Agrawal提出了关联规则(Association Rule)问题,旨在发现顾客购货篮内商品间令人感兴趣的关系。

   “啤酒和尿布” 沃尔玛利用NCR数据挖掘工具意外的发现:跟尿布一起购买最多的商品竟是啤酒!

  今天,关联规则已广泛应用于金融、营销以及生物信息学等领域。

2、概念

  1)基本概念:

    项集:一个或多个项目的集合。 例如: {Milk, Bread, Diaper} ,包含k 个项目的项集称为k-项集

    绝对支持度 (技术分享):某一项集出现的次数。 比如 技术分享({Milk, Bread,Diaper}) = 2

    相对支持度(s): 包含某一项集的事务在全体事务中的比例。比如. s({Milk, Bread, Diaper}) = 2/5

    频繁项集: 支持度不小于给定最小支持度阈值(minsup)的项集

  2)关联规则

    (1)关联规则:寻找给定的数据集中项目之间令人感兴趣的关系

        技术分享

      形如 X 技术分享 Y的蕴涵式, 其中 X 和Y是项集,且X技术分享Y=技术分享。 比如: {Milk, Diaper}技术分享 {Beer}

   3)规则评价参数

      支持度 (s) 同时包含X和Y的事务占全部事务的百分比

      可信度 (c) 包含项集X的事务中也包含Y的百分比

        技术分享

   4)关联规则挖掘的一般流程    

    • 找出满足最小支持度阈值的所有频繁项集。
    • 由频繁项集产生满足最小可信度阈值的强关联规则。
    • 这两步中,第二步较容易。关联规则挖掘的总体性能由第一步决定。

3、算法

3.1Apriori

    

      

   

关联规则

标签:

原文地址:http://www.cnblogs.com/chamie/p/4533090.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!