标签:集合 mamicode 无法 das ack 可见 次数 width font
1.项集和支持度计数
① 在关联分析中,包含0或多个项的集合叫做项集,有几个项就是几-项集,如有一个项,就是1-项集。空集是不包含任何项的项集
例:{啤酒,尿布,牛奶} 这是一个3-项集
② 支持度计数(σ):项集在事务中出现的次数
例:(由表可见,事务数为5)
σ{面包}:4
σ{啤酒,尿布}:3
2.关联规则(支持度,置信度)
关联规则是形如X?Y的蕴含表达式,其中X和Y是不相交的项集。关联规则的强度可以用它的支持度(s)和置信度(c)度量
s(X?Y) = σ {X,Y} / 总的事务数
c(X?Y) = σ {X,Y} / σ{X}
例:(图1.1)中
s(啤酒?尿布) = 3/5
c(啤酒?尿布) = 3/3
1.规则产生的两大步骤
① 频繁项集的产生–生成其支持度≥minsup的所有项集
②规则的产生–从每个频繁项集生成高置信度规则(忽略前件或后件为空的规则)
2.实例学习(接图1.2中的结果)
解题:规则的产生就是从每个频繁项集生成高置信度规则,图中详解了{B,C,E}项集产生的规则,
继续把所有频繁项集的规则列出,得出全部的满足置信度阈值的全部规则即可解题成功。
数据挖掘关联分析中Apriori算法理解(非算法应用)-ylance
标签:集合 mamicode 无法 das ack 可见 次数 width font
原文地址:https://www.cnblogs.com/ylance/p/12743634.html