标签:apriori算法 概念 ide 置信度 port 集中 子集 相关 集合
í一、概念
1、支持度support:数据集中A、B同时出现的频率,即 P(AB) = Freq(AB) / N
2、置信度confidence:在A出现的条件下,B出现的频率,即 置信度P(A->B) = Freq(AB) / Freq(A)
3、提升度lift:left = 支持度(AB) / 支持度(A) * 支持度(B)
注:提升度反应了关联规则中的A与B的相关性,提升都>1 且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性。
例如:A和B的关联规则的支持度是0.2,A出现的支持度是0.3,B出现的支持度是0.5,则提升度是 1.33>1,表明 ”A -> B“ 规则对于B的出现有提升效果
4、频繁项集:满足最小支持度要求的项集。
5、关联规则:表示两个物品之间,存在很强的关系
6、性质:
a、如果某个项集是频繁的,那么它的所有子集也是频繁的
b、如果某个项集是非频繁的,那么它的所有超集也是非频繁的
c、Apriori算法从单元素项集开始,通过满足最小支持度的项集来形成更大的集合
标签:apriori算法 概念 ide 置信度 port 集中 子集 相关 集合
原文地址:https://www.cnblogs.com/stacey999999/p/12073603.html