数据挖掘系列(4)使用weka做关联规则挖掘weka Apriori算法实例操作详解用
WEKA 进行数据挖掘,第 1 部分: 简介和回归
分类:
其他好文 时间:
2014-06-01 12:22:01
阅读次数:
156
Apriori算法是数据挖掘中一种挖掘关联规则的频繁项集算法。其核心是基于两阶段频集思想的递推算法。
先来了解下关联规则挖掘:
发现事务数据库,关系数据, 或其它信息库中项或数据对象集合间的频繁模式。关联,相关,或因果关系结构。
频繁模式:在数据库中频繁出现的模式(项集, 序列, 等)。
动机是发现数据中的规律性。
如:
购物篮分析:哪些产品更经...
分类:
其他好文 时间:
2014-06-01 09:52:13
阅读次数:
245
所谓推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。
在推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。
一、基于内容推荐
基于内容的推荐(Content-based Recommendation)是信息过滤技术的延续与发展,它是建立在项目的内容信息上作出推荐的,而不需要...
分类:
Web程序 时间:
2014-06-01 09:41:45
阅读次数:
312
一、概念:微博中经常会有些词被一起提及,如:郭美美VS红会,表哥VS房叔;超市为提高销售额,会把用户经常买的物品放在一起。
a)Apriori算法: 频繁项集产生强关联规则: b)FP-树进行频繁模式挖掘: *Partition-based Projection: *比较:
分类:
其他好文 时间:
2014-05-29 07:58:22
阅读次数:
370
关联分析1) 关联模型的部分局限有哪些?
在关联模型中一般需要寻找频繁项集,这就有可能产生大量的候选集,需要重复扫描数据库并计算候选集中每个候选项集的支持度,无法对稀有的信息进行分析,开销大。2)
什么是关联系数? 如何解读? 相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差....
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。①
分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以...
分类:
其他好文 时间:
2014-05-15 07:40:07
阅读次数:
213
1.Apriori算法
如果一个事务中有X,则该事务中则很有可能有Y,写成关联规则
{X}→{Y}
将这种找出项目之间联系的方法叫做关联分析。关联分析中最有名的问题是购物蓝问题,在超市购物时,有一个奇特的现象——顾客在买完尿布之后通常会买啤酒,即{尿布}→{啤酒}。原来,妻子嘱咐丈夫回家的时候记得给孩子买尿布,丈夫买完尿布后通常会买自己喜欢的啤酒。
考虑到规则的合理性,...
分类:
其他好文 时间:
2014-05-07 23:58:32
阅读次数:
529
一、Apriori 算法概述
Apriori 算法是一种最有影响力的挖掘布尔关联规则的频繁项集的 算法,它是由Rakesh Agrawal 和RamakrishnanSkrikant 提出的。它使用一种称作逐层搜索的迭代方法,k- 项集用于探索(k+1)- 项集。首先,找出频繁 1- 项集的集合。该集合记作L1。L1 用于找频繁2- 项集的集合 L2,而L2 用于找L2,如此下去,直到不能找到 ...
分类:
其他好文 时间:
2014-05-01 17:50:47
阅读次数:
280