码迷,mamicode.com
首页 >  
搜索关键字:关联规则    ( 229个结果
使用Apriori算法进行关联分析
关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式:频繁项集或者关联规则。频繁项集是指经常出现在一块的物品的集合,关联规则暗示两种物品之间可能存在很强的关系。一个项集的支持度被定义为数据集中包含该项集的记录所占的比例。可信度或置信度是针对一条诸如{尿布}->{葡萄酒}的关联规则...
分类:编程语言   时间:2015-04-21 17:28:47    阅读次数:156
数据挖掘算法总结
一、关联规则挖掘 1、 Apriori算法 (1)Apriori算法原理 Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该集合记做L1,然后利用L1找频繁2项集的集合L2,L2找L3,如此下去,直到不能再找到任何频繁k项集。最后再在所有的频繁集中找出强规则,即产生用户感兴趣的关联规...
分类:编程语言   时间:2015-04-21 00:26:32    阅读次数:376
R关联规则分析之Arules包详解
Arules包详解 包基本信息 发布日期:2014-12-07 题目:挖掘关联规则和频繁项集 描述:提供了一个表达、处理、分析事务数据和模式(频繁项集合关联规则)的基本框架。 URL:http://R-Forge.R-project.org/projects/arules/,http://lyle....
分类:其他好文   时间:2015-04-15 16:59:41    阅读次数:260
数据挖掘—关联规则理论介绍与R实现
Apriori algorithm是关联规则里一项基本算法。是由Rakesh Agrawal和Ramakrishnan Srikant两位博士在1994年提出的关联规则挖掘算法。关联规则的目的就是在一个数据集中找出项与项之间的关系,也被称为购物蓝分析 (Market Basket analysis)...
分类:其他好文   时间:2015-04-13 18:37:09    阅读次数:118
基于关联规则的电子商务智能推荐服务--实例讲解
学习目标了解网站如何记录用户的访问数据,深入了解在网站如何根据用户的历史访问数据进行关联规则分析,解决网页智能推荐问题,同时在访问数据中提取用户的访问特征,对用户群体进行划分,针对不同用户群进行推荐。课程目标:了解网站如何记录用户的访问数据,深入了解网站如何根据用户的历史访问数据进行关联规则分析,解...
分类:其他好文   时间:2015-04-10 17:34:21    阅读次数:291
推荐算法注意事项总结
本文总结了多种推荐场景中的注意事项,或者推荐中比较关键的因素,不涉及算法描述,仅仅说明关注点,仅供参考。 推荐算法有很多种,从算法的角度来说,我认为主要由以下几种:协同过滤系列(基于item和user),机器学习分类系列(喜欢和不喜欢二分类,或者回归中的分值代表喜欢程度),矩阵分解系列(mahout ALS算法,netflix举行推荐大赛获奖算法),关联规则(电商常用)。本文将从以上几种系列进行总结。...
分类:编程语言   时间:2015-04-03 17:31:18    阅读次数:251
浅谈数据挖掘中的关联规则挖掘
浅谈数据挖掘中的关联规则挖掘 数据挖掘是指以某种方式分析数据源,从中发现一些潜在的有用的信息,所以数据挖掘又称作知识发现,而关联规则挖掘则是数据挖掘中的一个很重要的 课题,顾名思义,它是从数据背后发现事物之间可能存在的关联或者联系。举个最简单的例子,比如通过调查商场里顾客买的东西发现,30%的顾客....
分类:其他好文   时间:2015-03-28 17:03:52    阅读次数:145
HotSpot关联规则算法(2)-- 挖掘连续型和离散型数据
本篇代码可在 下载。前篇《HotSpot关联规则算法(1)-- 挖掘离散型数据》分析了离散型数据的HotSpot关联规则,本篇分析离散型和连续型数据的HotSpot关联规则挖掘。1. 首先看下数据格式(txt文档):@attribute outlook {sunny, overcast, rainy} @attribute temperature numeric @attribute humidi...
分类:编程语言   时间:2015-03-15 00:48:30    阅读次数:239
【读书笔记-数据挖掘概念与技术】挖掘频繁模式、关联和相关性:基本概念和方法
频繁模式:频繁出现的模式(可以是项集、子序列或子结构) 基本概念 支持度:support 置信度:confidence 关联规则:association 找出所有的频繁项集:出现次数≥最小支持计数 由频繁项集产生强关联的规则(定义最小支持度和最小置信度) 频度(支持度计数):出现的次数 频繁项集:项...
分类:其他好文   时间:2015-03-12 00:42:58    阅读次数:156
HotSpot关联规则算法(1)-- 挖掘离散型数据
提到关联规则算法,一般会想到Apriori或者FP,一般很少有想到HotSpot的,这个算法不知道是应用少还是我查资料的手段太low了,在网上只找到很少的内容,这篇http://wiki.pentaho.com/display/DATAMINING/HotSpot+Segmentation-Profiling ,大概分析了一点,其他好像就没怎么看到了。比较好用的算法类软件,如weka,其里面已经包...
分类:编程语言   时间:2015-03-10 19:22:52    阅读次数:202
229条   上一页 1 ... 17 18 19 20 21 ... 23 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!