推荐系统的分类
常见评测标准
http://blog.csdn.net/u011263983/article/details/51544495
相似度
1)同现相似度
2)欧氏距离相似度
3)余弦相似度
4)秩相关系数相似度
5)曼哈顿距离相似度
6)对数似然相似度
常见推荐系统算法
关联规则;
Apriori...
分类:
其他好文 时间:
2016-06-02 14:35:55
阅读次数:
2915
自己的一点点领悟,可能会有点小错误,欢迎交流^_^获得频繁项集主要思想python代码def loadDataSet():
return [[1,3,4],[2,3,5],[1,2,3,5],[2,5]]createC1(dataSet)获得所有第一层的所有项集def createC1(dataSet):
C1 = []
for transaction in dataSet:...
分类:
编程语言 时间:
2016-05-12 21:15:33
阅读次数:
251
1:关联分析
2:Apriori算法和FP-growth算法原理
3:使用Apriori算法发现频繁项集
4:使用FP-growth高效发现频繁项集
5:实例:从新闻站点点击流中挖掘新闻报道
以下程序用到的源代码下载地址:GitHub
一:关联分析
1:相关概念
关联分析(association analysis):从大规模数据集中寻找商品的隐含关系
项集 (itemse...
分类:
编程语言 时间:
2016-05-12 20:32:57
阅读次数:
10759
APRIORI Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。而且算法已经被广泛的应用到商业、网络安全等各个领域。 Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来 ...
分类:
编程语言 时间:
2016-05-11 23:49:57
阅读次数:
275
数据挖掘:关联规则挖掘 关联规则挖掘:Apriori算法 提高Apriori的效率 基于散列的算法基于FP tree的算法 ...
分类:
编程语言 时间:
2016-04-23 22:38:41
阅读次数:
563
上一章学习了非监督学习的聚类,聚类算法可以将不同性质的分类分开。这两天学习了apriori算法进行关联分析,感觉是目前最难理解的一章了,并且书中还有个很坑爹的错误,作者存在很大的疏忽。
Apriori算法关联分析:从大规模数据集中寻找物品间的隐含关系被称作关联分析或者关联规则学习。
关联分析应用1:我们以前学习的是根据特性进行分类或者回归预测,并没有挖掘特性之间的关系,关联分析可以用于分析数据...
分类:
编程语言 时间:
2016-04-17 23:02:44
阅读次数:
655
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, N ...
分类:
编程语言 时间:
2016-04-17 19:16:08
阅读次数:
241
一:背景 http://www.cnblogs.com/aijianiula/p/5397857.html 上节中,总结了频繁项集挖掘的最基本算法:Apriori算法。这篇文章写下它的改进算法FGrowth算法,记得这个算法是香港一位教师提出来的,其思想非常值得借鉴和思考。 二:FGrowth FP ...
分类:
编程语言 时间:
2016-04-16 13:46:48
阅读次数:
401
一:背景介绍 最近在公司用spark的平台做了一个购物车的推荐,用到的算法主要是FGrowth算法,它是Apriori算法的升级版,算法的主要目的是找出频繁进行一起购买的商品。本文主要介绍两个算法的背景,触及到公司的推荐具体流程,这里就不介绍了。 二:Apriori Apriori算法是挖掘频繁项的 ...
分类:
编程语言 时间:
2016-04-16 12:25:25
阅读次数:
150