1 数据描述
空白
sku1sku_1
sku2sku_2
…
skuNsku_{N} session1session_1
0
1
…
1
session2session_2
1
0
…
1
…
…
…
…
…
sessionMsession_M
1
1
0
0
2 向量相似度计算下面给出计算向量x,y...
分类:
编程语言 时间:
2015-08-19 16:59:23
阅读次数:
187
SVD推荐算法(一)
看了不少论文,总结起来用SVD做推荐主要有两种不同的方式。
1 本质上是memory-based,只不过先用SVD对user-item的评分矩阵做降维,得到降维后的user特征和item特征,可以分别做userbased的协同过滤和itembased的协同过滤。
2 本质上是model-based,跟传统数学意义的SVD没有太大关系,只不过借鉴了SV...
分类:
编程语言 时间:
2015-04-24 21:11:34
阅读次数:
243
mahout中map-reduce版的itembased推荐算法思想
最近想写一个map-reduce版的userbased,于是先研究mahout中已实现的itembased算法。itembased看起来简单,但是深入到实现细节还是有点复杂的,用map-reduce实现就更复杂了。
itembased的本质:
预测某用户user对某物品item的打分,
看看该用户对其他...
分类:
编程语言 时间:
2015-01-13 00:08:08
阅读次数:
202
maven打包hadoop项目(含第三方jar)
问题背景:
1 写map-reduce程序,用到第三方jar,怎么打包并提交项目到服务器执行。
2 mahout中itembased算法,将uid从string映射为long。
我这里实现的具体功能是:
Mahout的itembased算法的数据格式是:uid,vid,score。其中uid和vid必须是数字型(long),s...
分类:
编程语言 时间:
2014-12-25 01:29:52
阅读次数:
305
基于mahout的itembased算法
其实mahout分布式上只是实现了部分算法。比如推荐算法中Item-based和slopone都有hadoop实现和单机版实现,User-based没有分布式实现。
Mahout已实现的算法(单机版和分布式版)
https://mahout.apache.org/users/basics/algorithms.html
大多...
分类:
编程语言 时间:
2014-12-23 00:18:47
阅读次数:
230
基于item的推荐是常用并且高效的一种推荐方式,最重要的是它可以做实事推荐。...
分类:
编程语言 时间:
2014-10-11 14:41:25
阅读次数:
337