码迷,mamicode.com
首页 > 其他好文 > 详细

[转]基于Hbase的一个简单的商品推荐系统

时间:2019-07-29 09:17:38      阅读:99      评论:0      收藏:0      [点我收藏+]

标签:简单的   http   span   blog   设计   img   个人   架构   mic   

基于Hbase的一个简单的商品推荐系统 博客分类: 架构

纵观业界的电商网站,我站在一个用户的角度来看,商品推荐有很多种:

 

一种是通过我搜索、查看的那件商品的,系统统计出搜索、查看该商品的其他用户搜索、查看其他商品的次数,把排名靠前的推荐给我,当当的一个栗子:
我查看了《Hadoop 权威指南》,系统给我推荐了一堆其他的书:
 
技术图片

 

一种是通过我最近的搜索、查看过商品,系统给我推荐一些它认为我感兴趣的商品,淘宝的一个栗子:
技术图片

还有几种,感觉挺有意思的:
 
 
技术图片技术图片技术图片
特别是这个,搜索Hadoop 的用户,最终很多人都买了羽绒服,这是为什么呢?学习hadoop 的筒子们都很怕冷么?还是说,北方人居多?
 
技术图片


  1. 五花八门哈,别的不管了。只讨论下第一种,个人YY设计下:基于Hbase的一个简单的商品推荐系统。
  2. 撇开其他的流程不说,单就这个推荐而言,基于Hbase的设计,两张表就OK了。一张表user_item记录每个用户查看了的所有商品,item_user记录查看了某个商品的所有用户。
  3. user_item:userid作为行健,列簇和列为item:itemid,数据如下:
  4. user1    item:itemid    timestamp=1234567891, value=item1
  5. user1    item:itemid    timestamp=1234567892, value=item2
  6. user1    item:itemid    timestamp=1234567893, value=item3
  7. user2    item:itemid    timestamp=1234567894, value=item4
  8. user2    item:itemid    timestamp=1234567895, value=item5
  9. user3    item:itemid    timestamp=1234567881, value=item1
  10. user3    item:itemid    timestamp=1234567832, value=item2
  11. user4    item:itemid    timestamp=1234567843, value=item3
  12. user4    item:itemid    timestamp=1234567854, value=item4
  13. user4    item:itemid    timestamp=1234567895, value=item5
  14. ......
  15. item_user:itemid作为行健,列簇和列为:user:userid,数据如下:
  16. item1    user:userid    timestamp=1234567891, value=user1
  17. item1    user:userid    timestamp=1234567892, value=user2
  18. item1    user:userid    timestamp=1234567893, value=user4
  19. item2    user:userid    timestamp=1234567894, value=user3
  20. item3    user:userid    timestamp=1234567895, value=user2
  21. item3    user:userid    timestamp=1234567881, value=user4
  22. item6    user:userid    timestamp=1234567832, value=user5
  23. item6    user:userid    timestamp=1234567843, value=user6
  24. item8    user:userid    timestamp=1234567854, value=user5
  25. item8    user:userid    timestamp=1234567895, value=user4
  26. ......
  27. 大概的业务是:我查看《Hadoop权威指南》(item1)时,系统从item_user表中以item1作为行健查询出所有查看过item1的用户,再分别以各userid为行健,从user_item表中查询出所有查看过的商品,最后去重、统计、排序并显示。

 

http://f.dataguru.cn/thread-33415-1-1.html

[转]基于Hbase的一个简单的商品推荐系统

标签:简单的   http   span   blog   设计   img   个人   架构   mic   

原文地址:https://www.cnblogs.com/shujuxiong/p/11261840.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!