大数据领域每年都会涌现出大量新的技术,成为大数据获取、存储、处理分析或可视化的有效手段。大数据技术能够将大规模数据中隐藏的信息和知识挖掘出来,为人类社会经济活动提供依据,提高各个领域的运行效率,甚至整个社会经济的集约化程度。正是由于大数据技术展现的优势 ,让越来越多的人选择进入到大数据行业,那么对于 ...
分类:
其他好文 时间:
2019-05-18 13:44:48
阅读次数:
110
(1)电商大数据项目-推荐系统实战http://blog.51cto.com/6989066/2325073(七)推荐系统常用算法协同过滤算法协同过滤算法(CollaborativeFiltering:CF)是很常用的一种算法,在很多电商网站上都有用到。CF算法包括基于用户的CF(User-basedCF)和基于物品的CF(Item-basedCF)。(八)ApacheMahout和SparkML
分类:
编程语言 时间:
2018-12-05 00:24:09
阅读次数:
339
电商大数据项目-推荐系统实战(一)环境搭建以及日志,人口,商品分析http://blog.51cto.com/6989066/2325073电商大数据项目-推荐系统实战之推荐算法http://blog.51cto.com/6989066/2326209五、实时分析TopIP(实时分析Top用户)一)模块介绍电商网站运营中,需要分析网站访问排名前N的IP,主要用来审计是否有异常IP,同时对网站运营情
分类:
其他好文 时间:
2018-12-05 00:15:06
阅读次数:
400
本项目是基于Spark MLLib的大数据电商推荐系统项目,使用了scala语言和java语言。基于python语言的推荐系统项目会另外写一篇博客。在阅读本博客以前,需要有以下基础:1.linux的基本命令2.至少有高中及以上的数学基础。3.至少有java se基础,会scala语言和Java
EE更佳(Jave EE非必需,但是可以帮助你更快理解项目的架构)。4.有github账户,并且至少知道git clone,fork,branch的概念。5。有网络基础,至少知道服务器端和客户端的区别。6.有大数据基础,最好会Hadoop,HDFS,MapReduce,Sqoop,HBase,Hive,Spark,Storm。7.有mysql数据库基础,至少会最基本的增删改查。
分类:
其他好文 时间:
2018-12-03 20:00:55
阅读次数:
697
一、冷启动问题介绍 如何在没有大量用户数据的情况下设计个性化推荐系统并让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。 用户冷启动:如何给新用户做个性化推荐 物品冷启动:如何将新物品推荐给可能对其感兴趣的用户。在新闻网站等时效性很强的网站中非常重要。 系统冷启动:如何在一个新开发的网站上设 ...
分类:
其他好文 时间:
2018-11-10 12:40:02
阅读次数:
247
大数据,云计算,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战视频教程 ...
分类:
其他好文 时间:
2018-09-08 19:01:03
阅读次数:
179
推荐系统架构,推荐系统由品类平台,素材、特征召回平台、模型计算打分服务,排序服务构成。 将请求封装成QueryInfo对象,通过对象来向下完成一步步数据召回。首先是通过QueryInfo对象召回品类、分类信息。 前边有人问到是怎样实现通用化?好问题,当时答得不太好,现在梳理总结一下,分类平台通过配置 ...
分类:
其他好文 时间:
2018-01-21 14:45:27
阅读次数:
229
好早的时候就打算写这篇文章,可是还是參加阿里大数据竞赛的第一季三月份的时候实验就完毕了。硬生生是拖到了十一假期。自己也是醉了。。。找工作不是非常顺利,希望写点东西回想一下知识。然后再攒点人品吧,仅仅能如此了。 一、问题背景 二、基于用户的协同过滤算法介绍 三、数据结构和实验过程设计 四、代码 一、问 ...
分类:
编程语言 时间:
2017-06-05 22:10:06
阅读次数:
312
推荐系统实战
这周看了推荐系统实战这本书,其中基本上介绍的比较全面,但是每一部分并没有十分深入,深入的精华全部都在下方的备注当中,备注中有很多的论文,可以进行进一步的学习。
首先回顾一下一些框架信息,在专门思考其中几个重要的部分:
3种联系用户和item的推荐方式:
1 根据用户的历史行为,表达过反馈的item进行item的预测,传统的itemCF
2 根据用户的历史...
分类:
其他好文 时间:
2015-07-06 00:02:43
阅读次数:
567
好早的时候就打算写这篇文章,但是还是参加阿里大数据竞赛的第一季三月份的时候实验就完成了,硬生生是拖到了十一假期,自己也是醉了。。。找工作不是很顺利,希望写点东西回顾一下知识,然后再攒点人品吧,只能如此了。
一、问题背景
二、基于用户的协同过滤算法介绍
三、数据结构和实验过程设计
四、代码...
分类:
编程语言 时间:
2014-10-03 21:50:45
阅读次数:
281