协同过滤的实现 1、收集用户偏好及标准化处理 要从用户的行为和偏好中发现规律,并基于此给予推荐,如何收集用户的偏好信息成为系统推荐效果最基础的决定因素。用户有很多方式向系统提供自己的偏好信息,而且不同的应用也可能大不相同。 以上列举的用户行为都是比较通用的,推荐引擎设计人员可以根据自己应用的特点添加 ...
分类:
其他好文 时间:
2017-06-23 22:57:06
阅读次数:
212
在对数据进行了初步探索后,想必读者对MovieLens数据集有了感性认识。而在数据挖掘/推荐引擎运行前,往往需要对数据预处理。预处理的重要性不言而喻,甚至比数据挖掘/推荐系统本身还重要。 然而完整的数据预处理工作会涉及到:缺失值,异常值,口径统一,去重,特征提取等等等等,可以单写一本书了,本文无法一... ...
分类:
其他好文 时间:
2017-05-20 17:23:49
阅读次数:
289
推荐算法举个简单的例子,比如有个用户进来看了一堆内容,我们把他看的所有的历史行为,嵌入到推荐引擎当中去。这个推荐引擎就会生成个性化的频道,下次这个用户再登录,或者都不用下一次,过几分钟之后,他看到的内容就会根据他最近发生的历史行为发生变化,这就是推荐系统的基本逻辑。这种方法叫基于用户行为的推荐,当然 ...
分类:
编程语言 时间:
2017-05-07 13:03:05
阅读次数:
299
1.使用的是Spark-shell和Scala语言,同样需要把文件放在Hadoop文件系统中 启动Spark-shell ...
分类:
其他好文 时间:
2017-04-29 23:23:39
阅读次数:
141
常见的推荐引擎算法: simHash 算法:推荐算法—协同过滤;simHash原理 ...
分类:
其他好文 时间:
2017-04-24 10:00:36
阅读次数:
126
基于协同过滤的推荐引擎(理论部分)时隔十日,终于决心把它写出来。大多数实验都是3.29日做的,结合3.29日写的日记完成了这篇实战。数据集准备数据集使用上篇提到的Movielens电影评分数据里的ml...
分类:
其他好文 时间:
2017-04-16 11:29:00
阅读次数:
238
数加是什么 在阿里云的官网打开大数据部分(整个大数据部分统称为数加),其中包括:大数据基础服务部分,MaxCompute、ADS、流计算、大数据开发套件;人工智能部分,机器学习(基础平台是PAI)、语音识别、ET等;数据分析展现部分,数据可视化(大屏、BI报表)、I+关系网络分析(安全领域用的比较多 ...
分类:
其他好文 时间:
2017-03-28 21:31:11
阅读次数:
424
前言 IntelliJ IDEA 编译生成 Jar 包的方式与 Eclipse 不同,如何将此 Maven 构建 Java 推荐引擎项目生成 Jar 包确实搜索了不少资料,有成功的有失败的,特将此验证成功的方法记录下来分享给遇到此类问题的朋友。 开发环境 OS: Windows 8.1 JRE: 1 ...
分类:
其他好文 时间:
2017-02-22 21:10:32
阅读次数:
296
转自:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/index.html 本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法。 在现今的推荐技术和算法中, ...
分类:
编程语言 时间:
2017-01-17 16:11:03
阅读次数:
255
基于Spark ALS构建商品推荐引擎 一般来讲,推荐引擎试图对用户与某类物品之间的联系建模,其想法是预测人们可能喜好的物品并通过探索物品之间的联系来辅助这个过程,让用户能更快速、更准确的获得所需要的信息,提升用户的体验、参与度以及物品对用户的吸引力。 在开始之前,先了解一下推荐模型的分类: 1、基 ...
分类:
其他好文 时间:
2016-11-28 07:28:53
阅读次数:
387