参考:从源代码剖析Mahout推荐引擎
前言:Mahout框架集成了大量的常用的机器学习算法,且都支持在Hadoop分布式环境下运行,很大程度上节约了数据处理的时间成本,其中的推荐算法引擎有cf.taste包实现,它提供了一套完整的推荐算法工具库,同时规范了数据结构,并标准了程序开发过程。
1:Mahout推荐算法介绍
2:单机内存算法实现
3:基于hadoop分布式...
分类:
编程语言 时间:
2016-04-01 18:43:15
阅读次数:
992
系统的深入学习的话避免不了阅读相关的papers 论文:ACM的RecSys,KDD,WWW,SIGIR等会议上都有相关的论文 书籍 推荐系统实践 (豆瓣) 推荐系统 (豆瓣) 机器学习实战 (豆瓣) 统计学习方法 (豆瓣) Recommender Systems Handbook (豆瓣)等 视频... ...
分类:
编程语言 时间:
2016-03-28 15:35:16
阅读次数:
447
在推荐系统众多方法中,基于用户的协同过滤推荐算法是最早诞生的,原理也较为简单。该算法1992年提出并用于邮件过滤系统,两年后1994年被 GroupLens 用于新闻过滤。一直到2000年,该算法都是推荐系统领域最著名的算法。 本文简单介绍基于用户的协同过滤算法思想以及原理,最后基于该算法实现园友的...
分类:
编程语言 时间:
2016-01-08 22:06:53
阅读次数:
458
(文/Joseph A. Konstan & John Riedl) 讲完了推荐算法是如何“猜你喜欢”的,现在,你对于每回上网购物时在线零售商是如何打量你,并努力把你的喜好和其他人的相匹配有了一个基本的概念。 推荐系统还有另外两大特点,也对你最终看到的推荐结果有着显著的影响:第一,在弄清楚你和其他购...
分类:
其他好文 时间:
2016-01-08 20:16:43
阅读次数:
158
推荐系统实践小结美团推荐算法实践推荐系统的坑TOP10开源的推荐系统简介大数据/数据挖掘/推荐系统/机器学习相关资源IBM developers 探索推荐引擎内部的秘密
分类:
其他好文 时间:
2015-12-30 13:36:59
阅读次数:
155
自己的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不同,比如数据挖掘/自然语言处理/机器学习算法工程师,或简称算法工程师,还有的称为搜索/推荐算法工程师,甚至有的并入后台工程师的范畴,视岗位具体要求而定。机器学习、大数据相关岗位的职责自己...
分类:
其他好文 时间:
2015-12-30 10:25:08
阅读次数:
192
前言推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用户很难从如此多的信息流中找到对自己有价值的信息。解决信息过载...
分类:
编程语言 时间:
2015-12-27 06:15:33
阅读次数:
340
原文:http://hijiangtao.github.io/2014/10/06/WeiboRecommendAlgorithm/基础及关联算法作用:为微博推荐挖掘必要的基础资源、解决推荐时的通用技术问题、完成必要的数据分析、为推荐业务提供指导。分词技术与核心词提取:是微博内容推荐的基础,用于将微...
分类:
编程语言 时间:
2015-12-13 21:51:32
阅读次数:
219
原文:http://closure.blog.ustc.edu.cn/?p=117阿里这次天猫推荐算法大赛题目的核心是给定用户对品牌的四个月的操作记录,预测下个月哪些用户对哪些品牌产生购买行为,这可以抽象为一个01分类问题,更确切的可以抽象为一个点击率预估(CTR)。与其说这是一次比赛,我觉得更多的...
分类:
编程语言 时间:
2015-11-30 20:28:40
阅读次数:
513
搜索引擎可以说目前所有互联网应用里技术含量最高的一种。尽管应用形式比较简单:用户输入查询词,搜索引擎返回搜索结果。但是,搜索引擎需要达到的目标:更全、更快、更准。如何让搜索结果更准确始终是搜索引擎的一大难题。 公司最近在开发某行业的垂直搜索引擎,我作为该项目组的核心成员主要是负责核心算法的研...
分类:
编程语言 时间:
2015-11-23 18:35:58
阅读次数:
180