作为一个推荐系统业余爱好者,在机器学习领域的鄙视链中,我感觉一直地位不高,时常被搞NLP CV语音等高科技技术的朋友鄙视。最近甚至被人问,推荐算法开源包多如牛毛,我们为什么还要专门的推荐算法工程师?(难道想要辞退我!?惊)不得不说,我想吐槽这个观点很久了。事实上搞推荐的工作不等于 import IB...
分类:
编程语言 时间:
2015-01-08 19:46:17
阅读次数:
421
“We are leaving the age of information and entering the age of recommendation” — Chris Anderson in The Long Tail。我们正在远离信息,而进入推荐时代。——克里斯·安德森 在介绍微博推荐算法....
分类:
编程语言 时间:
2015-01-04 13:24:10
阅读次数:
248
基于物品的协同过滤算法(ItemCF)是业界应用最多的算法,主要思想是利用用户之前有过的行为,给用户推荐和之前物品类似的物品。基于物品的协同过滤算法主要分为两步:1)计算物品之间的相似度。2)依据物品的相似度和用户的历史行为给用户生成推荐列表。第一步的关键点在于计算物品之间的相似度,这里并不採用基于...
分类:
编程语言 时间:
2014-12-26 09:32:42
阅读次数:
218
本文引自http://blog.csdn.net/dustinsea/article/details/17394615在设计实现推荐系统,选择推荐算法时, 肯定会考虑协同过滤(CF)的使用,而CF中经常使用的两种方法包括: neighbour-based方法和因式分解。 作为一个搜索推荐系统,百度关...
分类:
其他好文 时间:
2014-12-23 16:54:33
阅读次数:
330
基于mahout的itembased算法
其实mahout分布式上只是实现了部分算法。比如推荐算法中Item-based和slopone都有hadoop实现和单机版实现,User-based没有分布式实现。
Mahout已实现的算法(单机版和分布式版)
https://mahout.apache.org/users/basics/algorithms.html
大多...
分类:
编程语言 时间:
2014-12-23 00:18:47
阅读次数:
230
专业既然是机器学习,那工作肯定也是继续和数据打交道,那么问题来了,很多时候推荐算法和数据挖掘算法都是现成可用的,平台初建,重点还在数据过滤和抽取,怎样高效的抽取数据?
利用往常算法比赛中常用的字符串处理方法吗,omg,维护它是一个淡淡疼的忧伤。
那么,重点来了,正则表达式,干净利落。
模版如下:
//step1,set reg string
String r...
分类:
编程语言 时间:
2014-12-19 00:41:32
阅读次数:
265
郑昀 基于刘金鑫文档 最后更新于2014/12/1 关键词: recsys 、推荐评测、Evaluation of Recommender System、piwik、flume、kafka、storm、redis、mysql 本文档适用人员:研发 ? 推荐系统可不仅仅是围着推荐算法...
分类:
其他好文 时间:
2014-12-17 16:38:41
阅读次数:
458
转自:http://zengzhaozheng.blog.51cto.com/8219051/1557054一、概述这2个月研究根据用户标签情况对用户的相似度进行评估,其中涉及一些推荐算法知识,在这段时间研究了一遍《推荐算法实践》和《Mahout in action》,在这里主要是根据这两本书的一些...
分类:
编程语言 时间:
2014-12-15 17:15:03
阅读次数:
542
不知道是不是坑,因为你还没跳进去,我是一只new bee,不知道中国专利的水有多深。
分类:
编程语言 时间:
2014-12-09 17:17:33
阅读次数:
222
mahout入门指南之mahout单机版推荐算法
鄙人最近在研究mahout,网上找了一些入门资料来看,发现都整理的比较乱。折腾了一番,终于搞清楚了。为了让新手们较快入门,决定总结分享一下,写此入门指南。
mahout是什么?
mahout是一个机器学习库,里面实现了一些算法,比如推荐算法,聚类算法。
实现方式有单机内存版,也有分布式(hadoop和spark)。...
分类:
编程语言 时间:
2014-12-06 15:26:15
阅读次数:
368