推荐系统,主要采用对历史数据的分析计算,得到某种模型,对未来的数据进行预测。说到底,还是分类问题。
Mahout,是一个可扩展的机器学习库,可用于单机,也可用于Hadoop。
Mahout的API非常简单,实现一个推荐功能只需要如下的几行代码:
DataModel model = new FileDataModel(new File(file));//建立数据模型 UserSimilarity similarity = new PearsonCorrelationSimilarity(model);//计算皮尔逊相似度 UserNeighborhood neighborhood = new NearestNUserNeighborhood(25, similarity, model);//计算N近邻用户 Recommender recommender = new GenericUserBasedRecommender(model, neighborhood, similarity);//基于用户的推荐 list = recommender.recommend(userid, size);其数据格式也很简单,只需要如下格式的数据
userid, itemid, preference value
这是我用Mahout实现的简单的在线电影推荐系统:http://movierecommender.sinaapp.com/
使用了movielens-100k的数据集.
项目源码在此:https://github.com/laozhaokun/movie_recommender
目前速度还很慢,不很稳定。
原文地址:http://blog.csdn.net/laozhaokun/article/details/30974851