标签:blog java 使用 io 文件 数据 for ar
基于物品的推荐,是以物品的相似度为基础的。在mahout中意味着使用ItemSimilarity实现相似性度量,而不是UserSimilarity。他们分别是通过相似的用户和相似的物品。
基于物品的:了解用户的喜好,并寻找相似的物品
基于用户的:寻找相似的用户,并了解他们喜好什么。
如果物品数比用户数少很多的话,基于物品的推荐会带来性能的提升。
代码:
package mahout;
import java.io.File;
import java.util.List;
import org.apache.mahout.cf.taste.impl.model.file.FileDataModel;
import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood;
import org.apache.mahout.cf.taste.impl.recommender.GenericItemBasedRecommender;
import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender;
import org.apache.mahout.cf.taste.model.DataModel;
import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood;
import org.apache.mahout.cf.taste.recommender.RecommendedItem;
import org.apache.mahout.cf.taste.recommender.Recommender;
import org.apache.mahout.cf.taste.similarity.ItemSimilarity;
import org.apache.mahout.cf.taste.similarity.UserSimilarity;
import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity;
/**
* 基于用户的推荐程序
* @author Administrator
*
*/
public class RecommenderIntro {
public static void main(String[] args) throws Exception {
//装载数据文件,实现存储,并为计算提供所需的所有偏好,用户和物品数据
DataModel model = new FileDataModel(new File("data/intro.csv"));
//用户相似度,给出两个用户的相似度,有多种度量方式,直接由用户的改为物品的即可
ItemSimilarity similarity = new PearsonCorrelationSimilarity(model);
//用户邻居,与给定用户最相似的一组用户
// UserNeighborhood neighborhood = new NearestNUserNeighborhood(2,
// similarity, model);
// //推荐引擎,合并这些组件,实现推荐
// Recommender recommender = new GenericUserBasedRecommender(model,
// neighborhood, similarity);
//基于物品的推荐
Recommender recommender1 = new GenericItemBasedRecommender(model,similarity);
//为用户1推荐一件物品1,1
List<RecommendedItem> recommendedItems = recommender1.recommend(1, 1);
//输出
for (RecommendedItem item : recommendedItems) {
System.out.println(item);
}
}
}
为用户1推荐1件商品:
输出结果:
14/08/05 12:26:44 INFO file.FileDataModel: Creating FileDataModel for file data\intro.csv 14/08/05 12:26:44 INFO file.FileDataModel: Reading file info... 14/08/05 12:26:44 INFO file.FileDataModel: Read lines: 21 14/08/05 12:26:44 INFO model.GenericDataModel: Processed 5 users RecommendedItem[item:104, value:5.0]
对比基于用户的推荐,同时推荐了物品104.
mahout推荐13-基于物品的推荐,布布扣,bubuko.com
标签:blog java 使用 io 文件 数据 for ar
原文地址:http://www.cnblogs.com/jsunday/p/3892008.html