标签:blog java 使用 io 文件 数据 for ar
基于物品的推荐,是以物品的相似度为基础的。在mahout中意味着使用ItemSimilarity实现相似性度量,而不是UserSimilarity。他们分别是通过相似的用户和相似的物品。
基于物品的:了解用户的喜好,并寻找相似的物品
基于用户的:寻找相似的用户,并了解他们喜好什么。
如果物品数比用户数少很多的话,基于物品的推荐会带来性能的提升。
代码:
package mahout; import java.io.File; import java.util.List; import org.apache.mahout.cf.taste.impl.model.file.FileDataModel; import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood; import org.apache.mahout.cf.taste.impl.recommender.GenericItemBasedRecommender; import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender; import org.apache.mahout.cf.taste.model.DataModel; import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood; import org.apache.mahout.cf.taste.recommender.RecommendedItem; import org.apache.mahout.cf.taste.recommender.Recommender; import org.apache.mahout.cf.taste.similarity.ItemSimilarity; import org.apache.mahout.cf.taste.similarity.UserSimilarity; import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity; /** * 基于用户的推荐程序 * @author Administrator * */ public class RecommenderIntro { public static void main(String[] args) throws Exception { //装载数据文件,实现存储,并为计算提供所需的所有偏好,用户和物品数据 DataModel model = new FileDataModel(new File("data/intro.csv")); //用户相似度,给出两个用户的相似度,有多种度量方式,直接由用户的改为物品的即可 ItemSimilarity similarity = new PearsonCorrelationSimilarity(model); //用户邻居,与给定用户最相似的一组用户 // UserNeighborhood neighborhood = new NearestNUserNeighborhood(2, // similarity, model); // //推荐引擎,合并这些组件,实现推荐 // Recommender recommender = new GenericUserBasedRecommender(model, // neighborhood, similarity); //基于物品的推荐 Recommender recommender1 = new GenericItemBasedRecommender(model,similarity); //为用户1推荐一件物品1,1 List<RecommendedItem> recommendedItems = recommender1.recommend(1, 1); //输出 for (RecommendedItem item : recommendedItems) { System.out.println(item); } } }
为用户1推荐1件商品:
输出结果:
14/08/05 12:26:44 INFO file.FileDataModel: Creating FileDataModel for file data\intro.csv 14/08/05 12:26:44 INFO file.FileDataModel: Reading file info... 14/08/05 12:26:44 INFO file.FileDataModel: Read lines: 21 14/08/05 12:26:44 INFO model.GenericDataModel: Processed 5 users RecommendedItem[item:104, value:5.0]
对比基于用户的推荐,同时推荐了物品104.
mahout推荐13-基于物品的推荐,布布扣,bubuko.com
标签:blog java 使用 io 文件 数据 for ar
原文地址:http://www.cnblogs.com/jsunday/p/3892008.html