码迷,mamicode.com
首页 > 其他好文 > 详细

mahout推荐10-尝试GroupLens数据集

时间:2014-08-04 14:14:47      阅读:476      评论:0      收藏:0      [点我收藏+]

标签:blog   http   java   使用   io   文件   数据   ar   

数据集下载地址:http://grouplens.org/datasets/movielens/ 之前用的是100K的,现在需要下载MovieLens 10M,使用里面的ratings.dat

前提:因为文件不符合mahout要求的文件输入格式,需要进行转换,但是example里提供了一个解析这个文件的类GrouplensDataModel,所以直接用了。

package mahout;

import java.io.File;

import org.apache.mahout.cf.taste.common.TasteException;
import org.apache.mahout.cf.taste.impl.eval.LoadEvaluator;
import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood;
import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender;
import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity;
import org.apache.mahout.cf.taste.model.DataModel;
import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood;
import org.apache.mahout.cf.taste.recommender.Recommender;
import org.apache.mahout.cf.taste.similarity.UserSimilarity;
import org.apache.mahout.cf.taste.similarity.precompute.example.GroupLensDataModel;

public class GroupLensDataModelTest {
 
	public static void main(String[] args) throws Exception {
		//使用定制的GrouplensDataModel,如果没有转换数据集成为csv格式的
		DataModel dataModel = new GroupLensDataModel(new File(
				"data/ratings.data"));
		//皮尔逊相关系数,衡量用户相似度
		UserSimilarity userSimilarity = new PearsonCorrelationSimilarity(
				dataModel);
		//构建用户邻居,100个
		UserNeighborhood userNeighborhood = new NearestNUserNeighborhood(100,
				userSimilarity, dataModel);
		//推荐引擎
		Recommender recommender = new GenericUserBasedRecommender(dataModel,
				userNeighborhood, userSimilarity);
		//运行
		LoadEvaluator.runLoad(recommender);
	}
}

 运行试试,如果你的内存足够大的话。

输出结果:

我的文件还没有下载下来呢!!!!!!!!!!

 

mahout推荐10-尝试GroupLens数据集,布布扣,bubuko.com

mahout推荐10-尝试GroupLens数据集

标签:blog   http   java   使用   io   文件   数据   ar   

原文地址:http://www.cnblogs.com/jsunday/p/3889947.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!