标签:style blog http color os io ar html
Mahout 基于推荐系统,分类,聚类算法 等经常用到的相似度度量:
PearsonCorrelationSimilarity 皮尔森距离
EuclideanDistanceSimilarity 欧几里德距离
CosineMeasureSimilarity 余弦距离(0.7变成了UncenteredCosineSimilarity)
SpearmanCorrelationSimilarity 斯皮尔曼等级相关, 排序后的皮尔森距离
TanimotoCoefficientSimilarity 谷本相关系数, 基于boolean preference
LogLikelihoodSimilarity 最大似然估计 最大似然估计,也称为最大概似估计,是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。 一般好于TanimotoCoefficientSimilarity
CityBlockSimilarity 基于曼哈顿距离
参考链接:mahout 推荐算法基础
本文出自 “流浪的脚步” 博客,请务必保留此出处http://now51jq.blog.51cto.com/3474143/1539515
Mahout 常用相似度度量(笔记),布布扣,bubuko.com
标签:style blog http color os io ar html
原文地址:http://now51jq.blog.51cto.com/3474143/1539515