码迷,mamicode.com
首页 > 其他好文 > 详细

Mahout 常用相似度度量(笔记)

时间:2014-08-13 19:22:58      阅读:227      评论:0      收藏:0      [点我收藏+]

标签:style   blog   http   color   os   io   ar   html   

Mahout 基于推荐系统,分类,聚类算法 等经常用到的相似度度量:


PearsonCorrelationSimilarity 皮尔森距离


EuclideanDistanceSimilarity 欧几里德距离


CosineMeasureSimilarity   余弦距离(0.7变成了UncenteredCosineSimilarity


SpearmanCorrelationSimilarity 斯皮尔曼等级相关, 排序后的皮尔森距离


TanimotoCoefficientSimilarity 谷本相关系数, 基于boolean preference


LogLikelihoodSimilarity  最大似然估计 最大似然估计,也称为最大概似估计,是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。 一般好于TanimotoCoefficientSimilarity 


CityBlockSimilarity  基于曼哈顿距离


参考链接:mahout 推荐算法基础

本文出自 “流浪的脚步” 博客,请务必保留此出处http://now51jq.blog.51cto.com/3474143/1539515

Mahout 常用相似度度量(笔记),布布扣,bubuko.com

Mahout 常用相似度度量(笔记)

标签:style   blog   http   color   os   io   ar   html   

原文地址:http://now51jq.blog.51cto.com/3474143/1539515

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!