码迷,mamicode.com
首页 > 其他好文 > 详细

Jaccard相关系数和Tanimoto系数

时间:2020-01-30 17:22:37      阅读:215      评论:0      收藏:0      [点我收藏+]

标签:距离   com   code   img   相似度   位置   http   就会   ali   

Jaccard相关系数用来衡量两个集合的相关性,数值越大,相似度就越高。相对于Jaccard系数,Jaccard距离是用来衡量两个样本集合的差异性的。

Jaccard相关系数:

技术图片

 

Jaccard距离:

 技术图片

如果A,B集合中元素的取值为二值数(0,或者1,0代表此元素不在这个集合中,1代表此元素在这个集合中)那么Jaccard相关系数和Jaccard距离也可以这样求:

M11代表A,B集合中相同位置同为1的个数

M01 代表A集合中相同位置元素为0,而B集合为1的个数

M10代表A集合中相同位置元素为1,而B集合为0的个数

M00代表A,B集合中相同位置同为0的个数

因为在大多情况下 ,0的个数会大大多于1的个数,就会显得很稀疏,如果只考虑M11,则有:

s=M11/(M00+M10+M01+M11)  称为Jaccard距离

 

而Tanimoto系数又称为广义的Jaccard相关系数

技术图片

 

 A,B代表两个样本向量

 

 

Jaccard相关系数和Tanimoto系数

标签:距离   com   code   img   相似度   位置   http   就会   ali   

原文地址:https://www.cnblogs.com/Kevin-Heydn-Wong/p/12243046.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!