码迷,mamicode.com
首页 > 编程语言 > 详细

【算法】Cosine similarity

时间:2014-12-12 16:12:17      阅读:173      评论:0      收藏:0      [点我收藏+]

标签:style   blog   http   ar   os   sp   on   2014   log   

cosine similarity

sent A: 我喜欢看电视,不喜欢看电影

sent B: 我不喜欢看电视,也不喜欢看电影

 

step1: segment

sent A: 我 喜欢 看 电视 不 喜欢 看 电影

sent B: 我 不 喜欢 看 电视,也 不 喜欢 看 电影

 

step2: TF(TF * IDF)

sent A:我 1,喜欢 2,看 2,电视 1,电影 1,不 1,也 0。

sent B:我 1,喜欢 2,看 2,电视 1,电影 1,不 2,也 1。

 

step3: vector

sent A:[1, 2, 2, 1, 1, 1, 0]

sent B:[1, 2, 2, 1, 1, 2, 1]

 

step4: calculate

 bubuko.com,布布扣

 

【算法】Cosine similarity

标签:style   blog   http   ar   os   sp   on   2014   log   

原文地址:http://www.cnblogs.com/ariesblogs/p/4159771.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!