码迷,mamicode.com
首页 > 其他好文 > 详细

gensim加载word2vec训练结果(bin文件)并进行相似度实验

时间:2017-05-31 12:10:24      阅读:798      评论:0      收藏:0      [点我收藏+]

标签:import   mil   sim   blog   similar   word2vec   each   code   for   

# -*- coding: utf-8 -*-  
import gensim  

# 导入模型
model = gensim.models.KeyedVectors.load_word2vec_format(vectors.bin, binary=True)

# 得到两组词的相似度
list1 = [u核能]
list2 = [u电能]
list3 = [u电力]
list_sim1 =  model.n_similarity(list1, list2)
print list_sim1
list_sim2 = model.n_similarity(list2, list3)
print list_sim2, \n

# 得到一组词中最无关的词
list4 = [u汽车, u火车, u飞机, u北京]
print model.doesnt_match(list4)
print \n

# 得到与一个词最相关的若干词及相似程度
result = model.most_similar(u脱水工艺)
for each in result:
    print each[0] , each[1]

 

gensim加载word2vec训练结果(bin文件)并进行相似度实验

标签:import   mil   sim   blog   similar   word2vec   each   code   for   

原文地址:http://www.cnblogs.com/zhangtianyuan/p/6922955.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!