码迷,mamicode.com
首页 > 其他好文 > 详细

开源共享一个训练好的中文词向量(语料是维基百科的内容,大概1G多一点)

时间:2016-08-19 13:00:40      阅读:365      评论:0      收藏:0      [点我收藏+]

标签:

使用gensim的word2vec训练了一个词向量。

语料是1G多的维基百科,感觉词向量的质量还不错,共享出来,希望对大家有用。

下载地址是http://pan.baidu.com/s/1pLGlJ7d 密码:hw47

包含训练代码、使用词向量代码、词向量文件(3个文件)

 

技术分享

 

技术分享

 

因为机器内存足够,也没有分批训练。所以代码非常简单。也在共享文件里面,就不贴在这里了。

 

开源共享一个训练好的中文词向量(语料是维基百科的内容,大概1G多一点)

标签:

原文地址:http://www.cnblogs.com/Darwin2000/p/5786984.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!