码迷,mamicode.com
首页 >  
搜索关键字:gensim    ( 87个结果
【python gensim使用】word2vec词向量处理中文语料
word2vec介绍word2vec官网:https://code.google.com/p/word2vec/ word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 word2vec计算的是余弦值,距离范围为0-1之间,值越大代...
分类:编程语言   时间:2016-05-22 12:21:15    阅读次数:647
Python与自然语言处理(二)基于Gensim的Word2Vec
Java调用NLPIC实现分词和标注工作,Python调用Word2Vec实现词向量相似度计算...
分类:编程语言   时间:2016-04-12 13:01:22    阅读次数:1329
NLPIR的语义分析系统
http://202.38.128.96:96/nlpir/#box-6里面Word2vec比较不错,Python的gensim库可以做来自为知笔记(Wiz)
分类:其他好文   时间:2015-08-10 01:53:23    阅读次数:283
我爱自然语言处理[转]
最近试了一下Word2Vec,GloVe以及对应的python版本gensim word2vec和python-glove,就有心在一个更大规模的语料上测试一下,自然而然维基百科的语料进入了视线。维基百科官方提供了一个很好的维基百科数据源:https://dumps.wikimedia.org,可以...
分类:编程语言   时间:2015-03-16 22:48:21    阅读次数:348
topic model - LDA 1
step1 : install gensim step 2 :将用字符串表示的文档转换为用id表示的文档向量: documents = ["Shipment of gold damaged in a fire", "Delivery of silver arrived in a silver truck", "Shipment of gold arrived in a truck"]...
分类:其他好文   时间:2014-12-24 21:34:10    阅读次数:246
nltk-构建和使用语料库-可用于小说的推荐-完整实例
步骤1:构建语料库: #!/usr/bin/env?python #-*-coding=utf-8-*- #数据源目录(二级目录) sourceDataDir=‘data‘ #数据源文件列表 fileLists?=?[] import?os from?gensim?import?corpora,?models,?s...
分类:其他好文   时间:2014-09-26 20:13:58    阅读次数:330
自然语言处理-感述
最近花了点时间学习nlp--实际只是学习使用nltk和伴随它出现的gensim。 ????也许nlp在国内普及的时间还不是很长,绝大多数资料都来自nltk和gensim的官网,国内最多的例子止于演示一下nltk分词/划分词性...
分类:其他好文   时间:2014-09-17 20:34:03    阅读次数:185
87条   上一页 1 ... 7 8 9
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!