码迷,mamicode.com
首页 >  
搜索关键字:word2vec    ( 309个结果
词表示模型(二):基于神经网络的模型:NPLM;word2vec(CBOW/Skip-gram)
本文简述了以下内容: 神经概率语言模型NPLM word2vec:CBOW / Skip-gram,直接以得到词表示为目标的模型(加速策略将在下篇文介绍) 神经概率语言模型NPLM 近年来,基于神经网络来得到词表示的模型备受青睐。这类模型所得到的词的向量表示是分布式表示distributed rep ...
分类:其他好文   时间:2016-08-24 17:22:36    阅读次数:272
开源共享一个训练好的中文词向量(语料是维基百科的内容,大概1G多一点)
使用gensim的word2vec训练了一个词向量。 语料是1G多的维基百科,感觉词向量的质量还不错,共享出来,希望对大家有用。 下载地址是http://pan.baidu.com/s/1pLGlJ7d 密码:hw47 包含训练代码、使用词向量代码、词向量文件(3个文件) 因为机器内存足够,也没有分 ...
分类:其他好文   时间:2016-08-19 13:00:40    阅读次数:365
利用word2vec对关键词进行聚类
1、收集预料 自己写个爬虫去收集网页上的数据。 使用别人提供好的数据http://www.sogou.com/labs/dl/ca.html 2、对预料进行去噪和分词 我们需要content其中的值,通过简单的命令把非content 的标签干掉 cat news_tensite_xml.dat | ...
分类:其他好文   时间:2016-08-07 16:51:08    阅读次数:154
(Deep) Neural Networks (Deep Learning) , NLP and Text Mining
(Deep) Neural Networks (Deep Learning) , NLP and Text Mining 最近翻了一下关于Deep Learning 或者 普通的Neural Network在NLP以及Text Mining方面应用的文章,包括Word2Vec等,然后将key ide ...
分类:Web程序   时间:2016-08-06 15:54:23    阅读次数:432
word2vec
本节课将开始学习Deep NLP的基础——词向量模型。 背景 word vector是一种在计算机中表达word meaning的方式。在Webster词典中,关于meaning有三种定义: the idea that is represented by a word, phrase, etc. t ...
分类:其他好文   时间:2016-08-02 01:07:01    阅读次数:303
LSTM学习和总结1
长短期记忆网络LSTM(Long Short Term Memory)本身不是一个完整的模型,主要是对RNN隐含层的改进。因此,RNN网络即使用LSTM单元的RNN网络。LSTM非常适合用于处理与时间序列高度相关的问题,例如机器翻译、对话生成、编码解码、图文转换等。 说明:word2vec(CBOW ...
分类:其他好文   时间:2016-07-20 19:16:27    阅读次数:245
Paragraph Vector在Gensim和Tensorflow上的编写以及应用
上一期讨论了Tensorflow以及Gensim的Word2Vec模型的建设以及对比。这一期,我们来看一看Mikolov的另一个模型,即Paragraph Vector模型。目前,Mikolov以及Bengio的最新论文Ensemble of Generative and Discriminativ ...
分类:其他好文   时间:2016-05-30 01:05:17    阅读次数:2325
word2vec安装以及使用
一、安装 我使用的是在linux环境下运行的,所以首先去下载linux环境模拟器,下载的是cygwin因为要使用make命令工具,所以安装时要选中Devel与utils模块,默认安装没有安装make命令工具。记住一定要选中这两个模块,不然没有make命令工具没法运行makefile。 二、作用 我知 ...
分类:其他好文   时间:2016-05-25 00:22:17    阅读次数:346
【python gensim使用】word2vec词向量处理英文语料
word2vec介绍word2vec官网:https://code.google.com/p/word2vec/ word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 word2vec计算的是余弦值,距离范围为0-1之间,值越大代...
分类:编程语言   时间:2016-05-22 12:22:15    阅读次数:456
【python gensim使用】word2vec词向量处理中文语料
word2vec介绍word2vec官网:https://code.google.com/p/word2vec/ word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 word2vec计算的是余弦值,距离范围为0-1之间,值越大代...
分类:编程语言   时间:2016-05-22 12:21:15    阅读次数:647
309条   上一页 1 ... 24 25 26 27 28 ... 31 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!