码迷,mamicode.com
首页 >  
搜索关键字:词向量    ( 222个结果
开源共享一个训练好的中文词向量(语料是维基百科的内容,大概1G多一点)
使用gensim的word2vec训练了一个词向量。 语料是1G多的维基百科,感觉词向量的质量还不错,共享出来,希望对大家有用。 下载地址是http://pan.baidu.com/s/1pLGlJ7d 密码:hw47 包含训练代码、使用词向量代码、词向量文件(3个文件) 因为机器内存足够,也没有分 ...
分类:其他好文   时间:2016-08-19 13:00:40    阅读次数:365
word2vec
本节课将开始学习Deep NLP的基础——词向量模型。 背景 word vector是一种在计算机中表达word meaning的方式。在Webster词典中,关于meaning有三种定义: the idea that is represented by a word, phrase, etc. t ...
分类:其他好文   时间:2016-08-02 01:07:01    阅读次数:303
如何产生好的词向量
如何产生好的词向量? 词向量、词嵌入(word vector,word embedding)也称分布式表示(distributed representation),想必任何一个做NLP的研究者都不陌生。如今词向量已经被广泛应用于各自NLP任务中,研究者们也提出了不少产生词向量的模型并开发成实用的工具 ...
分类:其他好文   时间:2016-06-26 11:38:24    阅读次数:786
Deep Learning(深度学习)之(九)词向量的内部任务评价和外部任务评价方法
关键词:内部任务评价(Intrinsic Evaluation)和 外部任务评价(extrinsic evaluations)。超参数影响下的类比评价任务。人类决策和词向量距离的相关性。结合上下文处理歧义。窗口分类。 这个课堂笔记我们将会对词向量(也就是词嵌入)的内部任务评价和外部任务评价方法进行讨论。主要的内容是单词类比(word analogies)技术,我们会把它当做内部任务评价的技术...
分类:其他好文   时间:2016-06-24 16:03:15    阅读次数:878
斯坦福cs224d(深度学习在自然语言处理上的应用)Lecture 2
这个课堂笔记我们将会对词向量(也就是词嵌入)的内部任务评价和外部任务评价方法进行讨论。主要的内容是单词类比(word analogies)技术,我们会把它当做内部任务评价的技术并展示其相关示例,它会在词向量的调谐(tune)中发挥重要作用。我们还会讨论如何训练模型的权重/参数,并关注用来进行外部任务评价的词向量。最后,我们会简单地介绍人工神经网络,它在自然语言处理中表现极好。...
分类:编程语言   时间:2016-06-13 01:21:37    阅读次数:355
深度学习与自然语言处理(2)_斯坦福cs224d Lecture 2
这个课堂笔记我们将会对词向量(也就是词嵌入)的内部任务评价和外部任务评价方法进行讨论。主要的内容是单词类比(word analogies)技术,我们会把它当做内部任务评价的技术并展示其相关示例,它会在词向量的调谐(tune)中发挥重要作用。我们还会讨论如何训练模型的权重/参数,并关注用来进行外部任务评价的词向量。最后,我们会简单地介绍人工神经网络,它在自然语言处理中表现极好。...
分类:编程语言   时间:2016-06-12 23:34:20    阅读次数:336
深度学习与自然语言处理(1)_斯坦福cs224d Lecture 1
这是本课程的第一节,我们会先介绍自然语言处理(NLP)的概念和NLP现在所面对问题;然后开始讨论用数学向量代表自然语言词组的设想。最后我们会讨论现行的词向量构造方法。...
分类:编程语言   时间:2016-06-02 18:25:39    阅读次数:715
Deep Learning in NLP (一)词向量和语言模型
http://licstar.net/archives/328 这篇博客是我看了半年的论文后,自己对 Deep Learning 在 NLP 领域中应用的理解和总结,在此分享。其中必然有局限性,欢迎各种交流,随便拍。 Deep Learning 算法已经在图像和音频领域取得了惊人的成果,但是在 NL ...
分类:编程语言   时间:2016-05-30 19:52:18    阅读次数:1099
【python gensim使用】word2vec词向量处理英文语料
word2vec介绍word2vec官网:https://code.google.com/p/word2vec/ word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 word2vec计算的是余弦值,距离范围为0-1之间,值越大代...
分类:编程语言   时间:2016-05-22 12:22:15    阅读次数:456
【python gensim使用】word2vec词向量处理中文语料
word2vec介绍word2vec官网:https://code.google.com/p/word2vec/ word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 word2vec计算的是余弦值,距离范围为0-1之间,值越大代...
分类:编程语言   时间:2016-05-22 12:21:15    阅读次数:647
222条   上一页 1 ... 18 19 20 21 22 23 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!