本节课将开始学习Deep NLP的基础——词向量模型。 背景 word vector是一种在计算机中表达word meaning的方式。在Webster词典中,关于meaning有三种定义: the idea that is represented by a word, phrase, etc. t ...
分类:
其他好文 时间:
2016-08-02 01:07:01
阅读次数:
303
长短期记忆网络LSTM(Long Short Term Memory)本身不是一个完整的模型,主要是对RNN隐含层的改进。因此,RNN网络即使用LSTM单元的RNN网络。LSTM非常适合用于处理与时间序列高度相关的问题,例如机器翻译、对话生成、编码解码、图文转换等。 说明:word2vec(CBOW ...
分类:
其他好文 时间:
2016-07-20 19:16:27
阅读次数:
245
如何产生好的词向量? 词向量、词嵌入(word vector,word embedding)也称分布式表示(distributed representation),想必任何一个做NLP的研究者都不陌生。如今词向量已经被广泛应用于各自NLP任务中,研究者们也提出了不少产生词向量的模型并开发成实用的工具 ...
分类:
其他好文 时间:
2016-06-26 11:38:24
阅读次数:
786
关键词:内部任务评价(Intrinsic Evaluation)和 外部任务评价(extrinsic evaluations)。超参数影响下的类比评价任务。人类决策和词向量距离的相关性。结合上下文处理歧义。窗口分类。
这个课堂笔记我们将会对词向量(也就是词嵌入)的内部任务评价和外部任务评价方法进行讨论。主要的内容是单词类比(word analogies)技术,我们会把它当做内部任务评价的技术...
分类:
其他好文 时间:
2016-06-24 16:03:15
阅读次数:
878
这个课堂笔记我们将会对词向量(也就是词嵌入)的内部任务评价和外部任务评价方法进行讨论。主要的内容是单词类比(word analogies)技术,我们会把它当做内部任务评价的技术并展示其相关示例,它会在词向量的调谐(tune)中发挥重要作用。我们还会讨论如何训练模型的权重/参数,并关注用来进行外部任务评价的词向量。最后,我们会简单地介绍人工神经网络,它在自然语言处理中表现极好。...
分类:
编程语言 时间:
2016-06-13 01:21:37
阅读次数:
355
这个课堂笔记我们将会对词向量(也就是词嵌入)的内部任务评价和外部任务评价方法进行讨论。主要的内容是单词类比(word analogies)技术,我们会把它当做内部任务评价的技术并展示其相关示例,它会在词向量的调谐(tune)中发挥重要作用。我们还会讨论如何训练模型的权重/参数,并关注用来进行外部任务评价的词向量。最后,我们会简单地介绍人工神经网络,它在自然语言处理中表现极好。...
分类:
编程语言 时间:
2016-06-12 23:34:20
阅读次数:
336
这是本课程的第一节,我们会先介绍自然语言处理(NLP)的概念和NLP现在所面对问题;然后开始讨论用数学向量代表自然语言词组的设想。最后我们会讨论现行的词向量构造方法。...
分类:
编程语言 时间:
2016-06-02 18:25:39
阅读次数:
715
http://licstar.net/archives/328 这篇博客是我看了半年的论文后,自己对 Deep Learning 在 NLP 领域中应用的理解和总结,在此分享。其中必然有局限性,欢迎各种交流,随便拍。 Deep Learning 算法已经在图像和音频领域取得了惊人的成果,但是在 NL ...
分类:
编程语言 时间:
2016-05-30 19:52:18
阅读次数:
1099
上一期讨论了Tensorflow以及Gensim的Word2Vec模型的建设以及对比。这一期,我们来看一看Mikolov的另一个模型,即Paragraph Vector模型。目前,Mikolov以及Bengio的最新论文Ensemble of Generative and Discriminativ ...
分类:
其他好文 时间:
2016-05-30 01:05:17
阅读次数:
2325
一、安装 我使用的是在linux环境下运行的,所以首先去下载linux环境模拟器,下载的是cygwin因为要使用make命令工具,所以安装时要选中Devel与utils模块,默认安装没有安装make命令工具。记住一定要选中这两个模块,不然没有make命令工具没法运行makefile。 二、作用 我知 ...
分类:
其他好文 时间:
2016-05-25 00:22:17
阅读次数:
346