20017-2018年本书作者Christopher D. Manning 在Bytedance演讲时指出的NLP研究趋势: (1) word2vec -> GloVe词向量 (2) MT问题:SMT->NMT,biLSTM+attention (3) text_summary: first 3 s ...
分类:
编程语言 时间:
2018-11-14 19:47:11
阅读次数:
138
(一)软件功能 实现两个功能:根据主题生成歌词和辅助写歌词 根据用户给定的主题生成一段歌词,歌词表达要流畅,语句通顺,押韵 提供相关的词语和句子供用户选择,使用户在帮助下完成歌词创作 核心模型 主题生成首句模型 相似度计算 + 基于SIF加权的word2vec模型 首句生成整段歌词模型 基本的Seq ...
分类:
其他好文 时间:
2018-11-13 02:56:19
阅读次数:
311
word2vec介绍 word2vec官网:https://code.google.com/p/word2vec/ word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空 ...
分类:
其他好文 时间:
2018-11-05 22:24:57
阅读次数:
852
Wording Embedding 1. word2vec 基于只含有一个隐层的神经网络,隐层的节点数就是embedding的维度。并提出了CBOW和Skip Grams这两种语言模型。并针对词典过大而导致计算softmax分母复杂度太高的问题提出了Hierarchical Softmax和 Neg ...
分类:
编程语言 时间:
2018-11-03 11:21:45
阅读次数:
162
测试文件在result下面, 1、word2vec还需要丰富训练数据,去噪音,加入博客,新增加预处理的方法。 2、建立评估准确率和召回率的机制 3、去除停用词是不是去多了,增加原文打印的结果 4、原文521条,最终应跑出(521*520)/2对 ...
分类:
编程语言 时间:
2018-11-01 11:50:18
阅读次数:
127
1.“句向量”简介word2vec提供了高质量的词向量,并在一些任务中表现良好。 关于word2vec的原理可以参考这几篇论文: https://arxiv.org/pdf/1310.4546.pdfhttps://arxiv.org/pdf/1301.3781.pdf关于如何使用第三方库gensi ...
分类:
其他好文 时间:
2018-10-31 10:35:15
阅读次数:
177
1.有DNN做的word2vec,取隐藏层到softmax层的权重为词向量,softmax层的叶子节点数为词汇表大小 2-3的最开始的词向量是随机初始化的 2.哈夫曼树:左边走 sigmoid(当前节点的词向量*当前节点的参数) 右边走 1-sigmoid(当前节点的词向量*当前节点的参数),叶子节 ...
分类:
其他好文 时间:
2018-10-25 19:28:13
阅读次数:
186
一直以来感觉好多地方都吧Word Embedding和word2vec混起来一起说,所以导致对这俩的区别不是很清楚。 其实简单说来就是word embedding包含了word2vec,word2vec是word embedding的一种,将词用向量表示。 1.最简单的word embedding是 ...
分类:
其他好文 时间:
2018-10-21 13:05:18
阅读次数:
404
Word translation without parallel data ...
分类:
系统相关 时间:
2018-10-11 12:18:34
阅读次数:
386
先来看一看结果,发现:1.贾宝玉和袭人的关系最近。2.薛宝钗和自己的妈妈关系最近。3.贾宝玉和林黛玉逼格比较统一,薛宝钗属于独树一帜的逼格调性。4.大观园中可以看到邢岫烟经常出没... 还有更多秘密等你自己上手去训练模型并发现... ...
分类:
其他好文 时间:
2018-10-04 11:39:08
阅读次数:
196