(一)软件功能 实现两个功能:根据主题生成歌词和辅助写歌词 根据用户给定的主题生成一段歌词,歌词表达要流畅,语句通顺,押韵 提供相关的词语和句子供用户选择,使用户在帮助下完成歌词创作 核心模型 主题生成首句模型 相似度计算 + 基于SIF加权的word2vec模型 首句生成整段歌词模型 基本的Seq ...
分类:
其他好文 时间:
2018-11-13 02:56:19
阅读次数:
311
word2vec介绍 word2vec官网:https://code.google.com/p/word2vec/ word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空 ...
分类:
其他好文 时间:
2018-11-05 22:24:57
阅读次数:
852
Wording Embedding 1. word2vec 基于只含有一个隐层的神经网络,隐层的节点数就是embedding的维度。并提出了CBOW和Skip Grams这两种语言模型。并针对词典过大而导致计算softmax分母复杂度太高的问题提出了Hierarchical Softmax和 Neg ...
分类:
编程语言 时间:
2018-11-03 11:21:45
阅读次数:
162
测试文件在result下面, 1、word2vec还需要丰富训练数据,去噪音,加入博客,新增加预处理的方法。 2、建立评估准确率和召回率的机制 3、去除停用词是不是去多了,增加原文打印的结果 4、原文521条,最终应跑出(521*520)/2对 ...
分类:
编程语言 时间:
2018-11-01 11:50:18
阅读次数:
127
1.“句向量”简介word2vec提供了高质量的词向量,并在一些任务中表现良好。 关于word2vec的原理可以参考这几篇论文: https://arxiv.org/pdf/1310.4546.pdfhttps://arxiv.org/pdf/1301.3781.pdf关于如何使用第三方库gensi ...
分类:
其他好文 时间:
2018-10-31 10:35:15
阅读次数:
177
一、 词向量的表示方式: (1)one-hot方式: 考虑一个词表V,里面的每一个词 wi都有一个编号 i∈{1,...,|V|},那么词 wi的one-hot表示就是一个维度为|V|的向量,其中第i个元素值非零,其余元素全为0。例如:w2=[0,1,0,...,0]Tw3=[0,0,1,...,0 ...
分类:
其他好文 时间:
2018-10-28 22:02:50
阅读次数:
205
1.有DNN做的word2vec,取隐藏层到softmax层的权重为词向量,softmax层的叶子节点数为词汇表大小 2-3的最开始的词向量是随机初始化的 2.哈夫曼树:左边走 sigmoid(当前节点的词向量*当前节点的参数) 右边走 1-sigmoid(当前节点的词向量*当前节点的参数),叶子节 ...
分类:
其他好文 时间:
2018-10-25 19:28:13
阅读次数:
186
一直以来感觉好多地方都吧Word Embedding和word2vec混起来一起说,所以导致对这俩的区别不是很清楚。 其实简单说来就是word embedding包含了word2vec,word2vec是word embedding的一种,将词用向量表示。 1.最简单的word embedding是 ...
分类:
其他好文 时间:
2018-10-21 13:05:18
阅读次数:
404
一、摘要: 主要是做一个基于协作(深度)度量学习(CML)的系统来预测新剧场版本的购买概率。即测量产品的空间距离来预测购买概率。 二、模型 该图分为两部分,先计算右边,右边通过深度度量学习(DDML)来计算产品距离,将得到的产品距离输入左边逻辑回归中得到购买概率。 e(movie)是电影的词向量,f ...
分类:
移动开发 时间:
2018-10-20 22:12:24
阅读次数:
304
词向量: 无论是一段话或是一篇文章,词都是最基本的组成单位。 如何让计算机利用这些词? 重点是如何把一个词转换成一个想向量 如果在一个二维空间中,had,has,have意思相同,所以要离的比较近。 need,help也是离的比较近 要表现出相同,相关。 比如说下面的例子: 哪些词离青蛙frog比较 ...
分类:
其他好文 时间:
2018-10-20 00:48:20
阅读次数:
347