word2vec 中的数学原理详解 word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节, ...
分类:
其他好文 时间:
2017-07-14 00:34:20
阅读次数:
195
一、情感分类方面 为了提高CNN情感分类的准确率,对CNN模型的输入层进行改进,加入word2vec。 各个方案基于这样的前提: a. 经过上个星期调试,当KERNEL_NUM=200, KERNEL_SIZES=[3, 4, 5, 6, 7] 时准确率最高,所以下面所有改进都是基于此结论的基础上的 ...
分类:
其他好文 时间:
2017-07-12 01:09:54
阅读次数:
232
word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了非常多人的关注。因为 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上添加了这个工具包的 ...
分类:
其他好文 时间:
2017-07-06 17:03:01
阅读次数:
260
我们尝试基于CBOW模型,将知识库中抽取的知识融合共同训练,提出LRWE模型。模型的结构图如下:下面详细介绍该模型的思想和求解方法。1.LWE模型在Word2vec的CBOW模型中,通过上下文的词预测目标词,目标是让目标词在其给定上下文出现的概率最大,所以词向量训练的结果是与其上下..
分类:
其他好文 时间:
2017-07-05 11:36:47
阅读次数:
189
# Downloading data. If the file already exists, check that it was received correctly (the file size is the same).# Return filename after download. voc ...
分类:
其他好文 时间:
2017-06-30 18:56:00
阅读次数:
332
Tensorflor实现文本分类 下面我们使用CNN做文本分类 cnn实现文本分类的原理 下图展示了如何使用cnn进行句子分类。输入是一个句子,为了使其可以进行卷积,首先需要将其转化为向量表示,通常使用word2vec实现。d=5表示每个词转化为5维的向量,矩阵的形状是[sentence_lengt ...
分类:
其他好文 时间:
2017-06-21 18:16:44
阅读次数:
747
目前智能QA系统都是基于seq2seq模型来开发(如google),seq2seq模型基于one-hot的词嵌入,每个词用一个数字代替不足以表示词与词之间的关系,word2vec通过多维向量来做词嵌入,能够表示出词之间的关系,比如:男-女≈王子-公主。基于seq2seq的思想,利用多维词向量来实现模... ...
分类:
其他好文 时间:
2017-06-09 23:35:54
阅读次数:
1165
需要的几个文件: 1.wordList.txt,即你要转化成vector的word list: 2.label.txt, 即图中显示的label,可以与wordlist.txt中的word不同。 3.model,用gensim生成的word2vec model; 4.运行buildWordVecto ...
分类:
编程语言 时间:
2017-06-08 11:59:52
阅读次数:
1364
上次说到了 智能推荐是怎麽做的,这次聊一下寒暄库的建设思路。 目前智能QA系统都是基于seq2seq模型来开发(如google),seq2seq模型基于one-hot的词嵌入,每个词用一个数字代替不足以表示词与词之间的关系,word2vec通过多维向量来做词嵌入,能够表示出词之间的关系,比如:男-女 ...
分类:
其他好文 时间:
2017-06-08 01:33:35
阅读次数:
308
1. 目的: 探索一种面向微博的社会情绪词典构建方法; 2. 步骤: 1)通过手工方法建立小规模的基准情绪词典; 2)利用深度学习工具 Word2vec对社会热点事件的微博语料通过增量式学习方法来扩展基准词典,并结合 HowNet词典匹配和人工筛选生成最终的情绪词典; 3. 试验阶段: 分别利用基于 ...
分类:
其他好文 时间:
2017-06-01 00:28:08
阅读次数:
251