很久以前关注过一段时间word2vec,最近比较好奇doc2vec,找来资料看看。
时间:2014
作者:Mikolov (word2vec的作者)
发表于:icml
原文件:http://pan.baidu.com/s/1bnm7COB
主要内容:
继写出word2vec之后,接下来的问题是:能否在更大的语言单位上,如:短语、句子、段落、篇章,上面继续word2v...
分类:
其他好文 时间:
2015-05-31 18:29:02
阅读次数:
163
主要内容:
在google word2vec的基础上,考虑文章(document)的向量化方法,借鉴了随机过程中的Chinese restaurant process过程。
Chinese restaurant process过程:
基本上的过程就是,餐馆中有无限多个桌子,每个桌子可以坐无限多个人。当第一位顾客过来的时候,直接开辟一张桌子坐下;当第n+1位顾客过来的时候,他有...
分类:
移动开发 时间:
2015-05-30 19:53:17
阅读次数:
293
这里模仿了Word2vec里面构建Hash索引的思想。#include
#include
#include
#include
#include
#include
#include
#define MaxString 50
#define MaxUserSi...
分类:
编程语言 时间:
2015-05-11 16:10:04
阅读次数:
148
#include
#include
#include
//#include
#include const long long max_size = 2000; // max length of strings
const long long N = 5;...
分类:
其他好文 时间:
2015-04-09 22:01:15
阅读次数:
208
#include
#include
#include
//#include
#include const long long max_size = 2000; // max length of strings
const long long N = 5;...
分类:
其他好文 时间:
2015-04-09 22:00:36
阅读次数:
120
下面就给大家弄些例子,说说在互联网广告这一块的应用吧。
分类:
其他好文 时间:
2015-04-04 19:42:25
阅读次数:
377
在看word2vec的资料的时候,经常会被叫去看那几篇论文,而那几篇论文也没有系统地说明word2vec的具体原理和算法,所以老衲就斗胆整理了一个笔记,希望能帮助各位尽快理解word2vec的基本原理,避免浪费时间。 当然如果已经了解了,就随便看看得了。
分类:
编程语言 时间:
2015-04-04 10:29:08
阅读次数:
205
Word2vec 是 Google 在 2013 年年中开源的一款将词表征为实数值向量的高效工具, 其利用深度学习的思想,可以通过训练,把对文本内容的处理简化为 K 维向量空间中的向量运算,而向量空间上的相似度可以用来表示文本语义上的相似度。Word2vec输出的词向量可以被用来做很多 NLP 相关...
分类:
其他好文 时间:
2015-04-03 22:24:27
阅读次数:
705
原始论文:http://www-personal.umich.edu/~ronxin/pdf/w2vexp.pdf
之前学习Word2vec时,脱离了神经网络,这周补充了下相关知识,打算之后再
看下源码,加深自己的理解。...
分类:
其他好文 时间:
2015-03-27 22:25:04
阅读次数:
468