码迷,mamicode.com
首页 >  
搜索关键字:词向量    ( 222个结果
Deep Learning in NLP (一)词向量和语言模型
转载:http://licstar.net/archives/328这篇博客是我看了半年的论文后,自己对 Deep Learning 在 NLP 领域中应用的理解和总结,在此分享。其中必然有局限性,欢迎各种交流,随便拍。 Deep Learning 算法已经在图像和音频领域取得了惊人的成果,但是在....
分类:编程语言   时间:2015-04-11 16:14:28    阅读次数:255
文本深度表示模型Word2Vec
Word2vec 是 Google 在 2013 年年中开源的一款将词表征为实数值向量的高效工具, 其利用深度学习的思想,可以通过训练,把对文本内容的处理简化为 K 维向量空间中的向量运算,而向量空间上的相似度可以用来表示文本语义上的相似度。Word2vec输出的词向量可以被用来做很多 NLP 相关...
分类:其他好文   时间:2015-04-03 22:24:27    阅读次数:705
Word2Vec之Deep Learning in NLP (一)词向量和语言模型
关于word2vec词向量与语言模型部分的理解
分类:编程语言   时间:2015-04-03 10:57:43    阅读次数:306
word2vec代码注释
关于神经网络训练的部分还没有看完,之后会陆续补全。 word2vec源代码: // Copyright 2013 Google Inc. All Rights Reserved. // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except...
分类:其他好文   时间:2015-03-06 15:53:17    阅读次数:181
第二章:Rotate、变位词
1.向量旋转将一个具有n个元素的一维向量左旋i位。1.1使用i个额外空间void left_rotate(string &s,int i){ string s2(s,0,i);//将前i个字符复制到s2 int j=0; //将剩余n-i个元素左移i个位置 for(;i ...
分类:其他好文   时间:2015-03-05 14:25:06    阅读次数:203
Windows下使用Word2vec继续词向量训练
word2vec是Google在2013年提出的一款开源工具,其是一个Deep Learning(深度学习)模型(实际上该模型层次较浅,严格上还不能算是深层模型,如果word2vec上层再套一层与具体应用相关的输出层,如Softmax,便更像是一个深层模型),它将词表征成实数值向量,采用CBOW(Continuous Bag-Of-Words Model,连续词袋模型)和Skip-Gram(Con...
分类:Windows程序   时间:2015-02-04 23:30:43    阅读次数:1071
朴素贝叶斯分类算法原理分析与代码实现
前言 本文介绍机器学习分类算法中的朴素贝叶斯分类算法并给出伪代码,Python代码实现。词向量 朴素贝叶斯分类算法常常用于文档的分类,而且实践证明效果是挺不错的。 在说明原理之前,先介绍一个叫词向量的概念。 --- 它一般是一个布尔类型的集合,该集合中每个元素都表示其对应的单词是否在文档中出现...
分类:编程语言   时间:2014-12-25 23:21:32    阅读次数:383
Word2vec 浅谈
本人还没有做过自然语言处理,但是基于Deep Learning 的关注,自然也了解了一些Word2vec的强大。       Word2vec 是google 在2013年提供的一款将词表征为实数值向量的高效工具。而Word2vec 输出的词向量可用于做NLP 相关的工作,比如聚类、找同义词、词性分析等。Word2vec 大受欢迎的一个原因是其高效性, Tomas Mikolov  在[1]...
分类:其他好文   时间:2014-11-13 16:47:26    阅读次数:192
word2vec生成词向量原理
假设每个词对应一个词向量,假设:1、两个词的相似度正比于对应词向量的乘积。即:$sim(v_1,v_2)=v_1\cdot v_2$。即点乘原则;2、多个词$v_1~v_n$组成的一个上下文用$C$来表示,其中$C=\sum_{i=1}^{n}v_i$。即加和原则;
分类:其他好文   时间:2014-11-07 14:48:49    阅读次数:801
DNN深度神经网络对齐
1. 论文【1】中使用了DNN的思想进行对齐,对齐所需训练数据来自HMM和IBM Model4,算上输入层一共是四层结构,见下图: 效果好于原始的HMM和IBM4,见下图: 该思路可以用在许多地方,诸如:片段相似度、句子相似度、翻译概率、词向量等计算上。 不过,实际应用的话,DNN...
分类:其他好文   时间:2014-10-25 13:12:21    阅读次数:774
222条   上一页 1 ... 20 21 22 23 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!