每次开例会,听报告,总听到这个词,但是我几乎没看过相关的东西,每次都让我困惑不解, 我超级不喜欢这种迷茫的感觉,明明是很简单的东西,却一直让我分心,So 、、、终于鼓起勇气系统的学习一下,(大部分也来自于别人的源码分析)谢谢这些挖井人: 一:预备知识 (1)sigmoid函数 (2)逻辑回归 (3) ...
分类:
其他好文 时间:
2017-04-28 23:36:40
阅读次数:
133
LSTM 文本情感分析/序列分类 Keras 请参考 http://spaces.ac.cn/archives/3414/ neg.xls是这样的 pos.xls是这样的neg=pd.read_excel(‘neg.xls’,header=None,index=None) pos=pd.read_e ...
分类:
其他好文 时间:
2017-04-24 14:10:02
阅读次数:
382
Genism word2vec 研读 neaural networks in https://code.google.com/p/word2vec/ 初始化中的参数作用def __init__( self, sentences=None, size=100, alpha=0.025, window= ...
分类:
其他好文 时间:
2017-04-07 21:38:21
阅读次数:
2296
关键词: 词向量、文档向量、文档表示 地址:https://openreview.net/forum?id=B1Igu2ogg¬eId=B1Igu2ogg 首先,论文解决的是Word2Vec,Paragraph Vectors一样的,文档表示形式的问题。如何来表示一个文档,从而进行相关的文档分 ...
分类:
其他好文 时间:
2017-04-05 17:27:06
阅读次数:
195
词向量: 将词语"嵌入"到一个N维空间,使得词语相近的词语放到相近的位置。 机器翻译类不类似于矩阵的变换? 谷歌出品的一个工具Word2Vec,用于入门。 句向量?段向量?文档向量? 很多事情向量化,可以解决很多问题。 传统的one-hot 编码的原来是,有多少个字就有多少个维度. 科[1,0,0, ...
分类:
编程语言 时间:
2017-04-02 14:30:29
阅读次数:
173
1.从文本中构建词向量 将每个文本用python分割成单词,构建成词向量,这里首先需要一个语料库,为了简化我们直接从所给文本中抽出所有出现的单词构成一个词库。 2.利用词向量计算概率p(x|y) When we attempt to classify a document, we multiply ...
分类:
其他好文 时间:
2017-03-28 20:46:16
阅读次数:
287
Distributed Representation 这种表示,它最早是 Hinton 于 1986 年提出的,可以克服 one-hot representation 的缺点。 其基本想法是: 通过训练将某种语言中的每一个词映射成一个固定长度的短向量(当然这里的“短”是相对于 one-hot rep ...
分类:
其他好文 时间:
2017-03-27 15:31:08
阅读次数:
278
在阅读本文之前,建议首先阅读“简单易学的机器学习算法——word2vec的算法原理”,掌握如下的几个概念:
什么是统计语言模型
神经概率语言模型的网络结构
CBOW模型和Skip-gram模型的网络结...
分类:
编程语言 时间:
2017-03-16 17:42:17
阅读次数:
525
Overview Lesson 26 - Embeddings and Word2vec Lesson 27 - Siraj's Style Transfer Log 3/10/2017: Lesson 26; Reading Note Lesson 26 - Embeddings and Word ...
分类:
其他好文 时间:
2017-03-11 10:39:24
阅读次数:
162
首先,大概讲一下自然语言处理的背景。互联网上充斥着大规模、多样化、非结构化的自然语言描述的文本,如何较好的理解这些文本,服务于实际业务系统,如搜索引擎、在线广告、推荐系统、问答系统等, 给我们提出了挑战。例如在效果广告系统中,需要将 Query(User or Page) 和广告 Ad 投影到相同的 ...
分类:
其他好文 时间:
2017-02-18 18:49:11
阅读次数:
2428