# Copyright 2015 The TensorFlow Authors. All Rights Reserved. # # Licensed under the Apache License, Version 2.0 (the "License"); # you may not use th... ...
分类:
其他好文 时间:
2017-10-01 23:03:55
阅读次数:
300
简介 Word2vec 是 Google 在 2013 年年中开源的一款将词表征为实数值向量的高效工具, 其利用深度学习的思想,可以通过训练,把对文本内容的处理简化为 K 维向量空间中的向量运算,而向量空间上的相似度可以用来表示文本语义上的相似度。Word2vec输出的词向量可以被用来做很多 NLP ...
分类:
其他好文 时间:
2017-09-27 13:19:51
阅读次数:
165
https://raw.githubusercontent.com/tensorflow/tensorflow/r1.3/tensorflow/examples/tutorials/word2vec/word2vec_basic.py ...
分类:
其他好文 时间:
2017-09-18 22:25:14
阅读次数:
269
Keras的核心数据是“模型”,模型是一种组织网络层的方式。Keras中主要的模型是Sequential模型,Sequential是一系列网络层按顺序构成的栈。 Sequential模型如下: 将网络层通过.add()堆叠起来,就构成了一个模型: 完成模型的搭建后,我们需要使用.compile()方 ...
分类:
其他好文 时间:
2017-09-18 17:27:44
阅读次数:
500
nlp中语义理解一直是业内的难题。汉语不同于英语,同样一个意思,可以有很多种说法,比如你是谁的问题,就可以有如下几种:①你是谁?②你叫什么名字?③您贵姓?④介绍一下你自己 等等。这些句子在语义上是十分接近的,如果做一个智能音响,对音响说出上述任何一句,其结果不应该因为句子形式的不同而不同,也就是说训 ...
分类:
其他好文 时间:
2017-08-25 01:05:28
阅读次数:
2998
在阅读本文之前,建议首先阅读“简单易学的机器学习算法——word2vec的算法原理”(眼下还没公布)。掌握例如以下的几个概念: 什么是统计语言模型 神经概率语言模型的网络结构 CBOW模型和Skip-gram模型的网络结构 Hierarchical Softmax和Negative Sampling ...
分类:
编程语言 时间:
2017-08-16 17:11:29
阅读次数:
345
CBOW和Skip-gram模型 word2vec有两个模型,分别是CBOW和Skip-gram模型。这两个模型又都可以有两种优化方法。分别是 Hierarchical Softmax与Negative Sampling 。所以实现word2vec有四种方式: 2013年末,Google发布的wor ...
分类:
其他好文 时间:
2017-08-14 23:35:48
阅读次数:
456
tensorflow是google在2015年开源的深度学习框架 tf中有word2vec,seq2seq ,所以我这里先学习tensorflow,然后再实现word2vec和seq2seq 一、tensorflow 1.1 安装 win10,python3.5,记得安装 vc++ 看此blog h ...
分类:
其他好文 时间:
2017-08-14 17:28:46
阅读次数:
207
word2vec相关基础知识、下载安装參考前文:word2vec词向量中文文本相似度计算 文件夹: word2vec使用说明及源代码介绍 1.下载地址2.中文语料3.參数介绍4.计算相似词语5.三个词预測语义语法关系6.关键词聚类 1、下载地址 官网C语言下载地址:http://word2vec.g ...
分类:
编程语言 时间:
2017-08-13 15:19:15
阅读次数:
258
这是根据斯坦福cs224d课程写出来的, 这是课程里边最开始所讲的词向量, 1、首先将所有的词组织成一个词典 2、对于词典中的每一个词, 扫描词典中的其他词, 对于扫描到的每一个词, 统计原始词在被扫描到的词的前边或者后边出现的次数, 这样就构成了一个由词频所构成的对角阵 3、对该对角阵进行SVD分 ...
分类:
编程语言 时间:
2017-08-12 20:24:03
阅读次数:
463