论文地址: "Attention is you need" 序列编码 深度学习做NLP的方法,基本都是先将句子分词,然后每个词转化为对应的的词向量序列,每个句子都对应的是一个矩阵$X=(x_1,x_2,...,x_t)$,其中$x_i$都代表着第$i$个词向量,维度为d维,故$x\in R^{n×d ...
分类:
其他好文 时间:
2018-10-14 23:11:43
阅读次数:
474
《面向对象程序设计(java)》第七周学习总结 第一部分:理论知识学习部分 1.继承 用已有类来构建新类的一种机制。新类可以继承父类的方法和域,同时可以在新类中添加新的方法和域。 已有类称为:超类、基类或父类。新类称作:子类、派生类或孩子类。 子类的构造器不能直接访问超类的私有域,必须通过调用超类构 ...
分类:
编程语言 时间:
2018-10-14 13:52:09
阅读次数:
170
深度学习做NLP的方法,基本上都是先将句子分词,然后每个词转化为对应的词向量序列。(https://kexue.fm/archives/4765) 第一个思路是RNN层,递归进行,但是RNN无法很好地学习到全局的结构信息,因为它本质是一个马尔科夫决策过程。 第二个思路是CNN层,其实CNN的方案也是 ...
分类:
其他好文 时间:
2018-10-14 00:34:17
阅读次数:
694
poj3252 Round Numbers 组合数学(数位dp) (没想到书上的标程还要看脸TAT) (我以后再也不在poj上用scanf/printf了TAT) (poj的题都默认多组数据的吗TAT) tips:信息学奥赛数学一本通的标程和部分Baidu上的代码访问数组越界,脸黑的会GG(比如我Q ...
分类:
其他好文 时间:
2018-10-14 00:27:49
阅读次数:
112
现有方法通常基于单词获取节点的文本特征矩阵,忽略分层结构(单词、句子),该文提出SHANE 模型,集成节点结构,文本和标签信息,并以半监督的方式学习网络嵌入,使用分层注意网络学习节点的文本特征, 两层双向 GRU 提取单词和句子的潜在特征 ...
分类:
Web程序 时间:
2018-10-09 13:30:53
阅读次数:
239
理论知识部分 一、类、超类和子类 1类继承的格式: class 新类名extends已有类名。 2. 已有类称为:超类(superclass)、基类(base class) 或父类(parent class) 新类称作:子类(subclass)、派生类(derived class)或孩子类(chil ...
分类:
编程语言 时间:
2018-10-07 18:04:12
阅读次数:
145
Preface: Most of the answers below are written by myself "only instructors are given access to the exercise solutions" . If you find anything wrong, p ...
分类:
其他好文 时间:
2018-10-04 12:52:12
阅读次数:
421
Machine Learning The First Column | The Second Column : :|: : Machine Learning 1 | "从机器学习入手" Machine Learning 2 | "机器学习很有趣!" Machine Learning 3 | "机器学 ...
分类:
系统相关 时间:
2018-10-02 17:41:21
阅读次数:
249
模型项目 "Domain Transfer Network" Implementation of Unsupervised Cross Domain Image Generation "Show, Attend and Tell" Attention Based Image Caption Gene ...
分类:
其他好文 时间:
2018-09-27 01:56:04
阅读次数:
246
elk and redis installation and configuration ATTENSION + attention the version of all software(use the latest) node1 installed logstash, httpd + syste ...
分类:
其他好文 时间:
2018-09-18 00:21:56
阅读次数:
158