LSTM 长短时记忆网络(Long Short Term Memory Network, LSTM),是一种改进之后的循环神经网络,可以解决RNN无法处理长距离的依赖的问题,目前比较流行。 长短时记忆网络的思路: 原始 RNN 的隐藏层只有一个状态,即h,它对于短期的输入非常敏感。再增加一个状态,即 ...
分类:
其他好文 时间:
2019-12-27 11:17:36
阅读次数:
4311
今天写存储过程时,遇到要将表名最为参数的问题,如果不涉及到游标的话,使用prepare可以解决问题,但是,动态表名要运用在游标中的话,则prepare就得靠边站了。 集众人之智慧,最后,使用临时表解决了问题。 如何在MySQL的存储过程中实现把过程参数用在游标定义的SELECT命令里面作为表名引用 ...
分类:
数据库 时间:
2019-12-22 18:04:07
阅读次数:
118
因为实训课要用LSTM+attention机制在钢材领域做一个关系抽取。作为仅仅只学过一点深度学习网络的小白在b站上学习了RNN,LSTM的一些理论知识。 但只懂得一些理论知识是无法完成关系抽取的任务的。于是从图书馆借来《tensoflow实战 深度学习框架》,在此开始记录我的tensorflow神 ...
分类:
其他好文 时间:
2019-12-13 15:27:09
阅读次数:
111
1.什么是Tensorflow? Tensor(张量)意味着 N 维数组,Flow(流)意味着基于数据流图的计算,TensorFlow即为张量从图的一端流动到另一端。 它支持CNN(卷积神经网络)、RNN(循环神经网络)和LSTM(长短期记忆网络)算法,是目前在 Image,NLP 最流行的深度神经 ...
分类:
其他好文 时间:
2019-12-09 21:10:07
阅读次数:
163
本篇不涉及模型原理,只是分享下代码。想要了解模型原理的可以去看网上很多大牛的博客。 目前代码实现了CNN和LSTM两个网络,整个代码分为四部分: :项目中涉及的参数; :卷积神经网络结构; :长短期记忆网络结构; : 模型训练及评估,参数 控制训练何种模型( CNN or LSTM )。 完整代码 ...
分类:
其他好文 时间:
2019-12-08 15:34:52
阅读次数:
103
写在前面:在初学nlp时的第一个任务——NER,尝试了几种方法,cnn+crf、lstm+crf、bert+lstm+crf,毫无疑问,最后结果时Bert下效果最好。 1、关于NER: NER即命名实体识别是信息提取的一个子任务,但究其本质就是序列标注任务。 eg: sentence:壹 叁 去 参 ...
分类:
其他好文 时间:
2019-12-06 13:46:38
阅读次数:
84
序列模型问题 给定一个序列, 预测下一个出现的item. 如字迹预测, 语句单词预测, 行为预测等等. LSTM 网络 Long Short Term 网络,一般就叫做 LSTM ,是一种 RNN 特殊的类型,可以学习长期依赖信息。LSTM 通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是... ...
分类:
其他好文 时间:
2019-12-06 11:35:04
阅读次数:
100
序列模型问题 给定一个序列, 预测下一个出现的item. 如字迹预测, 语句单词预测, 行为预测等等. LSTM 网络 Long Short Term 网络,一般就叫做 LSTM ,是一种 RNN 特殊的类型,可以学习长期依赖信息。LSTM 通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是... ...
分类:
其他好文 时间:
2019-12-06 11:33:35
阅读次数:
89
LSTM 输入门$i_t$:控制当前计算的新状态以多大的程度更新到记忆单元中 遗忘门$f_t$:控制前一步记忆单元中的信息有多大程度被遗忘掉 输出门$o_t$:控制当前的输出有多大程度取决于当前的记忆单元 记忆单元$c_t$:每个单元都有 更新公式 输入门: $$i_t=\sigma(W_ix_t ...
分类:
其他好文 时间:
2019-11-24 17:52:59
阅读次数:
92
. 全连层 每个神经元输入: 每个神经元输出: (通过一个激活函数) 2. RNN(Recurrent Neural Network) 与传统的神经网络不通,RNN与时间有关。 3. LSTM(Long Short-Term Memory 长短期记忆) 作者:farmerspring 来源:CNBL ...
分类:
其他好文 时间:
2019-11-18 21:57:57
阅读次数:
85