标签:nlp
原因是之前time step的h会对后面的time step的h产生影响
这样修改直接改变了梯度公式本身
这两张slides我没有理解,欢迎留言指导讨论
Deep Learning for Nature Language Processing --- 第七讲
原文地址:http://blog.csdn.net/meanme/article/details/47066419