标签:记录 自己的 github bat ati er模型 http 针对 代码
本文是针对谷歌Transformer模型的解读,根据我自己的理解顺序记录的。
另外,针对Kyubyong实现的tensorflow代码进行解读,代码地址https://github.com/Kyubyong/transformer
首先是Layer Normalization部分,和Batch Normalization有点不一样,
标签:记录 自己的 github bat ati er模型 http 针对 代码
原文地址:https://www.cnblogs.com/zhouxiaosong/p/11032431.html