NLP中的GAN

时间：2019-06-01 21:25:10 阅读：111 评论：0 收藏：0 [点我收藏+]

生成图像是用随机的向量做实值的映射变换，是连续的过程。因此可以将判别器的误差反向传播到生成器。

在自然语言处理中，encoder解码生成文本的过程中，模型生成词的过程其实是在词表中选词的过程，它是根据当前网络输出的词语的整个概率分布，选取概率最大的词。这个选词的过程argmax是一个离散的过程，是不可导的。因此，无法通过D的梯度反向传播到G，故无法更新G的参数。

1. 直接将生成器softmax之后的概率传给鉴别器，不进行argmax采样，可以反向传播

2. 策略梯度 policy network

3. Gumble-softmax

原文地址：https://www.cnblogs.com/jiangyaju/p/10960785.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行