softmax杂谈

时间：2020-03-27 00:38:00 阅读：76 评论：0 收藏：0 [点我收藏+]

标签：partition amp warning def break flow ams imp pre

softmax杂谈

在多分类问题中，我们可以使用 softmax 函数，对输出的值归一化为概率值。下面举个例子：

import sys

sys.path.append("E:/zlab/")
from plotnet import plot_net, DynamicShow

num_node_list = [10, 7, 5]
figsize = (15, 6)
plot_net(num_node_list, figsize, ‘net‘)

Press `c` to save figure to "net.svg", `Ctrl+d` to break >>
> c:\programdata\anaconda3\lib\site-packages\viznet\context.py(45)__exit__()
-> plt.savefig(self.filename, dpi=300)
(Pdb) c

技术图片

上图转换为表达式：

?? (0) = (?? (0) 0, ?? (0) 1, ?, ?? (0) 9

对于任意的

?? (?? + 1) = ?? (??) ?? (??) + ?? (??) ?? (??

其中，

如若我们有

这样，前向传播可以改写为：

{?? (1 + ??) = ?? (??) ?? (0) + (?? (??)) ?? ??

这里对列向量
且

技术图片

对于多分类问题，一般输出层对应的激活函数的 softmax 函数：

求解

计算
对

import numpy as np

def softmax(X):
    X_exp = np.exp(X)
    partition = X_exp.sum(axis=1, keepdims=True)
    return X_exp / partition  # 这里应用了广播机制。

softmax([[2, 3,4], [3, 5, 7]])

array([[0.09003057, 0.24472847, 0.66524096],
       [0.01587624, 0.11731043, 0.86681333]])

但如果输入值较大或较小时，会出现内存溢出的现象：

softmax([1000, 1000, 100])

C:\ProgramData\Anaconda3\lib\site-packages\ipykernel\__main__.py:5: RuntimeWarning: overflow encountered in exp
C:\ProgramData\Anaconda3\lib\site-packages\ipykernel\__main__.py:7: RuntimeWarning: invalid value encountered in true_divide





array([nan, nan,  0.])

softmax([-10000, -1020, 100, -70220])

array([0., 0., 1., 0.])

一种简单有效避免该问题的方法就是让

def softmax(X):
    X = np.asanyarray(X)
    X -= X.max(axis=-1, keepdims=True)
    X_exp = np.exp(X)
    print(X_exp)
    partition = X_exp.sum(axis=-1, keepdims=True)
    return X_exp / partition  # 这里应用了广播机制。

softmax([1000, 1000, 100])

[1. 1. 0.]





array([0.5, 0.5, 0. ])

softmax([-10000, -1020, 100, -7220])

[0. 0. 1. 0.]





array([0., 0., 1., 0.])

softmax([-10000, -1020, 100, -70220])

[0. 0. 1. 0.]





array([0., 0., 1., 0.])

当然这种做法也不是最完美的，因为 softmax 函数不可能产生 0 值，但这总比出现 nan 的结果好，并且真实的结果也是非常接近

除此之外，还有一个问题：如果我们计算

np.log(softmax([-10000, -1020, 100, -70220]))

[0. 0. 1. 0.]


C:\ProgramData\Anaconda3\lib\site-packages\ipykernel\__main__.py:1: RuntimeWarning: divide by zero encountered in log
  if __name__ == ‘__main__‘:





array([-inf, -inf,   0., -inf])

最简单的处理方式是直接加一个很小的常数：

np.log(softmax([-10000, -1020, 100, -70220])+ 1e-7)

[0. 0. 1. 0.]





array([-1.61180957e+01, -1.61180957e+01,  9.99999951e-08, -1.61180957e+01])

为了解决此数值计算的不稳定，MXNet 提供了：

from mxnet.gluon import loss as gloss
loss = gloss.SoftmaxCrossEntropyLoss()

解决计算交叉熵时出现的数值不稳定的问题。

softmax杂谈

标签：partition amp warning def break flow ams imp pre

原文地址：https://www.cnblogs.com/timssd/p/12578537.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行