DNN网络（二）反向传播算法

时间：2018-12-24 02:55:07 阅读：257 评论：0 收藏：0 [点我收藏+]

标签：输出迭代技术分享线性变换 sig 初始化 log 计算 ext

本文摘自：

https://www.cnblogs.com/pinard/p/6422831.html

http://www.cnblogs.com/charlotte77/p/5629865.html

一、DNN求解参数的方法

在监督学习中，优化参数的方法

首先我们都会定义一个目标函数，一般来讲都是损失函数
通过最小化损失函数，求得最优参数
不断迭代上一个步骤直到收敛，也就是损失函数基本不再变化

在DNN神经网络中，前向传播算法，主要是用来计算一层接着一层的输入值，通过计算出来的最后一层的输出值与真实值相计算就可以得到损失函数的值，然后通过反向传播，就可以优化参数。不断迭代前向传播与反向传播这个过程，就可以优化出最优参数。

二、DNN的反向传播，输出层

假设有网络，结构如下图所示，以w₇为例子，优化其参数。

技术分享图片

1、由上述介绍，首先前向传播算法第i层的输出oⁱ为(现行变换通过激励函数)：

技术分享图片

2、定义损失函数为（不唯一）：

技术分享图片

3、定义sigma激励函数为sigmoid。

技术分享图片

其中，z为线性变换

技术分享图片

4、在初始化了所有参数之后，首先由前向传播算法，可以得到每一层的输入。在最后一层，可以得总误差：

技术分享图片

5、由微分方程可以得到：

技术分享图片

6、各部分：

技术分享图片

7、sigmoid导数是h(x)(1-h(x)), 因此：

技术分享图片

8、

技术分享图片

9、因此

技术分享图片

其中eta是学习率。对于同层的其他omega方法耶是一样的。

三、DNN的反向传播，隐藏层

1、更新隐藏层的参数。以w₁为例。

技术分享图片

2、

技术分享图片

3、

技术分享图片

4、

技术分享图片

5、

技术分享图片

6、因此得：

技术分享图片

8、

技术分享图片

9、根据上述过程就可以得到同一隐藏层的所有参数。

DNN网络（二）反向传播算法

标签：输出迭代技术分享线性变换 sig 初始化 log 计算 ext

原文地址：https://www.cnblogs.com/ylxn/p/10166053.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行