首页 > 其他好文 > 详细

BP神经网络推导过程详解

时间：2015-06-21 00:47:45 阅读：1160 评论：0 收藏：0 [点我收藏+]

标签：

BP算法是一种最有效的多层神经网络学习方法，其主要特点是信号前向传递，而误差后向传播，通过不断调节网络权重值，使得网络的最终输出与期望输出尽可能接近，以达到训练的目的。

一、多层神经网络结构及其描述

下图为一典型的多层神经网络。

技术分享

通常一个多层神经网络由L层神经元组成，其中：第1层称为输入层，最后一层（第L层）被称为输出层，其它各层均被称为隐含层（第2层~第L-1层）。

令输入向量为：

\[ \vec x = [x_1 \quad x_2 \quad \ldots \quad x_i \quad \ldots \quad x_m],i=1,2,...,m \]

输出向量为：

\( \vec y = [y_1 \quad y_2 \quad \ldots \quad y_k \quad \ldots \quad y_n],k=1,2,...,n \)

第l隐含层各神经元的输出为：

\[ h^{(l)}=[h_1^{(l)} h_2^{(l)} \quad \ldots h_j^{(l)} \quad \ldots \quad h_{s_l}^{(l)}],j=1,2,...,s_l \]

其中，技术分享为第l层神经元的个数。

设技术分享为从l-1层第j个神经元与l层第i个神经元之间的连接权重；为第l层第i个神经元的偏置，那么：

技术分享

技术分享

其中，技术分享为l层第i个神经元的输入，为神经元的激活函数。通常在多层神经网络中采用非线性激活函数，而不是用线性激活函数，因为采用基于线性激活函数的多层神经网络本质上还是多个线性函数的叠加，其结果仍然为一个线性函数。

二、激活函数

BP神经网络通常使用下面两种非线性激活函数：

技术分享

技术分享

第一种称为sigmod函数或者logistics函数，第二种为双曲正切函数。

Sigmod函数的图像如下图所示，它的变化范围为(0, 1)，其导数为技术分享。

技术分享

双曲正切函数的图像如下图所示，它的变化范围为(-1, 1)，其导数为技术分享。

技术分享

三、BP算法推导过程

假定我们有m个训练样本技术分享，其中为对应输入的期望输出。BP算法通过最优化各层神经元的输入权值以及偏置，使得神经网络的输出尽可能地接近期望输出，以达到训练（或者学习）的目的。

采用批量更新方法，对于给定的m个训练样本，定义误差函数为：

技术分享

其中，E(i)为单个样本的训练误差：

技术分享

因此，

技术分享

BP算法每一次迭代按照以下方式对权值以及偏置进行更新：

技术分享

技术分享

其中，技术分享为学习速率，它的取值范围为(0, 1)。BP算法的关键在于如何求解和的偏导数。

对于单个训练样本，输出层的权值偏导数计算过程：

技术分享

即：

技术分享

同理可得，

技术分享

令：

技术分享

则：

技术分享

技术分享

对隐含层L-1层：

技术分享

因为，

技术分享

所以，

技术分享

同理，

技术分享

令：

技术分享

则：

技术分享

技术分享

由上可推，第l层（技术分享）的权值和偏置的偏导可以表示为：

技术分享

技术分享

其中，

技术分享

四、BP算法过程描述

采用批量更新方法对神经网络的权值和偏置进行更新：

对所有的层，设，这里和分别为全零矩阵和全零向量；
For i = 1:m，
1. 使用反向传播算法，计算各层神经元权值和偏置的梯度矩阵和向量和；
2. 计算；
3. 计算。
更新权值和偏置：
1. 计算；
2. 计算。

BP神经网络推导过程详解

标签：

原文地址：http://www.cnblogs.com/biaoyu/p/4591304.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！