神经网络与深度学习（1）：神经元和神经网络

时间：2016-12-09 22:11:21 阅读：544 评论：0 收藏：0 [点我收藏+]

标签：block 输入解决 blank 解释总结第一个 int name

本文总结自《Neural Networks and Deep Learning》第1章的部分内容。

感知器（Perceptrons）

1. 基本原理

感知器是一种人工神经元。

一个感知器接受几个二进制输入：x1，x2，...，并产一个二进制输出：

技术分享

数学模型如下：

技术分享

可以将感知器看作依据权重来作出决定的设备。

2. 感知器和与非门

可以通过上述简单的权重和偏置实现一个与非门。

输入00, (−2)∗0+(−2)∗0+3=3，输出1

输入11, (−2)∗1+(−2)∗1+3=−1，输出0

由于与非门是通用运算，所以我们完全能用感知器网络来计算任何逻辑功能。

3. 感知器特点深度

输入：取值为0或者1。
输出：取值为0或者1。

S型神经元、Sigmoid 神经元（Sigmoid neurons）

1.引入S型神经元的原因

S型神经元和感知器类似，但S型神经元中有一个很好的特性：对权重和偏置的微小改动只引起输出的微小变化。这个特性对于神经网络的自我学习过程很重要。

因为对于一个由多个感知器构成的网络而言，存在如下问题：

这个网络中单个感知器上一个权重或偏置的微小改动有时会引起那个感知器的输出完全翻转，如0变到1。那样的翻转可能接下来引起其余网络络的行为以极其复杂的方式完全改变。

而S型神经元可以克服上述问题。

2. 与感知器的异同

输入：可以取0到1之间的任意值，而不同于感知器中只能取0或者1。
输出：输出不是0或1，而是0到1之间的任意值，该输出由σ(wx+b)决定，σ被称为S型函数。

神经网络的架构（The architecture of neural networks）

1. 术语

输入层、输出层、隐藏层

技术分享

由于历史的原因，尽管是由S 型神经元而不是感知器构成，这种多层网络有时被称为多层感知器或者MLP。

2. 网络的设计

输入层和输出层根据具体的问题比较好设计，隐藏层的设计则需要一定的经验、法则。

例如，假设我们尝试确定一张手写数字的图像上是否写的是“9”。很自然地，我们可以将图像像素的强度进行编码作为输入神经元来设计网络。
如果图像是一个64 64 的灰度图像，那么我们会需要4096 = 64*64 个输入神经元，每个强度取0 和1 之间合适的值。输出层只需要包含1个神经元，当输出值小于0.5 时表示“输入图像不是一个9”，大于0.5 的值表示“输入图像是一个9”。