码迷,mamicode.com
首页 > 其他好文 > 详细

深度之眼PyTorch训练营第二期 --- 8、权值初始化

时间:2019-11-08 09:36:50      阅读:109      评论:0      收藏:0      [点我收藏+]

标签:com   param   函数   函数名   保持数据   消失   linear   height   online   

一、梯度消失与爆炸

技术图片

 

 

二、Xavier方法与Kaiming方法

1、Xavier初始化

方差一致性:保持数据尺度维持在恰当范围,通常方差为1

激活函数:饱和函数,如Sigmoid,Tanh

 

三、常用初始化方法

10种:

Xavier均匀分布、正态分布

Kaiming均匀分布、正态分布

均匀分布、正态分布、常数分布

正交矩阵初始化

单位矩阵初始化

稀疏矩阵初始化

 

nn.init.Calculate_gain

主要功能:计算激活函数的方差变化尺度

主要参数

nonlinearity:激活函数名

param:激活函数的参数,如Leaky ReLU的negative_slop

深度之眼PyTorch训练营第二期 --- 8、权值初始化

标签:com   param   函数   函数名   保持数据   消失   linear   height   online   

原文地址:https://www.cnblogs.com/cola-1998/p/11818008.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!