码迷,mamicode.com
首页 > 其他好文 > 详细

视觉方面一些基础知识

时间:2017-10-04 15:51:06      阅读:134      评论:0      收藏:0      [点我收藏+]

标签:区域   scale   难度   tran   lin   原因   视觉   固定   http   

1.CNN为什么可以在CV/NLP/Speech等领域都可以使用?

  1. 卷积是因为输入数据的局部相关性;

  2. 权值共享是因为输入数据的局部特征具有平移不变性,即在不同位置具有共性的局部特征。这样,经过多层次堆叠,低层局部特征可以抽取成高层全局特征。

  3. 权值共享能够降低参数量,而且降低了网络的训练难度。

    note: 如果权值不共享,那就是局部连接层了。在某些应用,如人脸在不同的区域存在不同的特征(眼睛/鼻子/嘴的分布位置相对固定),当不存在全局的局   部特征分布时,局部连接层更适合特征的提取。

2.采用pooling原因:
  1. 提取特征,保证invariance(translation(平移),rotation(旋转),scale(尺度))      https://www.zhihu.com/question/36686900
  2. 减少参数减少计算量和防止过拟合

3.https://www.zhihu.com/question/36980971

视觉方面一些基础知识

标签:区域   scale   难度   tran   lin   原因   视觉   固定   http   

原文地址:http://www.cnblogs.com/ymjyqsx/p/7625654.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!