标签:合并 问题 select png arc cti 网络 样本 自己
给出一张图片和几个类别,定位出图片中这些类所有的实例。
由于输出数目不定,所以不能简单的把检测任务像定位任务一样归化为回归任务(检测任务会导致回归层神经元数目是不确定的)
在机器学习中,分类和回归是解决所有问题的两种基本思路,所以我们尝试用分类的思想分析问题。
思路是将所有可能分类的区域送入网络
问题是图片数量太多
直观的解决思路是换个速度快的电脑... ...
实际上新电脑还是不够快... ...
那就只查看一些可能的区域(预处理)
可以理解为一种不可知目标检测器,它不关心目标的具体类别,也并不精确,但是可以快速检测出大量选区。
它会寻找整体相似的结构,比如上面的狗被视为一大块白色,眼睛是个黑色小块之类。
Selective Search是Region Proposals的一个经典实现,其原理就是:
这里评估了各种Region Proposals方法,老师推荐EdgeBoxes方法。
RCNN整合了图像检测原理中提到的Region Proposals,用于提取特征的卷积神经网络,用于绘制框的回归头,用于分类的SVM分类器,最终实现了检测任务。
训练或下载一个卷积分类模型(比如AlexNet就行)。
Fine-tune模型:
保存样本图的特征:
将上面的特征连同标签作为样本训练SVM分类器。
标签:合并 问题 select png arc cti 网络 样本 自己
原文地址:http://www.cnblogs.com/hellcat/p/7140646.html