Faster rcnn代码理解（1）

时间：2017-08-02 13:11:17 阅读：230 评论：0 收藏：0 [点我收藏+]

标签：种子信息解析 pen pascal 根据存储这一相关

这段时间看了不少论文，回头看看，感觉还是有必要将Faster rcnn的源码理解一下，毕竟后来很多方法都和它有相近之处，同时理解该框架也有助于以后自己修改和编写自己的框架。好的开始吧～

这里我们跟着Faster rcnn的训练流程来一步一步梳理，进入tools\train_faster_rcnn_alt_opt.py中：

首先从__main__入口处进入，如下：

技术分享

上图中首先对终端中的命令行进行解析，获取相关的命令参数；然后利用mp.Queue()创建一个多线程的对象，再利用get_solvers()获得solvers等信息；然后就开始了论文中的“四步训练”：

第一步，首先训练RPN网络：

技术分享

上图中，先开始子进程训练RPN，训练函数是train_rpn()，那么我们就进入这个函数一探究竟：

技术分享

这里首先使用cfg设置训练时的一些设置参数（cfg类是一个字典，其定义在config.py中，属于网络训练时的配置文件），然后是初始化caffe,这里主要是设置了随机数种子，以及使用caffe训练时的模式（gpu/cpu）；之后就是第一个重头戏--获取imdb和roidb格式的训练数据：

进入get_roidb()函数，如下：

技术分享

首先通过get_imdb()函数获得imdb数据，那我们就再进入get_imdb()函数一探究竟，如下：

技术分享

这里其实也是调用了pascal_voc()函数来创建imdb数据，pascal_voc类见pascal_voc.py文件中，如下：

技术分享

这里只截取了一部分，可以发现，pascal_voc这个类主要用来组织输入的图片数据，存储图片的相关信息，但并不存储图片；而实际上，pascal_voc类是imdb类的一个子类；好了现在imdb数据已经获得了，再回到get_roidb()中，紧接着set_proposal_method()函数设置了产生proposal的方法，实际也是向imdb中添加roidb数据，进入set_proposal_method()这个函数：

技术分享

首先用eval()对这个方法进行解析，使其有效，再传入roidb_handler中，这里遇到问题1（config.py设置产生proposal的默认方法是selective search，但本论文中应该是使用prn_roidb方法获得候选框的，这是在哪儿修改的？？？），先进入rpn_roidb()函数中：

技术分享