标签:net tag 方法 between cer similar blog nes 子集
作者:Lin Yang, Yizhe Zhang, Jianxu Chen, Siyuan Zhang, Danny Z. Chen
针对问题:
1、医学方向训练集数据较少
2、仅专业人士能进行标注,耗费人力物力,数据集数量难以快速提升
贡献点:
1、提出了新的全卷积网络(FCN),在测试数据集上取得了很好的结果
2、FCN的不确定性和相似性评估uncertainty estimation and similarity estimation
3、有效训练数据的选择方法
解决方案:
全卷积FCN+active learning
Present a deep active learning framework that combines fully convolutional network (FCN) and active learning to significantly reduce annotation effort by making judicious suggestions on the most effective annotation areas.
结果:
使用50%的数据集即可获得当前最好的结果。
数据集:
1、2015 MICCAI Gland Challenge dataset
MICCAI 有 85 training images 和 80 testing images (60 Part A; 20 Part B).
2、lymph node ultrasound image segmentation dataset
有37 training images和37 testing images.
网络结构:
首先用较少的训练数据迭代训练FCN得到uncertainty和similarity两个信息从而确定接下来需要送进去的标注图片,再将这些选好的标注图片送到网络一同训练。
细节描述:
1、FCN
结构如下:
结构主要托生于DCAN(Dcan: Deep contour-aware networks for accurate gland segmentation),是2016CVPR的一篇文章所提网络结构。
训练速度快:使用residual networks 和 batch normalization
训练参数少:使用bottleneck design但保证相同的特征层数(active learning的前期阶段训练样本极少,参数过多则难以训练)
2、Uncertainty estimation and similarity estimation
不确定性uncertainty:
方法:Bootstrapping(在训练集中进行放回抽取形成一系列子集并分别训练模型,计算方差)。每个训练样本的不确定性是每个像素不确定性的平均值。
由下图(d)可知,每个像素不确定性和准确率成负相关。
相似性similarity:
输入图片记为Ii ,编码部分的最后一个卷积层的输出记为Iif ,为了具有平移旋转不变性,将Iif每个通道取平均获得Iic 。定义两张图片相似性为
sim(Ii; Ij) = cosine similarity(Iic; Ijc) 下图展示了一组相似图片。
3、标注建议
需要进行标注的数据需要具有很强的不确定性和代表性。其中不确定性更为重要。因而,标注数据的选择主要分为两步:(1)选择不确定性很强的样本(2)选择其中代表性很强的样本。
打字比较麻烦,手写总结一下:
论文中每次选择标注数据 k = 8, 不确定性子集K = 16,2000 training iterations, 4 FCNs. The waiting time between two annotation suggestion stages is 10 minutes on a workstation with 4 NVIDIA Telsa P100 GPU. 使用 5% training data 作为 validation set选择模型。
【阅读笔记】Suggestive Annotation: A Deep Active Learning Framework for Biomedical Image Segmentation
标签:net tag 方法 between cer similar blog nes 子集
原文地址:http://www.cnblogs.com/xiangfeidemengzhu/p/7410782.html