Deep TEN: Texture Encoding Network

时间：2017-07-15 19:57:39 阅读：375 评论：0 收藏：0 [点我收藏+]

标签：desc 输入分类 bow present pat instead des layer

纹理特征，材料分类（Material Classification），在MINC-2500、Flickr Material Database、KTH-TIPS-2b、4D-Light-Field-Material、GTOS上state-of-the-art（2017年）。

思想主要来源是：传统图片分类方法都是提取人工设计的特征（SIFT等）然后使用BOW进行编码，再用SVM进行分类，后面BOW被VLAD、Fisher Vector编码替换并融合CNN特征可以达到sota的效果。然而这样的方法有缺点，就是编码和特征的学习并不是end-to-end的，所以作者设计了一个learnable residual encoding layer。作者还提到一般的CNN的方法虽然在图片分类和物体识别上有比较好的效果，但是在纹理识别上表现并不理想，给出的理由是：

``` recognizing textures needs for a spatially invariant representation describing the feature distributions instead of concatenation ```

这篇论文的主要贡献：

1. learnable residual encoding layer。能够生成鲁棒的残差编码例如（VLAD和Fisher Vector），能接收任意的输入分辨率，并且生成固定长度的特征表示，这种编码方式非常适合pretrained feature的迁移。

2.将feature extraction, dictionary learning, encoding 融合成一个end-to-end的形式。

技术分享

Deep TEN: Texture Encoding Network

标签：desc 输入分类 bow present pat instead des layer

原文地址：http://www.cnblogs.com/Key-Ky/p/7183748.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行