1. 背景 大规模视觉识别有三大方向:1)对网络结构改造,加深网络,增加每层网络的神经元数量。 2)做迁移学习:例如学习到的1000类分类器用在500类(大用在小)。 3)多个CNN结合:多个1000类分类器来识别10000类(小用在大)。——本文的方向 Deep Mixture :深度混合,对多个 ...
分类:
其他好文 时间:
2018-11-04 01:40:44
阅读次数:
176
0 - 背景 在目标检测任务中,我们希望输入一副图像,输出目标所在的位置以及目标的类别。最常用的算法是滑动窗口方法,但滑动窗口其实相当于穷举图像中的所有子图像,其效率低且精度也受限。该论文提出一种新的生成目标检测框的方法selective search。 1 - 算法流程 step 0:生成区域集R ...
分类:
其他好文 时间:
2018-11-03 20:11:35
阅读次数:
276
building a semantic map requires advanced object recognition techniques which go beyond our scope. But we are most interested in the range sensor it h ...
分类:
移动开发 时间:
2018-10-29 10:25:46
阅读次数:
391
1. 定义 Tesseract是一个将图像翻译成文字的OCR库(光学文字识别,Optical Character Recognition) 2. 安装 sudo apt get install tesseract ocr 3. 在python中调用Tesseract pip install pyte ...
分类:
其他好文 时间:
2018-10-27 00:23:22
阅读次数:
162
SBAR: SDN flow Based monitoring and Application Recognition SOSR 2018 poster [toc] 摘要 检测系统,可以细化应用层分类。 基于DPI和Machine Learning分类,可以减少开销。 基于应用协议分类。 使用特定的 ...
分类:
移动开发 时间:
2018-10-19 00:04:28
阅读次数:
188
Motivation:减少时空网络的计算量,保持视频分类精度上的基础上,使得速度尽可能接近对应网络的2D版本。 为此提出 Multi-Fiber 网络,将复杂网络拆分成轻量网络的集成,利用 fibers 间的信息流引入多路器模块。 Result:比I3D和R(2+1)D分别少9倍,13倍的计算量,但 ...
分类:
Web程序 时间:
2018-10-16 01:41:35
阅读次数:
639
本文译自《Deep learning for understanding faces: Machines may be just as good, or better, than humans》。为了方便,文中论文索引位置保持不变,方便直接去原文中找参考文献。 近些年深度卷积神经网络的发展将各种目标 ...
分类:
其他好文 时间:
2018-10-14 23:10:00
阅读次数:
421
名称:FaceNet: A Unified Embedding for Face Recognition and Clustering 时间:2015.04.13 来源:CVPR 2015 来自谷歌的一篇 ...
分类:
Web程序 时间:
2018-10-10 21:51:38
阅读次数:
208
awesome scene textscene text recognition scene text spotter scene text detection Awesome Scene text IncepText: A New Inception-Text Module with Deform... ...
分类:
其他好文 时间:
2018-10-08 19:34:29
阅读次数:
182