预、API介绍 mxnet.metric gluon.loss.Loss mxnet.contrib.ndarray.MultiBoxTarget mxnet.contrib.ndarray.MultiBoxDetection ...
分类:
Web程序 时间:
2018-05-30 01:23:22
阅读次数:
930
在深度学习算法出来之前,对于视觉算法来说,大致可以分为以下5个步骤:特征感知,图像预处理,特征提取,特征筛选,推理预测与识别。早期的机器学习中,占优势的统计机器学习群体中,对特征是不大关心的。 我认为,计算机视觉可以说是机器学习在视觉领域的应用,所以计算机视觉在采用这些机器学习方法的时候,不得不自己 ...
分类:
其他好文 时间:
2018-05-21 14:54:13
阅读次数:
192
1、计算机视觉 神经网络在计算机视觉方面有很广泛的应用, 包括图像分类、物体检测、图像风格转换和融合,但是当图片的尺寸比较大时,参数的数量就会增多,传统的全连接神经网络就会很复杂,一方面无法找到足够的数据训练,另一方面也容易引起过拟合,因此我们引入卷积神经网络 ...
分类:
其他好文 时间:
2018-05-19 13:10:25
阅读次数:
176
1、HOG特征: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得 ...
分类:
其他好文 时间:
2018-05-03 15:25:52
阅读次数:
189
"Windows 10 编译 Pycocotools 踩坑记" "COCO数据库简介" 微软发布的COCO数据库, 除了图片以外还提供物体检测, 分割(segmentation)和对图像的语义文本描述信息. COCO数据库的网址是: MS COCO API http://mscoco.org/ Gi ...
分类:
其他好文 时间:
2018-04-28 22:16:22
阅读次数:
3908
detectron安装+caffe2安装 因为想跑一下facebook最近开源的detectron物体检测平台,所以安装caffe2+detectron 总结: 一定要好好看官方安装教程:https://github.com/facebookresearch/Detectron/blob/maste ...
分类:
其他好文 时间:
2018-04-09 11:19:48
阅读次数:
997
1 语义分割 语义分割是对图像中每个像素作分类,不区分物体,只关心像素。如下: (1)完全的卷积网络架构 处理语义分割问题可以使用下面的模型: 其中我们经过多个卷积层处理,最终输出体的维度是C*H*W,C表示类别个数,表示每个像素在不同类别上的得分。最终取最大得分为预测类别。 训练这样一个模型,我们 ...
分类:
其他好文 时间:
2018-01-31 14:55:14
阅读次数:
180
,包括Mask R-CNN。 它是用Python编写的,支持Caffe2深度学习框架。 不久前,FAIR才开源了语音识别的工具wav2letter,戳这里看大数据文摘介绍《快讯 | Facebook开源语音识别工具包wav2letter》。 这一系列工具的开源,将使更多研究人员能使用到Faceboo ...
分类:
编程语言 时间:
2018-01-27 00:47:47
阅读次数:
1305
非极大值抑制(Non-Maximum suppression,NMS)是物体检测流程中重要的组成部分。它首先基于物体检测分数产生检测框,分数高的检测框M被选中,其他与被选中检测框又明显重叠的检测框被抑制。该过程不断递归的应用于其余检测框。根据算法设计,如果一个物体处于预设的重叠阈值之内,可能会导致检 ...
分类:
其他好文 时间:
2018-01-14 18:38:36
阅读次数:
3620
最近遇到一些卡证识别的检测问题,打算先把理论知识梳理一下,随后还会梳理一版代码注释。 以前的region+proposal来检测的框架,这一系列速度和精度不断提高,但是还是无法达到实时。存在的主要问题为:速度不够快,主要原因是proposal比较多,特征进行分类的时候,相同区域的特征计算多遍,所以B ...
分类:
其他好文 时间:
2018-01-03 11:45:14
阅读次数:
362