论文的重点在于后面approximation部分。 在《Rank Pooling》的论文中提到,可以通过训练RankSVM获得参数向量d,来作为视频帧序列的representation。而在dynamic论文中发现,这样的参数向量d,事实上与image是同等大小的,也就是说,它本身是一张图片(假如m ...
分类:
Web程序 时间:
2016-08-15 17:22:38
阅读次数:
1346
参考文献: 【1】Viola P, Jones M. Rapid object detection using a boosted cascade of simple features[C]//Computer Vision and Pattern Recognition, 2001. CVPR 2 ...
分类:
其他好文 时间:
2016-08-14 10:15:55
阅读次数:
326
Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果 ...
分类:
其他好文 时间:
2016-08-12 18:07:24
阅读次数:
564
// called when the recognition of one of gestureRecognizer or otherGestureRecognizer would be blocked by the other // return YES to allow both to reco ...
分类:
Web程序 时间:
2016-08-10 22:17:54
阅读次数:
167
1.开通语音识别(默认关闭) 2.语音识别 请注意,开通语音识别后,用户每次发送语音给公众号时,微信会在推送的语音消息XML数据包中,增加一个Recognition字段(注:由于客户端缓存,开发者开启或者关闭语音识别功能,对新关注者立刻生效,对已关注用户需要24小时生效。开发者可以重新关注此帐号进行 ...
分类:
微信 时间:
2016-08-07 23:15:55
阅读次数:
473
论文的三个贡献 (1)提出了two-stream结构的CNN,由空间和时间两个维度的网络组成。 (2)使用多帧的密集光流场作为训练输入,可以提取动作的信息。 (3)利用了多任务训练的方法把两个数据集联合起来。 Two stream结构 视屏可以分成空间与时间两个部分,空间部分指独立帧的表面信息,关于 ...
分类:
移动开发 时间:
2016-08-07 09:42:26
阅读次数:
415
Very Deep Convolutional Networks for Large-Scale Image Recognition 1. 主要贡献 本文探究了参数总数基本不变的情况下,CNN随着层数的增加,其效果的变化。(thorough evaluation of networks of inc ...
分类:
Web程序 时间:
2016-08-06 13:00:38
阅读次数:
1761
在论文《action recognition with improved trajectories》中看到fisher vector,所以学习一下。但网上很多的资料我觉得都写的不好,查了一遍,按照自己的认识陈述一下,望大牛指正。 核函数: 先来看一下《统计学习方法》里叙述的核函数的概念, 可以看到, ...
分类:
其他好文 时间:
2016-08-05 11:50:10
阅读次数:
263
题目看上去很吓人,很高端,但其实很简单,不要被吓到,照搬题目的公式就可以了。 方法:用BFS求出最大块和重心,找出题目公式需要的未知量,然后套到题目公式里就可以求出答案了。 代码: ...
分类:
其他好文 时间:
2016-07-31 17:32:25
阅读次数:
134
参考文献 [1] He K, Zhang X, Ren S, et al. Deep residual learning for image recognition. In CVPR 2016 [2] Bell S, Zitnick C L, Bala K, et al. Inside-outsid ...
分类:
Web程序 时间:
2016-07-23 22:48:23
阅读次数:
1743