码迷,mamicode.com
首页 > 其他好文 > 详细

人脸入门2

时间:2019-06-17 15:41:04      阅读:100      评论:0      收藏:0      [点我收藏+]

标签:ima   长度   方式   策略   ram   cal   人人   最简   目的   

关于特征聚合的方法:Aggregating Frame-level Features for Large-Scale Video Classification

这个任务的目的:aggregate frame level features for large-scale video classification.就是将视频中一帧一帧的特征做聚合来得到单个特征去做分类。比如最简单的方法可以将该类别(该人人脸)的所有帧的图像特征取平均作为该类(该人人脸)的特征。

大致有如下方法:

  • 利用LSTM聚合特征,GRU比LSTM更高效。(基于RNN的方法)
  • 特征pooling策略。基于时域聚合特征。加入可训练的VLAD layer。
  • 多模型聚合fusing。

技术图片

上图是general的聚合方式:在不同迭代周期分别预测特征,然后将所有这些特征聚合。

 

 

这篇是做人脸聚合的:Neural Aggregation Network for Video Face Recognition
技术图片

就是说不论该视频的长度有多少,我们都将每一帧的人脸特征做聚合得到代表该人脸特征的唯一128维向量。

 

人脸入门2

标签:ima   长度   方式   策略   ram   cal   人人   最简   目的   

原文地址:https://www.cnblogs.com/king-lps/p/11039473.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!