一、光流特征的使用
对于很多模型,光流特征的加入,会明显提升效果,这是因为光流特征是比较科学的人工特征。但是,光流特征需要很高的计算代价和存储代价,所以TV-Nets或许是工程上解决这一问题的方法。
有一些模型,对光流特征的加入,提升效果不明显,或许可以不考虑这个问题。
二、预训练
一些模型在大型动作视频数据集上(如Sports-1M)预训练,然后迁移到小的动作数据集(如UCF101)上,这种情况对于非动作视频的分类任务效果如何是待定的。ICCV2018好像就有一些文章研究迁移学习的效果。
一些模型使用ImageNet等大型图像数据集做预训练,因为ImageNet并非局限于动作图像,所以对于非动作视频的分类任务可能通用性更好。
原文地址:https://www.cnblogs.com/mimandehuanxue/p/9259641.html