码迷,mamicode.com
首页 > 其他好文 > 详细

视频字幕识别的一般流程

时间:2016-05-07 09:54:38      阅读:209      评论:0      收藏:0      [点我收藏+]

标签:

视频字幕的介绍

视频字幕一般分为两类:

  1. 标注字幕:这种字幕是通过后期制作合成到视频流中去的,包含了对当前视频内容的语义描述。如:在线视频课程的字幕,新闻联播的字幕等。
  2. 场景字幕:这种字幕是视频中的环境或物体本身带有的文字。如路牌上的路名,服装上的名字,产品的商标等。

我们要介绍的,就是第一类标注字幕

与可以直接进行光学字符识别(Optical Character Recognition)的情况相比,视频字幕的提取面临如下几个问题:

  1. 视频图像的复杂背景使字幕提取和分割变得困难。
  2. 为避免遮挡图像的主体部分,许多视频字幕的字符尺寸都相当小,导致分辨率低。
  3. 数字视频采用有损压缩方式的格式存贮,再次降低了分辨率。

然而,作为标注字幕,也有以下明显的特点:

  1. 字幕的尺寸是限定在一定范围,且大小都基本相等。
  2. 字幕按照水平方向排列形式聚焦在一起。
  3. 采用边影,边影是字幕前景或衬底颜色的补色。

利用这些特性,又可以降低字幕的提取难度,并使提取出来的字幕具有更高的准确度。

视频字幕的识别

视频字幕的识别主要经过以下步骤:字幕检测、字幕定位、字幕抽取和字幕识别。

图示如下:
技术分享

视频字幕识别的一般流程

标签:

原文地址:http://blog.csdn.net/u013239871/article/details/51334520

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!