标签:alt 详解 ctc 重点 height 如何 通过 处理 soft
来自: https://zhuanlan.zhihu.com/p/43534801
文字检测主要解决的问题是哪里有文字,文字的范围有多大,即定位文本行的所在位置和范围及其布局。
文本识别是在文本行定位的基础上,对文本行内容进行识别,将图像中的文本信息转化为文字信息。文字识别主要解决的问题是每个文字是什么。
所以一般来说,从自然场景图片中进行文本行识别,需要包括三个步骤:
图1 文字识别的步骤
本文的重点是如何对已经定位好的文本行图片进行识别。
常用文本行识别算法主要有两个框架:
CTC是一种Loss计算方法,用CTC代替Softmax Loss,训练样本无需对齐。
CTC特点:
这篇文章的核心,就是将CNN/LSTM/CTC三种方法结合:
提供了一种end2end文本行图片算算法。
标签:alt 详解 ctc 重点 height 如何 通过 处理 soft
原文地址:https://www.cnblogs.com/Allen-rg/p/10019392.html