OCR 基本知识

时间：2014-09-19 22:36:26 阅读：194 评论：0 收藏：0 [点我收藏+]

OCR，optical character recognition 的简称，也就是光学识别系统，属于图形识别的一个分支，OCR是针对印刷体字符，采用光学的方式将文档资料转换成原始资料黑白点阵的图像文件，通过识别软件将图像中的文字识别成中文和英文内码，然后转换成文本格式。这样计算机就可以通过OCR识别系统，可以清楚自己看到了什么，读到了什么，尤其是文字资料。

（1）处理过程：
影像输入->影像前处理->文字特征的提取->对比识别->最后通过人工矫正将误判的文字更正，最后将结果输出。

（2）具体流程

1、影像输入：目标文件经过光学仪器后生成位图存储在计算机。

2、影像预处理：包括二值化、腐蚀与膨胀、中值滤波等。

图像二值化：图像显示的时候只能看到两种颜色（经常是黑白两色）。

3、文字特征的提取：根据字符本身特点，在不同区域采集数据。

4、对比数据库：通过画板制作相应的字母和数字模板作为对比的标准。

5、对比识别：根据不用区域的特征比较，找出最相近的字符。

6、输出结果：将最相近的字符作为识别的结果输出，即识别码输出。

OCR 基本知识

标签：文字识别 ocr

原文地址：http://blog.csdn.net/u013476464/article/details/39402863

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行