码迷,mamicode.com
首页 > 其他好文 > 详细

教你如何提取图片中的文字

时间:2015-03-11 16:31:14      阅读:164      评论:0      收藏:0      [点我收藏+]

标签:

教你如何提取图片中的文字

在我国国民经济飞速发展的今天,软件是国民经济发展必不可少的武器,只需大力发展软件产业,才华习气我国国民经济发展的需要。捷速ocr文字辨认软件的研发人员在运用上进行不懈的极力,不断地开发出新的OCR产品,为各行业供应信息管理解决方案,为我国的基础信息化缔造供应有力的支持。ocr识别软件

  好马配好鞍,好的软件也需要有高质量的文件才华得到最好的辨认率。所以,在运用捷速ocr文字辨认软件之前,应作为好充沛的准备,下面我们来看看需要准备些什么东西:

  1、在放置扫描原稿时,把扫描的文字资料一定要摆放在扫描开始线正中,以最大极限地减小由于光学透镜致使的失真。一同应保护扫描仪玻璃的洁净和不受损害。文字有一定角度的倾斜,或者是原稿文字部分为不标准排版,有必要在扫描后运用旋转东西,进行纠正;不然OCR辨认软件会将水平笔划作为斜笔划处理,辨认正确率会降低许多。建议用户尽量将扫描原稿放正,用东西旋转纠正会降低图像质量,使字符辨认更加艰难。ocr识别软件

  2、先"预览"整体版面,选定要扫描的区域,再用"扩展预览"东西,选择一小块进行扩展显现到全屏幕,查询其文字的对比度,文字的深浅浓度,据情况调整"阀值"的大小,毕竟需要文字清楚,不浓(文字成团),不淡(文字断笔伐),一般在"阀值"80摆布为宜,终究再扫描。

  3、用东西擦掉图像污点,包括本来版面中的不需要辨认的插图、分隔线等,使文字图像中除了文字没有一点剩余的东西;这能够大前进辨认率并减少辨认后的修改工作。

  捷速ocr文字辨认软件的工作人员提示:假如要扫描打印质量稍微差一些的文章,比如说报纸,扫描的效果将不会黑白分明,会出现许多的黑点,并且在字体的笔画上也会出现粘连表象,这两项但是汉字辨认的大忌,将严重影响汉字辨认的正确率。为获得较好的辨认效果,有必要仔细进行色彩调度,反复扫描多次才华获得对比抱负的效果。别的由于报纸很薄且大多数纸质不高,致使扫描仪上盖板不能完全压住报纸(有缝隙),所以一般情况下报纸的扫描辨认效果没有杂志的效果好。解决办法是在报纸上压一至两本16K的杂志,效果仍是不错的。

教你如何提取图片中的文字

标签:

原文地址:http://www.cnblogs.com/OCRshibie/p/4329762.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!