码迷,mamicode.com
首页 > 其他好文 > 详细

开源文字识别软件tesseract

时间:2018-10-10 14:07:13      阅读:190      评论:0      收藏:0      [点我收藏+]

标签:span   文字识别软件   round   x86   文字识别   nbsp   下一步   alt   中文字体   

1.下载4.0软件,下一步下一步到成功;

2.安装之后配置环境变量,Path中添加安装路径(默认:C:\Program Files (x86)\Tesseract-OCR)

技术分享图片

3.新增语言库的环境变量,变量名:TESSDATA_PREFIX,变量值(默认:C:\Program Files (x86)\Tesseract-OCR\tessdata)

4.测试软件是否可用tesseract -v,能看到版本号就说明安装成功了

技术分享图片

5.识别图片的文字(tesseract [in image]  [out txt[lange],如未指定语言,则默认为英文字体库识别

中文字体库识别:tesseract d:\1.png  result  -l chi_sim

技术分享图片

英文字体库识别:tesseract d:\1.png result,

技术分享图片

 

 

tesseract 4.0中文字库和安装软件(安装时自带英文字库)

 百度网盘:https://pan.baidu.com/s/1TiD2Tdez5JVbAhri8cumLA

密码:5mem

开源文字识别软件tesseract

标签:span   文字识别软件   round   x86   文字识别   nbsp   下一步   alt   中文字体   

原文地址:https://www.cnblogs.com/zbfamily/p/9765443.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!