码迷,mamicode.com
首页 > 系统相关 > 详细

Linux Tesseract-OCR安装与训练样本

时间:2014-07-21 10:08:49      阅读:638      评论:0      收藏:0      [点我收藏+]

标签:style   blog   http   java   color   使用   

  1. 安装对应的lib (install the libs)

   参考:http://www.eefocus.com/winter1988/blog/13-03/292209_03d5b.html

sudo apt-get install autoconf automake libtool
sudo apt-get install libpng12-dev
sudo apt-get install libjpeg62-dev
sudo apt-get install libtiff4-dev
sudo apt-get install zlib1g-dev


确保安装下面的lib:

 sudo apt-get install  gcc
 sudo apt-get install  g++
 sudo apt-get install  automake


安装Leptonica:

$wget http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz

$tar zxvf leptonica-1.69.tar.gz


cd到其目录下:

./configure && make && sudo make install


安装 Tesseract:

$wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

$tar zxvf tesseract-ocr-3.02.02.tar.gz

 

cd到其目录下:

./configure && make && sudo make install

Install 后 需要 sudo ldconfig 

使用训练包的话需要先安装英文包

设置 TESSDATA_PREFIX 语言包所在的目录(语言包在Win下训练好后直接导入tessdata目录下即可)

export TESSDATA_PREFIX=/usr/tesseract-ocr/


2.训练样本

参考:http://blog.csdn.net/yasi_xi/article/details/8763385

          http://blog.csdn.net/marvinhong/article/details/8459591

需要注意的是最后五个包的重命名

Linux Tesseract-OCR安装与训练样本,布布扣,bubuko.com

Linux Tesseract-OCR安装与训练样本

标签:style   blog   http   java   color   使用   

原文地址:http://my.oschina.net/u/1450520/blog/290593

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!