标签:
安装Tesseract-OCR
1. leptonica 需要源码编译安装http://www.leptonica.org/
leptonica 包: leptonica-1.73.tar.gz
解压后切换到leptonica-1.68 根目录
./configure
make
make install
2.tesseract安装:
依赖安装完毕后开始安装tesseract
下载tesseract-3.01 安装包: http://tesseract-ocr.googlecode.com/files/tesseract-3.01.tar.gz
解压后切换到tesseract-3.01 根目录
(如果在make时遇到类似strngs.h:1: error: stray ‘\357‘ in program 的错误,请将tesseract-3.01/ccutil/strngs.h 文件转为ANSI 编码保存,再重新编译)
./autogen.sh
./configure
make
make install
ldconfig
tesseract英文语言包安装:
下载tesseract-3.01 英文语言包: http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.01.eng.tar.gz
sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata/
测试一下:
切换到解压后的tesseract-3.01 根目录(这个目录下有一个自带的phototest.tif 可以做测试用)
tesseract phototest.tif phototest -l eng
输出:1
这时应该在当前目录生成一个phototest.txt 文本文件,内容就是phototest.tif 显示的文字.
标签:
原文地址:http://www.cnblogs.com/timdes/p/5330602.html