https://github.com/tesseract-ocr/tesseract/wiki/Compiling
找到该标题:Develop Tesseract
按照上面的步骤执行即可,最后使用 vs2015 打开 sln 工程文件,编译。
编译过程中,会报一些错,把报错的文件编码格式更改 gbk 的即可。
然后下载数据文件
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
这里就下载英文和中文,
eng.traineddata
chi_sim.traineddata
使用命令行工具测试控制台程序是否运行正常
tesseract.exe 图片路径 结果保存路径 语言设置
例子:
tesseract.exe c:\img200W.jpg c:\result.txt -l eng+chi_sim