光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。OCR技术非常专业,一般多是印刷、打印行业的从业人员使用,可以快速的将纸质资料转换为电子资料。关于中文OCR,目前国内水平较高的有清华文通、...
分类:
其他好文 时间:
2014-12-04 11:57:12
阅读次数:
254
上一次我们讨论了Tesseract OCR引擎的用法,作为一款老牌的OCR引擎,目前已经开源,最新版本3.0中更是加入了中文OCR功能,再加上Google的更新、维护,可以说是潜力很大,值得期待。由上一次的测试结果也可以看出,Tesseract的OCR结果还不是很理想,尤其是中英文混合的文字,其识别...
分类:
其他好文 时间:
2014-12-04 11:32:11
阅读次数:
386
ReleaseNotesRelease Notes.UpdatedAug 12, 2014bytheraysm...@gmail.comIntroductionThis page keeps the most up-to-date release notes.Tesseract release no...
分类:
其他好文 时间:
2014-11-29 20:14:01
阅读次数:
474
Improving the quality of the outputThere are a variety of reasons you might not get good quality output from Tesseract. It's important to note that un...
分类:
其他好文 时间:
2014-11-29 20:11:25
阅读次数:
1587
ocr是一个宽泛的概念。市场上面ocr将一直是一个不断发展、需求强烈的方向。 我认为,从难度上区分,中文ocr难于英文ocr;手写ocr难于印刷ocr。所以两两组合,中文手写体最难(比如毛体,有一些人都识别不了);而英文(数字)印刷体ocr最简单,对于最简单的东西,我认为就可以直接使用tesser....
分类:
其他好文 时间:
2014-11-27 16:06:58
阅读次数:
271
发现一个网站注册时发送给手机的验证码可以直接在网站上展出出来,考虑可以使用LR与OCR结合尝试自动注册http://elearning.yunxuetang.cn/portal/enterpriseregister.htmTesseract-OCR 下载在code.google上下载tesserac...
分类:
其他好文 时间:
2014-11-26 18:48:19
阅读次数:
1619
研究Tesseract也有几个星期了 走了一些弯路 网上有很多VS2010的配置心得 但没有VS2013的, 找到一篇之后, 又发现会有一些小问题, 这里记录下来, 也为新人提供一些帮助....
分类:
其他好文 时间:
2014-11-10 12:08:21
阅读次数:
1689
光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。OCR技术非常专业,一般多是印刷、打印行业的从业人员使用,可以快速的将纸质资料转换为电子资料。关于中文OCR,目前国内水平较高的有清华文通、...
分类:
其他好文 时间:
2014-11-06 16:45:50
阅读次数:
307
刷票一般要突破以下限制:1、验证码识别2、同一ip不可连续投票解决办法1、用tesseract工具,链接在此 https://code.google.com/p/tesseract-ocr/(人人还是加不了https链接)2、使用代理,国内可以的代理服务器可以从这里找到http://cn-proxy...
分类:
编程语言 时间:
2014-10-18 14:00:50
阅读次数:
442
首先我得承认,关注tesseract-ocr, 是冲着下面这篇文章的噱头去的,26行groovy代码破解网站验证码http://www.kellyrob99.com/blog/2010/03/14/breaking-weak-captcha-in-slightly-more-than-26-line...
分类:
Web程序 时间:
2014-10-13 13:52:29
阅读次数:
201