码迷,mamicode.com
首页 > 编程语言 > 详细

Python - PIL-pytesseract-tesseract验证码识别

时间:2017-09-29 01:37:25      阅读:244      评论:0      收藏:0      [点我收藏+]

标签:imu   color   yii   依赖   ring   line   验证码   from   -o   

N天前实现了简单的验证识别,这玩意以前都觉得是高大上的东西,一直没有去研究,这次花了点时间研究了一下,当然只是一些基础的东西,高深的我也不会,分享一下给大家吧。

关于python验证码识别库,网上主要介绍的为pytesser及pytesseract,其实pytesser的安装有一点点麻烦,所以这里我不考虑,直接使用后一种库。

要安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google的ocr识别引擎。

 

一、安装PIL

PIL : Pillow-3.3.0-cp27-cp27m-win_amd64.whl 或 Pillow-4.2.1.win-amd64-py2.7.exe
下载地址:https://pypi.python.org/pypi/Pillow/4.2.1
 
然后执行安装命令:
pip install Pillow-4.2.1-cp27-cp27m-win_amd64.whl
或是点击exe进行安装,一路下一步
 
二、安装Tesseract
 
介绍见链接
 
下载安装文件地址:http://jaist.dl.sourceforge.net/project/tesseract-ocr-alt/tesseract-ocr-setup-3.02.02.exe
  
安装过程如下(这是一个缓慢且会报错的过程):

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

 

三 、安装pytesseract

执行命令:

pip install pytesseract
 
技术分享

 

根据经验,安装成功后要重启计算机,要不然执行如下代码会报错。

import pytesseract
from PIL import Image
image=Image.open(new.jpg)
print image
vcode=pytesseract.image_to_string(image)
print vcode

 

new.jpg

技术分享

技术分享

 

 

 

 

 

 

Python - PIL-pytesseract-tesseract验证码识别

标签:imu   color   yii   依赖   ring   line   验证码   from   -o   

原文地址:http://www.cnblogs.com/BlueSkyyj/p/7609194.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!