码迷,mamicode.com
首页 > 编程语言 > 详细

利用Python进行简单的图像识别(验证码)

时间:2017-02-09 10:55:52      阅读:222      评论:0      收藏:0      [点我收藏+]

标签:text   document   ica   下载   img   配置   window   style   http   

这是一个最简单的图像识别,将图片加载后直接利用Python的一个识别引擎进行识别
将图片中的数字通过 pytesseract.image_to_string(image)识别后将结果存入到本地的txt文件中
 1 #-*-encoding:utf-8-*-
 2 import pytesseract
 3 from PIL import Image
 4 
 5 class GetImageDate(object):
 6     def m(self):
 7         image = Image.open(u"C:\\a.png")
 8         text = pytesseract.image_to_string(image)
 9         return text
10 
11     def SaveResultToDocument(self):
12         text = self.m()
13         f = open(u"C:\\Verification.txt","w")
14         print text
15         f.write(str(text))
16         f.close()
17 
18 g = GetImageDate()
19 g.SaveResultToDocument()
 
具体想要实现上面的代码需要安装两个包和一个引擎
在安装之前需要先安装好Python,pip并配置好环境变量
所有包的安装都是通过pip来安装的,需要在windows PowerShell中进行,并且是在 C:\Python27\Scripts目录下
1.第一个包: pytesseract
pip install pytesseract
若是出现安装错误的情况,安装不了的时候,可以将命令改为 pip.exe install pytesseract来安装
若是将pip修改为pip.exe安装成功后,那么下文的所有pip都需要改为pip.exe
2.第二个包:PIL安装
pip install PIL
若是失败了可以如下修改 pip install PILLOW
3.安装识别引擎tesseract-ocr
下载 tesseract-ocr,进行默认安装
安装完成后需要配置环境变量,在系统变量path后增加 tesseract-ocr的安装地址C:\Program Files (x86)\Tesseract-OCR;
一切都安装完成后运行上述代码,会发现报错,此时需要
 技术分享
至此结束

利用Python进行简单的图像识别(验证码)

标签:text   document   ica   下载   img   配置   window   style   http   

原文地址:http://www.cnblogs.com/tanghuang/p/6380588.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!