需要安装的依赖包:PIL Pytesseract
1、安装包
PIL 就是pillow包,直接找到对应的whl包安装(https://www.lfd.uci.edu/~gohlke/pythonlibs/)
注意:pillow是用于替代PIL的,所以在实际使用中需要import PIL而不是pillow
Pytesseract 直接pip安装
注意:Pytesseract安装后不能直接使用,还需要安装Tesseract-OCR
Tesseract-OCR下载地址:https://digi.bib.uni-mannheim.de/tesseract/
安装Tesseract-OCR后记录安装路径:D:/Download/tesseract/tesseract.exe
在Pytesseract的源码中修改
源码路径:D:\Download\Anaconda\Lib\site-packages\pytesseract(我的Anaconda是安装在D:\Download文件夹中)
修改文件pytesseract.py(将下面一行的内容修改为上面一行):
tesseract_cmd = r‘D:/Download/tesseract/tesseract.exe‘
# tesseract_cmd = ‘tesseract‘
2、直接读取图片中的文字
from PIL import Image import pytesseract im = Image.open(‘001.png‘) text = pytesseract.image_to_string(im) print(text)
注意:如果图片中有中文还需要下载中文库放在Tesseract-OCR的安装目录的tessdata 文件夹下