码迷,mamicode.com
首页 > 其他好文 > 详细

读取图片中文字的方法

时间:2021-06-02 20:08:18      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:htm   安装路径   post   toolbar   图片   下载   class   lib   pil   

 

需要安装的依赖包:PIL  Pytesseract

1、安装包

PIL 就是pillow包,直接找到对应的whl包安装(https://www.lfd.uci.edu/~gohlke/pythonlibs/)

  注意:pillow是用于替代PIL的,所以在实际使用中需要import PIL而不是pillow

Pytesseract 直接pip安装

  注意:Pytesseract安装后不能直接使用,还需要安装Tesseract-OCR

Tesseract-OCR下载地址:https://digi.bib.uni-mannheim.de/tesseract/

             安装Tesseract-OCR后记录安装路径:D:/Download/tesseract/tesseract.exe

                  在Pytesseract的源码中修改

      源码路径:D:\Download\Anaconda\Lib\site-packages\pytesseract(我的Anaconda是安装在D:\Download文件夹中)

      修改文件pytesseract.py(将下面一行的内容修改为上面一行):

        tesseract_cmd = r‘D:/Download/tesseract/tesseract.exe‘

        # tesseract_cmd = ‘tesseract‘

 

2、直接读取图片中的文字

技术图片
from PIL import Image
import pytesseract

im = Image.open(‘001.png‘)
text = pytesseract.image_to_string(im)
print(text)
技术图片

注意:如果图片中有中文还需要下载中文库放在Tesseract-OCR的安装目录的tessdata 文件夹下

读取图片中文字的方法

标签:htm   安装路径   post   toolbar   图片   下载   class   lib   pil   

原文地址:https://www.cnblogs.com/yxyi/p/14837671.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!