码迷,mamicode.com
首页 > 编程语言 > 详细

Python提取图片中的文字信息,腾讯内部技术,一行代码搞定!

时间:2018-07-10 21:29:29      阅读:432      评论:0      收藏:0      [点我收藏+]

标签:class   apt   还需   安装   python   ocr   png   效果   下载安装   

 

技术分享图片

 

用过手机QQ就知道,点击一个图片会弹出一个小功能,那就是提取图片中的文字。非常方便实用,那么很难实现吗?

利用Python提取图片中的文字信息,只需要一行代码就能搞定!

技术分享图片

 

当然,这是吹牛皮的,但是真正的Python代码也就第4行,说是一行代码搞定也没错。

示例:

技术分享图片

 

效果技术分享图片

技术分享图片

 

尽管运行Python代码后也有几个错误的地方,但是大部分是识别正确的。

技术分享图片

 

你以为就这样结束了吗?那这么简单,我都不用出教程了。一行代码实现这个功能当然也是要有前戏的。

技术分享图片

 

一,pytesseract和PIL的安装

pip安装

技术分享图片

 

2,pycharm编辑器能够快速安装,这就看你是否用pycharm了。

pycharm的Settings设置页按照下面步骤操作

技术分享图片

 

安装好了pytesseract,安装PIL在上面第三步里搜索PIL并点击安装就可以了。

技术分享图片

 

安装好了所有库,运行下面Python代码

技术分享图片

 

出现报错

技术分享图片

 

可以看到提示:未安装识别引擎tesseract-ocr

二,安装识别引擎tesseract-ocr

1.网上下载安装包,然后直接点击安装即可

因为tesseract-ocr默认不支持中文识别,所以解压安装tesseract-ocr后还需做如下操作

技术分享图片

 

2,安装完成tesseract-ocr后,我们还需配置好

技术分享图片

 

打开后做如下操作

技术分享图片

 

当然也能由pycharm快速打开pytesseract.py

第一步:

技术分享图片

 

第二步:

技术分享图片

 

第三步:

技术分享图片

 

现在已经完成了所有配置,运行下面Python代码即可实现图片里的文字提取

技术分享图片

 

本文到此就结束了,希望各位Python越学越好,早日达成梦想。

Python提取图片中的文字信息,腾讯内部技术,一行代码搞定!

标签:class   apt   还需   安装   python   ocr   png   效果   下载安装   

原文地址:https://www.cnblogs.com/q1613161916/p/9291197.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!