使用Python,几行代码实现OCR图片识别,附测试图片和识别效果
创始人
2024-03-30 05:12:10

目录

1.具体如何做呢?

1.1安装Tesseract-OCR

1.2配置环境

1.3安装Tesseract中文包

1.4.安装pytesseract和pillow

2.代码和测试效果

2.1识别英文图片

2.2 识别中文图片


1.具体如何做呢?

1.1安装Tesseract-OCR

windows安装包下载地址:https://github.com/UB-Mannheim/tesseract/wiki

下载的文件名为tesseract-ocr-w64-setup-v5.2.0.20220712.exe

右击管理员运行tesseract-ocr-w64-setup-v5.2.0.20220712.exe

1.2配置环境

1.3安装Tesseract中文包

下载地址和如何安装,见另外一篇分享文章

Tesseract最新中文语言包chi_sim.traineddata(4.0.0)三种获取方式_秋9的博客-CSDN博客

1.4.安装pytesseract和pillow

pip install pytesseract 和pip install pillow

具体操作如下:

D:\1\ocr>pip install pytesseract
Collecting pytesseractDownloading pytesseract-0.3.10-py3-none-any.whl (14 kB)
Requirement already satisfied: Pillow>=8.0.0 in d:\python\python381\lib\site-packages (from pytesseract) (9.2.0)
Collecting packaging>=21.3Downloading packaging-21.3-py3-none-any.whl (40 kB)|████████████████████████████████| 40 kB 123 kB/s
Requirement already satisfied: pyparsing!=3.0.5,>=2.0.2 in d:\python\python381\lib\site-packages (from packaging>=21.3->pytesseract) (2.4.7)
Installing collected packages: packaging, pytesseractAttempting uninstall: packagingFound existing installation: packaging 21.0Uninstalling packaging-21.0:Successfully uninstalled packaging-21.0
Successfully installed packaging-21.3 pytesseract-0.3.10
WARNING: You are using pip version 21.0.1; however, version 22.3 is available.
You should consider upgrading via the 'd:\python\python381\python.exe -m pip install --upgrade pip' command.D:\1\ocr>pip install pillow
Requirement already satisfied: pillow in d:\python\python381\lib\site-packages (9.2.0)
WARNING: You are using pip version 21.0.1; however, version 22.3 is available.
You should consider upgrading via the 'd:\python\python381\python.exe -m pip install --upgrade pip' command.D:\1\ocr>

2.代码和测试效果

2.1识别英文图片

代码如下:

from PIL import Image
import pytesseract
path="test2.png"
im=Image.open(path)
text=pytesseract.image_to_string(im)
print(text)

test2.png图片如下:

识别效果:

结论:只有第1个字母识别错误

2.2 识别中文图片

代码如下:

from PIL import Image
import pytesseract
path="test4.png"
im=Image.open(path)
text=pytesseract.image_to_string(im,lang='chi_sim')
print(text)

test4.png图片如下:

识别效果:

中文识别效果比较差。

欢迎小伙伴们,留言讨论

相关内容

热门资讯

埃菲尔铁塔在哪 中国仿建埃菲尔... 2019年4月26日,广西南宁市,街头惊现一座巨型山寨版埃菲尔铁塔,高约20米,白色塔身,造型逼真,...
苗族的传统节日 贵州苗族节日有... 【岜沙苗族芦笙节】岜沙,苗语叫“分送”,距从江县城7.5公里,是世界上最崇拜树木并以树为神的枪手部落...
北京的名胜古迹 北京最著名的景... 北京从元代开始,逐渐走上帝国首都的道路,先是成为大辽朝五大首都之一的南京城,随着金灭辽,金代从海陵王...
长白山自助游攻略 吉林长白山游... 昨天介绍了西坡的景点详细请看链接:一个人的旅行,据说能看到长白山天池全凭运气,您的运气如何?今日介绍...
世界上最漂亮的人 世界上最漂亮... 此前在某网上,选出了全球265万颜值姣好的女性。从这些数量庞大的女性群体中,人们投票选出了心目中最美...
应用未安装解决办法 平板应用未... ---IT小技术,每天Get一个小技能!一、前言描述苹果IPad2居然不能安装怎么办?与此IPad不...
脚上的穴位图 脚面经络图对应的... 人体穴位作用图解大全更清晰直观的标注了各个人体穴位的作用,包括头部穴位图、胸部穴位图、背部穴位图、胳...
猫咪吃了塑料袋怎么办 猫咪误食... 你知道吗?塑料袋放久了会长猫哦!要说猫咪对塑料袋的喜爱程度完完全全可以媲美纸箱家里只要一有塑料袋的响...
demo什么意思 demo版本... 618快到了,各位的小金库大概也在准备开闸放水了吧。没有小金库的,也该向老婆撒娇卖萌服个软了,一切只...
埃菲尔铁塔在哪 中国仿建埃菲尔... 2019年4月26日,广西南宁市,街头惊现一座巨型山寨版埃菲尔铁塔,高约20米,白色塔身,造型逼真,...
苗族的传统节日 贵州苗族节日有... 【岜沙苗族芦笙节】岜沙,苗语叫“分送”,距从江县城7.5公里,是世界上最崇拜树木并以树为神的枪手部落...
北京的名胜古迹 北京最著名的景... 北京从元代开始,逐渐走上帝国首都的道路,先是成为大辽朝五大首都之一的南京城,随着金灭辽,金代从海陵王...
世界上最漂亮的人 世界上最漂亮... 此前在某网上,选出了全球265万颜值姣好的女性。从这些数量庞大的女性群体中,人们投票选出了心目中最美...
长白山自助游攻略 吉林长白山游... 昨天介绍了西坡的景点详细请看链接:一个人的旅行,据说能看到长白山天池全凭运气,您的运气如何?今日介绍...
应用未安装解决办法 平板应用未... ---IT小技术,每天Get一个小技能!一、前言描述苹果IPad2居然不能安装怎么办?与此IPad不...
脚上的穴位图 脚面经络图对应的... 人体穴位作用图解大全更清晰直观的标注了各个人体穴位的作用,包括头部穴位图、胸部穴位图、背部穴位图、胳...
猫咪吃了塑料袋怎么办 猫咪误食... 你知道吗?塑料袋放久了会长猫哦!要说猫咪对塑料袋的喜爱程度完完全全可以媲美纸箱家里只要一有塑料袋的响...
demo什么意思 demo版本... 618快到了,各位的小金库大概也在准备开闸放水了吧。没有小金库的,也该向老婆撒娇卖萌服个软了,一切只...