百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

EasyOCR怎么直接识别requests返回的二进制图片

ztj100 2025-07-08 00:24 3 浏览 0 评论

有时候我们在处理页面返回的二进制图片数据时,不想先把图片保持在本地文件,在对本地文件进行识别,而是直接对数据进行识别,这时可以采取以下方法:

import easyocr

import io

reader = easyocr.Reader(['ch_sim', 'en']) # 指定语言

res = your_image_bytes # 比如某个图片的二进制数据

text = reader.readtext(io.BytesIO(res))

print(text[0][1])

可是有个问题,比如有些网页动态生成的验证码,它并不是纯图片,而可能是一个html,此时如果直接使用以上方法是不可以的,还会报错。这种情况就需要对数据进行转换,方法如下:

from PIL import Image

import numpy as np

import easyocr

img = Image.open(img_data).convert('RGB')

img_np = np.array(img)

reader = easyocr.Reader(['en'])

results = reader.readtext(

img_np, allowlist='0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

)

print(results[0][1])

如果还不行可以试着把RGB转成BGR格式,如下:

from PIL import Image

import numpy as np

import cv2

import easyocr

# 读取图片(PIL)

img = Image.open(img_data).convert('RGB')

# 转成 numpy array

img_np = np.array(img)

# RGB 转 BGR

img_bgr = cv2.cvtColor(img_np, cv2.COLOR_RGB2BGR)

# 以上两句代码还可以替换成:img_bgr = np.array(img)[:, :, ::-1]

reader = easyocr.Reader(['en'])

results = reader.readtext(

img_bgr, allowlist='0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

)

print(results[0][1])

相关推荐

能量空间物质相互转化途径(能量与空间转换相对论公式)

代码实现<!DOCTYPEhtml><htmllang="zh"><head>...

从零开始的Flex布局掌握(flex布局实战)

前言在现代网页设计中,布局是一个至关重要的环节,在过去的一段时间里,页面的布局还都是通过table...

flex布局在css中的使用,一看就会!

1.认识flex布局我们在写前端页面的时候可能会遇到这样的问题:同样的一个页面在1920x1080的大屏幕中显示正常,但是在1366x768的小屏幕中却显示的非常凌乱。...

前端入门——弹性布局(Flex)(web前端弹性布局)

前言在css3Flex技术出现之前制作网页大多使用浮动(float)、定位(position)以及显示(display)来布局页面,随着互联网快速发展,移动互联网的到来,已无法满足需求,它对于那些...

CSS Flex 容器完整指南(css flex-shrink)

概述CSSFlexbox是现代网页布局的强大工具。本文详细介绍用于flex容器的CSS属性:...

Centos 7 network.service 启动失败

执行systemctlrestartnetwork重启网络报如下错误:Jobfornetwork.servicefailedbecausethecontrolprocessex...

CentOS7 执行systemctl start iptables 报错:...: Unit not found.

#CentOS7执行systemctlstartiptables报错:Failedtostartiptables.service:Unitnotfound.在CentOS7中...

systemd入门6:journalctl的详细介绍

该来的总会来的,逃是逃不掉的。话不多说,man起来:manjournalctl洋洋洒洒几百字的描述,是说journalctl是用来查询systemd日志的,这些日志都是systemd-journa...

Linux上的Systemctl命令(systemctl命令详解)

LinuxSystemctl是一个系统管理守护进程、工具和库的集合,用于取代SystemV、service和chkconfig命令,初始进程主要负责控制systemd系统和服务管理器。通过Syste...

如何使用 systemctl 管理服务(systemctl添加服务)

systemd是一个服务管理器,目前已经成为Linux发行版的新标准。它使管理服务器变得更加容易。了解并利用组成systemd的工具将有助于我们更好地理解它提供的便利性。systemctl的由来...

内蒙古2024一分一段表(文理)(内蒙古考生2020一分一段表)

分数位次省份...

2016四川高考本科分数段人数统计,看看你有多少竞争对手

昨天,四川高考成绩出炉,全省共220,196人上线本科,相信每个考生都查到了自己的成绩。而我们都清楚多考1分就能多赶超数百人,那你是否知道,和你的分数一样的人全省有几个人?你知道挡在你前面的有多少人?...

难怪最近电脑卡爆了,微软确认Win11资源管理器严重BUG

近期,Win11操作系统的用户普遍遭遇到了一个令人头大的问题:电脑卡顿,CPU占用率异常增高。而出现该现象的原因竟然与微软最近的一次补丁更新有关。据报道,微软已经确认,问题源于Win11资源管...

微软推送Win11正式版22621.1702(KB5026372)更新

IT之家5月10日消息,微软今天推送了最新的Win11系统更新,21H2正式版通道推送了KB5026368补丁,版本号升至22000.1936,22H2版本推送了KB50263...

骗子AI换脸冒充亲戚,女子转账10万元后才发现异常……

“今天全靠你们,不然我这被骗的10万元肯定就石沉大海了。”7月19日,家住石马河的唐女士遭遇了“AI”换脸诈骗,幸好她报警及时,民警对其转账给骗子的钱成功进行止付。当天13时许,唐女士收到一条自称是亲...

取消回复欢迎 发表评论: