百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

OCR图片预处理之去除印章(一)

ztj100 2024-12-12 16:13 12 浏览 0 评论

导读

在做OCR票据类识别的时候经常会遇到一些票据上会有印章,而对于的文字检测文字识别模型而言,印章的存在一定会影响模型识别的准确率,所以通常我们都是先将图片去除印章之后,再将图片送入到文字检测和文字识别模型中。

本篇文章就介绍一个比较简单的方法用来去除红色印章

移除红色印章

我们通过分离图片的通道提取图片的红色通道,然后再通过阈值来去除红色的印章

import cv2
import numpy as np


def remove_red_seal(input_img):
    # 分离图片的通道
    blue_c, green_c, red_c = cv2.split(input_img)
    #利用大津法自动选择阈值
    thresh, ret = cv2.threshold(red_c, 0, 255,cv2.THRESH_OTSU)
    #对阈值进行调整
    filter_condition = int(thresh * 0.90)
    #移除红色的印章
    _, red_thresh = cv2.threshold(red_c, filter_condition, 255, cv2.THRESH_BINARY)
    # 把图片转回3通道
    result_img = np.expand_dims(red_thresh, axis=2)
    result_img = np.concatenate((result_img, result_img, result_img), axis=-1)

    return result_img

input_img = cv2.imread("1.jpg")
remove_seal = remove_red_seal(input_img)
cv2.imwrite("remove_seal.jpg",remove_seal)

注意:对于不同的场景,你可能需要对阈值进行微调(百分比),以获取你认为的最佳阈值,百分比越小红色印章移除的越干净,同时也有可能会移除部分文字信息。

threshold函数

threshold(src, thresh, maxval, type[, dst])->ret,dst

  • src::灰度图或单通道图片
  • thresh:阈值
  • maxval:最大值
  • type:阈值类型

这里重点介绍一下type参数的取值,它的取值如下图所示

在对图片做二值化处理的时候需要设置一个阈值来对图片进行二值化处理,然而在部分复杂的场景下,如果采用固定的阈值可能在某些场景下效果不错,换到有些场景时效果就不行了。

这时候我们就会想要用自动的阈值,这时候就可以用到THRESH_OTSUTHRESH_TRIANGLE这两个参数,它们会根据图片的灰度直方图来计算出一个阈值将图片分为前景和背景,下面我们来介绍一下它们是如何实现的。

THRESH_OTSU

大津法(OTSU):也被称为是最大类间差法,被认为是图像分割阈值选择的最佳算法,计算简单,鲁棒性较好,不受图像亮度和和对比度的影响,因此在数字图像处理中被广泛的使用。

它根据图像的灰度直方图,将图像分为前景背景两个部分。因为方差是度量图像灰度分布是否均匀,如果图像的背景和前景之间的差别越大,那么它们之间的类间方差差距也会越大。所以,如果我们能够保证图像前景和背景的灰度直方图方差差距最大时,就能让前景和背景分离的效果达到最佳,实际效果还是取决于具体的场景,可能需要根据不同的需求对阈值进行微调。

  • 公式推导

其实只要抓住大津法的核心思想最大化前景和背景的方差要推导公式用代码来实现并不难,接下来我们来推导一下这个公式。

假设灰度T是图像分割前景和背景的最佳阈值,图像上任意一点属于前景的概率为ω1,属于背景的概率为ω2。图像前景的平均灰度值为μ1?,背景的平均灰度值为μ2?,所以图像的平均灰度值μ为

根据类间的方差计算公式,前景和背景的类间方差计算如下

因为

结合上面3个式子可得

为了方便我们后面编程来实现,还需要对上式做一些调整,这里引入几个参数pi表示灰度值等于i的概率,图像的灰度取值在[ 0 , 255 ] 范围内取整数。假设灰度值t可以使图像前景和背景的方差最大,m1?为灰度级t tt的累加均值,m为图像的灰度级L的均值累加

可得μ1和μ2

接下来我们对δ2 结合上面的式子做个变换

我们只需要使上式最大化即可

  • 代码实现OTSU

上面我们推导了大津法的公式,以及如何来求解阈值划分前景和背景,下面我们用python来实现这个算法

比较一下我们自己实现的大津法opencv内置的函数

最终两者输出的阈值都是160,不过python实现的代码是opencv时间的25倍左右,所以python在这方面对比c确实是硬伤。

THRESH_TRIANGLE

三角法(TRIANGLE):是基于直方图利用几何的方法来求分割的最佳阈值,假设的成立条件是直方图的最大波峰在靠近最亮的一侧,然后再通过三角形来求解最大的距离找到最佳阈值。

如图所示,在灰度直方图上,从最高峰bmax?到最暗对应直方图的bmin?构造一条直线,然后从bmin ?到bmax?开始计算到直线的垂直距离d,当d达到最大时,此时所对应的灰度值t就是分割图像的最佳阈值

接下来我们看看,使用三角法求解阈值值的整个流程,这里引入两个参数灰度级L和频率f:

  1. 将图片转换为灰度图,通过OpenCV可以很容易实现
  2. 计算灰度图的灰度直方图,也就是每个灰度级L对应的频率f
  3. 对灰度直方图进行排序,按灰度级进行排序,由小到大
  4. 确定直方图最大值(也就是f)所对应灰度级L的位置,如果在左侧(灰度值小)就需要对灰度直方图进行翻转
  5. 根据左侧边界的灰度级点( Lmin , fmin)和最亮部分频率最大对应的灰度级点( Lmax , fmax) ,由两点式我们可以确定这条直线
  6. 计算Lmin?到Lmax?的任意一点(L, f )到直线的距离d,当d最大时所对应的L就是我们要求的最佳阈值
  • 代码实现

大津法和三角法的对比

  • 共同点:两者都是算法自动计算出阈值,不需要指定阈值
  • 不同点:大津法适合双波峰的灰度直方图,三角法适合单波峰的灰度直方图

opencv显示灰度直方图

参考:

  1. https://blog.csdn.net/weixin_40647819/article/details/90179953
  2. https://www.cnblogs.com/ZFJ1094038955/p/12027836.html
  3. https://blog.csdn.net/qq_45769063/article/details/107102117

相关推荐

使用Python编写Ping监测程序(python 测验)

Ping是一种常用的网络诊断工具,它可以测试两台计算机之间的连通性;如果您需要监测某个IP地址的连通情况,可以使用Python编写一个Ping监测程序;本文将介绍如何使用Python编写Ping监测程...

批量ping!有了这个小工具,python再也香不了一点

号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部下午好,我的网工朋友。在咱们网工的日常工作中,经常需要检测多个IP地址的连通性。不知道你是否也有这样的经历:对着电脑屏...

python之ping主机(python获取ping结果)

#coding=utf-8frompythonpingimportpingforiinrange(100,255):ip='192.168.1.'+...

网站安全提速秘籍!Nginx配置HTTPS+反向代理实战指南

太好了,你直接问到重点场景了:Nginx+HTTPS+反向代理,这个组合是现代Web架构中最常见的一种部署方式。咱们就从理论原理→实操配置→常见问题排查→高级玩法一层层剖开说,...

Vue开发中使用iframe(vue 使用iframe)

内容:iframe全屏显示...

Vue3项目实践-第五篇(改造登录页-Axios模拟请求数据)

本文将介绍以下内容:项目中的public目录和访问静态资源文件的方法使用json文件代替http模拟请求使用Axios直接访问json文件改造登录页,配合Axios进行登录请求,并...

Vue基础四——Vue-router配置子路由

我们上节课初步了解Vue-router的初步知识,也学会了基本的跳转,那我们这节课学习一下子菜单的路由方式,也叫子路由。子路由的情况一般用在一个页面有他的基础模版,然后它下面的页面都隶属于这个模版,只...

Vue3.0权限管理实现流程【实践】(vue权限管理系统教程)

作者:lxcan转发链接:https://segmentfault.com/a/1190000022431839一、整体思路...

swiper在vue中正确的使用方法(vue中如何使用swiper)

swiper是网页中非常强大的一款轮播插件,说是轮播插件都不恰当,因为它能做的事情太多了,swiper在vue下也是能用的,需要依赖专门的vue-swiper插件,因为vue是没有操作dom的逻辑的,...

Vue怎么实现权限管理?控制到按钮级别的权限怎么做?

在Vue项目中实现权限管理,尤其是控制到按钮级别的权限控制,通常包括以下几个方面:一、权限管理的层级划分...

【Vue3】保姆级毫无废话的进阶到实战教程 - 01

作为一个React、Vue双修选手,在Vue3逐渐稳定下来之后,是时候摸摸Vue3了。Vue3的变化不可谓不大,所以,本系列主要通过对Vue3中的一些BigChanges做...

Vue3开发极简入门(13):编程式导航路由

前面几节文章,写的都是配置路由。但是在实际项目中,下面这种路由导航的写法才是最常用的:比如登录页面,服务端校验成功后,跳转至系统功能页面;通过浏览器输入URL直接进入系统功能页面后,读取本地存储的To...

vue路由同页面重定向(vue路由重定向到外部url)

在Vue中,可以使用路由的重定向功能来实现同页面的重定向。首先,在路由配置文件(通常是`router/index.js`)中,定义一个新的路由,用于重定向到同一个页面。例如,我们可以定义一个名为`Re...

那个 Vue 的路由,路由是干什么用的?

在Vue里,路由就像“页面导航的指挥官”,专门负责管理页面(组件)的切换和显示逻辑。简单来说,它能让单页应用(SPA)像多页应用一样实现“不同URL对应不同页面”的效果,但整个过程不会刷新网页。一、路...

Vue3项目投屏功能开发!(vue投票功能)

最近接了个大屏项目,产品想在不同的显示器上展示大屏项目不同的页面,做出来的效果图大概长这样...

取消回复欢迎 发表评论: