百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

基于python计算缺口滑块验证码所需滑动距离

ztj100 2024-11-27 23:33 21 浏览 0 评论

导读:笔者之前是依靠打码平台计算缺口滑块验证码距离,由于平台不太稳定因此最近打算自己实现一个距离计算服务。在网上一阵探索后发现了一个采用 python 的解决方案识别成功率很高,这里做下分享希望对各位有所帮助。

代码实现

基于 python 同时借助强大的 OpenCV(计算机视觉库)、numpy 等库实现。笔者再借助 Flask(一个使用 Python 编写的轻量级 Web 应用框架)将其封装为一个简单的 Web 服务使其功能能够跨语言使用。

from flask import Flask, request, jsonify
import json
import cv2 
import numpy as np
import pandas as pd
import math

app = Flask(__name__)
app.debug = True

# x方向一阶导中值
def get_dx_median(dx, x, y, w, h):
    return np.median(dx[y:(y + h), x])

# 预处理
def pre_process(img_path):
    img = cv2.imread(img_path, 1)  # 从指定的文件中加载图像并返回,1 为彩色图像

    img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  # 转成灰度图像

    _, binary = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)  # 将灰度图像转成二值图像

    contours, hierarchy = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)  # 查找轮廓

    rect_area = []
    rect_arc_length = []
    cnt_infos = {}

    for i, cnt in enumerate(contours):
        if cv2.contourArea(cnt) < 5000 or cv2.contourArea(cnt) > 25000:
            continue

        x, y, w, h = cv2.boundingRect(cnt)
        cnt_infos[i] = {'rect_area': w * h,  # 矩形面积
                        'rect_arclength': 2 * (w + h),  # 矩形周长
                        'cnt_area': cv2.contourArea(cnt),  # 轮廓面积
                        'cnt_arclength': cv2.arcLength(cnt, True),  # 轮廓周长
                        'cnt': cnt,  # 轮廓
                        'w': w,
                        'h': h,
                        'x': x,
                        'y': y,
                        'mean': np.mean(np.min(img[y:(y + h), x:(x + w)], axis=2)),  # 矩形内像素平均
                        }
        rect_area.append(w * h)
        rect_arc_length.append(2 * (w + h))
    dx = cv2.Sobel(img, -1, 1, 0, ksize=5)

    return img, dx, cnt_infos


# 计算移动的距离
def calculate_distance(img_path):
    img, dx, cnt_infos = pre_process(img_path)
    df = pd.DataFrame(cnt_infos).T
    df.head()
    df['dx_mean'] = df.apply(lambda x: get_dx_median(dx, x['x'], x['y'], x['w'], x['h']), axis=1)
    df['rect_ratio'] = df.apply(lambda v: v['rect_arclength'] / 4 / math.sqrt(v['rect_area'] + 1), axis=1)
    df['area_ratio'] = df.apply(lambda v: v['rect_area'] / v['cnt_area'], axis=1)
    df['score'] = df.apply(lambda x: abs(x['rect_ratio'] - 1), axis=1)

    result = df.query('x>0').query('area_ratio<2').query('rect_area>5000').query('rect_area<20000').sort_values(
        ['mean', 'score', 'dx_mean']).head(2)
    return result.x.values[0]

@app.route('/verification/', methods=['post'])
def add_stu():
    # 计算并将结果响应回去
    request_json = json.loads(request.data.decode('utf-8'))
    result = calculate_distance(request_json["image"])
    response = {
        'code': '0',
        'data': {
            "result" : result
        },
        'message': 'success'
    }
    return jsonify(response)

if __name__ == '__main__':
    app.run(host='localhost', port=9091)
    # 这里指定了地址和端口号。

注意:当执行 img = cv2.imread(img_path, 1) 这行代码时 img_path 图片路径中含有中文字符会导致获取不到图像。可通过修改图片存放路径为英文(最佳)或替换为以下代码解决:

img = cv2.imdecode(np.fromfile(img_path, dtype=np.uint8), cv2.IMREAD_COLOR) # 解决文件路径名带有中文的情况

Java 调用服务

@Test
    public void sliderTest() {
        Map<String, String> data = new HashMap<>();
        data.put("image", "G:\\verificaPic\\validate-big_2.png");
        try {
            String resultString = Jsoup.connect("http://localhost:9091/verification/")
                    .requestBody(JSON.toJSONString(data))
                    .header("Content-Type", "application/json")
                    .ignoreContentType(true).timeout(120000).post().text();
            JSONObject object = JSONObject.parseObject(resultString);
            System.out.println(object.getJSONObject("data").getString("result"));
        } catch (Exception e) {
            throw new RuntimeException("调用验证码图片识别服务发生异常!", e);
        }
    }

取得距离结果之后借助 selenium 实现模拟拖动滑块就可破解(这里需要注意不要一次性到位,而是要分多段滑动以防被检测到),由于网上有很多方案此处就不展开具体讨论了。

最后

参考:

https://github.com/godtoy/python-tecent-slider-crack

https://www.runoob.com/numpy/numpy-tutorial.html

感谢您的阅读,如果喜欢本文欢迎关注和转发,转载需注明出处,本头条号将持续分享IT技术知识。对于文章内容有其他想法或意见建议等,欢迎提出共同讨论共同进步。

相关推荐

sharding-jdbc实现`分库分表`与`读写分离`

一、前言本文将基于以下环境整合...

三分钟了解mysql中主键、外键、非空、唯一、默认约束是什么

在数据库中,数据表是数据库中最重要、最基本的操作对象,是数据存储的基本单位。数据表被定义为列的集合,数据在表中是按照行和列的格式来存储的。每一行代表一条唯一的记录,每一列代表记录中的一个域。...

MySQL8行级锁_mysql如何加行级锁

MySQL8行级锁版本:8.0.34基本概念...

mysql使用小技巧_mysql使用入门

1、MySQL中有许多很实用的函数,好好利用它们可以省去很多时间:group_concat()将取到的值用逗号连接,可以这么用:selectgroup_concat(distinctid)fr...

MySQL/MariaDB中如何支持全部的Unicode?

永远不要在MySQL中使用utf8,并且始终使用utf8mb4。utf8mb4介绍MySQL/MariaDB中,utf8字符集并不是对Unicode的真正实现,即不是真正的UTF-8编码,因...

聊聊 MySQL Server 可执行注释,你懂了吗?

前言MySQLServer当前支持如下3种注释风格:...

MySQL系列-源码编译安装(v5.7.34)

一、系统环境要求...

MySQL的锁就锁住我啦!与腾讯大佬的技术交谈,是我小看它了

对酒当歌,人生几何!朝朝暮暮,唯有己脱。苦苦寻觅找工作之间,殊不知今日之事乃我心之痛,难道是我不配拥有工作嘛。自面试后他所谓的等待都过去一段时日,可惜在下京东上的小金库都要见低啦。每每想到不由心中一...

MySQL字符问题_mysql中字符串的位置

中文写入乱码问题:我输入的中文编码是urf8的,建的库是urf8的,但是插入mysql总是乱码,一堆"???????????????????????"我用的是ibatis,终于找到原因了,我是这么解决...

深圳尚学堂:mysql基本sql语句大全(三)

数据开发-经典1.按姓氏笔画排序:Select*FromTableNameOrderByCustomerNameCollateChinese_PRC_Stroke_ci_as//从少...

MySQL进行行级锁的?一会next-key锁,一会间隙锁,一会记录锁?

大家好,是不是很多人都对MySQL加行级锁的规则搞的迷迷糊糊,一会是next-key锁,一会是间隙锁,一会又是记录锁。坦白说,确实还挺复杂的,但是好在我找点了点规律,也知道如何如何用命令分析加...

一文讲清怎么利用Python Django实现Excel数据表的导入导出功能

摘要:Python作为一门简单易学且功能强大的编程语言,广受程序员、数据分析师和AI工程师的青睐。本文系统讲解了如何使用Python的Django框架结合openpyxl库实现Excel...

用DataX实现两个MySQL实例间的数据同步

DataXDataX使用Java实现。如果可以实现数据库实例之间准实时的...

MySQL数据库知识_mysql数据库基础知识

MySQL是一种关系型数据库管理系统;那废话不多说,直接上自己以前学习整理文档:查看数据库命令:(1).查看存储过程状态:showprocedurestatus;(2).显示系统变量:show...

如何为MySQL中的JSON字段设置索引

背景MySQL在2015年中发布的5.7.8版本中首次引入了JSON数据类型。自此,它成了一种逃离严格列定义的方式,可以存储各种形状和大小的JSON文档,例如审计日志、配置信息、第三方数据包、用户自定...

取消回复欢迎 发表评论: