如何使用OpenCV 库 Haar 级联分类器进行人脸检测
ztj100 2024-10-30 05:12 33 浏览 0 评论
OpenCV 中的 Haar 级联分类器是一种基于 Haar 特征的目标检测方法,常用于人脸检测、眼睛检测等任务。
- Haar 特征:Haar 特征是一种简单的矩形特征,用于描述图像中的局部区域。这些特征通过计算矩形区域内的像素值之和的差异来表示图像的特定模式。例如,一个常见的 Haar 特征是计算一个矩形区域内的像素值之和与另一个矩形区域内的像素值之和的差异,用于检测图像中的边缘或线条。
- 级联分类器:级联分类器是由多个弱分类器组成的强分类器。在 Haar 级联分类器中,每个弱分类器是一个基于 Haar 特征的简单决策树。这些弱分类器按照一定的顺序组合在一起,形成一个级联结构。在检测过程中,图像首先通过第一个弱分类器进行检测。如果图像被判定为不包含目标,则直接拒绝,不再进行后续的检测。如果图像通过了第一个弱分类器,则继续通过下一个弱分类器进行检测。这个过程一直持续到最后一个弱分类器,如果图像通过了所有的弱分类器,则被判定为包含目标。
以下是使用分类器进行人像识别的一般步骤:
一、准备工作
- 安装所需库:确保已经安装了 OpenCV 库,它提供了很多用于计算机视觉任务的工具和函数,包括使用分类器进行人像识别。可以使用 pip install opencv-python 进行安装。
- 选择合适的分类器:OpenCV 提供了一些预训练的 Haar 级联分类器,用于人脸检测。常见的有 haarcascade_frontalface_default.xml 等,可以根据具体需求选择合适的分类器文件。
二、加载分类器
import cv2
# 加载人脸分类器
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
这里使用 cv2.CascadeClassifier 类加载了人脸检测分类器,用户可以根据不同的需求加载不同的分类器,在安装opencv-python模块后,这些分类器文件就有了,需要把位置添加一下。
OpenCV 中预训练的 Haar 级联分类器文件,用于不同对象的检测,具体用途如下:
- haarcascade_eye.xml:用于检测眼睛。
- haarcascade_eye_tree_eyeglasses.xml:可能用于检测戴眼镜的眼睛,树状结构的分类器可能在准确性和效率上有一定优势。
- haarcascade_frontalcatface.xml和haarcascade_frontalcatface_extended.xml:用于检测猫的正面脸部。
- haarcascade_frontalface_alt.xml、haarcascade_frontalface_alt2.xml、haarcascade_frontalface_alt_tree.xml、haarcascade_frontalface_default.xml:用于检测人的正面脸部,不同的版本可能在检测准确率、速度和对不同场景的适应性上有所不同。
- haarcascade_fullbody.xml:用于检测全身。
- haarcascade_lefteye_2splits.xml和haarcascade_righteye_2splits.xml:分别用于检测左眼和右眼,可能采用了特定的分割方法提高检测效果。
- haarcascade_license_plate_rus_16stages.xml和haarcascade_russian_plate_number.xml:用于检测俄罗斯车牌号码。
- haarcascade_lowerbody.xml:用于检测下半身。
- haarcascade_profileface.xml:用于检测侧面脸部。
- haarcascade_smile.xml:用于检测微笑。
- haarcascade_upperbody.xml:用于检测上半身。
三、读取图像或视频流
# 读取图像。这里假设要识别的人像在名为 image.jpg 的图像文件中。
img = cv2.imread('image.jpg')
#读取视频流:
# 打开摄像头,这里使用 cv2.VideoCapture 类打开摄像头(参数 0 表示默认摄像头),并在循环中逐帧读取视频流。
cap = cv2.VideoCapture(0)
while True:
ret, frame = cap.read()
# 如果无法读取帧,退出循环
if not ret:
break
四、进行人像检测
1.对于图像:
# 将图像转换为灰度图(大多数分类器在灰度图像上效果更好)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 检测人脸
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
首先将图像转换为灰度图,然后使用分类器的 detectMultiScale 方法在灰度图像上检测人脸。该方法的参数包括缩放因子 scaleFactor、最小邻居数 minNeighbors 和最小检测窗口大小 minSize 等,可以根据实际情况进行调整以获得更好的检测效果。
- 对于视频流:
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
对每一帧视频图像进行同样的灰度转换和人脸检测操作。
五、标记和显示人像
- 对于图像:
# 在图像上绘制人脸矩形框
for (x, y, w, h) in faces:
cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)
# 显示结果图像
cv2.imshow('Image', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
遍历检测到的人脸区域,在图像上绘制矩形框,并显示结果图像。
- 对于视频流:
# 在帧上绘制人脸矩形框
for (x, y, w, h) in faces:
cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2)
# 显示帧
cv2.imshow('Video', frame)
# 按下 'q' 键退出循环
if cv2.waitKey(1) & 0xFF == ord('q'):
break
# 释放摄像头并关闭窗口
cap.release()
cv2.destroyAllWindows()
在每一帧上绘制人脸矩形框,并显示视频。当用户按下 'q' 键时,退出循环,释放摄像头资源并关闭窗口。
六、完整代码
import cv2
# 一、加载人脸分类器
# 使用 cv2.CascadeClassifier 类加载预训练的人脸检测分类器文件
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
# 二、处理图像
def detect_faces_in_image(image_path):
# 1. 读取图像
img = cv2.imread(image_path)
# 2. 将图像转换为灰度图,因为大多数分类器在灰度图像上效果更好
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 3. 使用分类器检测人脸
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
# 4. 在图像上绘制人脸矩形框
for (x, y, w, h) in faces:
cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)
# 5. 显示结果图像
cv2.imshow('Image with Faces Detected', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
# 三、处理视频流
def detect_faces_in_video():
# 1. 打开摄像头,参数 0 表示默认摄像头
cap = cv2.VideoCapture(0)
while True:
# 2. 逐帧读取视频流
ret, frame = cap.read()
if not ret:
break
# 3. 将帧转换为灰度图
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 4. 使用分类器检测人脸
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
# 5. 在帧上绘制人脸矩形框
for (x, y, w, h) in faces:
cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2)
# 6. 显示帧
cv2.imshow('Video with Faces Detected', frame)
# 7. 按下 'q' 键退出循环
if cv2.waitKey(1) & 0xFF == ord('q'):
break
# 8. 释放摄像头资源并关闭窗口
cap.release()
cv2.destroyAllWindows()
# 四、测试
# 处理图像
image_path = 'test_image.jpg'
detect_faces_in_image(image_path)
# 处理视频流
detect_faces_in_video()
相关推荐
- 再说圆的面积-蒙特卡洛(蒙特卡洛方法求圆周率的matlab程序)
-
在微积分-圆的面积和周长(1)介绍微积分方法求解圆的面积,本文使用蒙特卡洛方法求解圆面积。...
- python创建分类器小结(pytorch分类数据集创建)
-
简介:分类是指利用数据的特性将其分成若干类型的过程。监督学习分类器就是用带标记的训练数据建立一个模型,然后对未知数据进行分类。...
- matplotlib——绘制散点图(matplotlib散点图颜色和图例)
-
绘制散点图不同条件(维度)之间的内在关联关系观察数据的离散聚合程度...
- python实现实时绘制数据(python如何绘制)
-
方法一importmatplotlib.pyplotaspltimportnumpyasnpimporttimefrommathimport*plt.ion()#...
- 简单学Python——matplotlib库3——绘制散点图
-
前面我们学习了用matplotlib绘制折线图,今天我们学习绘制散点图。其实简单的散点图与折线图的语法基本相同,只是作图函数由plot()变成了scatter()。下面就绘制一个散点图:import...
- 数据分析-相关性分析可视化(相关性分析数据处理)
-
前面介绍了相关性分析的原理、流程和常用的皮尔逊相关系数和斯皮尔曼相关系数,具体可以参考...
- 免费Python机器学习课程一:线性回归算法
-
学习线性回归的概念并从头开始在python中开发完整的线性回归算法最基本的机器学习算法必须是具有单个变量的线性回归算法。如今,可用的高级机器学习算法,库和技术如此之多,以至于线性回归似乎并不重要。但是...
- 用Python进行机器学习(2)之逻辑回归
-
前面介绍了线性回归,本次介绍的是逻辑回归。逻辑回归虽然名字里面带有“回归”两个字,但是它是一种分类算法,通常用于解决二分类问题,比如某个邮件是否是广告邮件,比如某个评价是否为正向的评价。逻辑回归也可以...
- 【Python机器学习系列】拟合和回归傻傻分不清?一文带你彻底搞懂
-
一、拟合和回归的区别拟合...
- 推荐2个十分好用的pandas数据探索分析神器
-
作者:俊欣来源:关于数据分析与可视化...
- 向量数据库:解锁大模型记忆的关键!选型指南+实战案例全解析
-
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在...
- 用Python进行机器学习(11)-主成分分析PCA
-
我们在机器学习中有时候需要处理很多个参数,但是这些参数有时候彼此之间是有着各种关系的,这个时候我们就会想:是否可以找到一种方式来降低参数的个数呢?这就是今天我们要介绍的主成分分析,英文是Princip...
- 神经网络基础深度解析:从感知机到反向传播
-
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在...
- Python实现基于机器学习的RFM模型
-
CDA数据分析师出品作者:CDALevelⅠ持证人岗位:数据分析师行业:大数据...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)