机器视觉之人脸识别 机器视觉人脸识别实验报告
ztj100 2024-12-19 17:56 49 浏览 0 评论
上一期我们玩了下人脸检测,深感写得不好,这期好好写。
小枪换炮,我们一起来做人脸识别如何?
话不多说。。。
step 1 网络
人脸检测好了,如何知道是谁呢?首先搞个CNN分配器。
那学习下CNN的结构
一看图,别跑,乍一看就是把图像经过卷积输出一组数据 其实不就是基于深度网络的特征提取吗?那好了,最后的1024个特征全连接到几个人就OK了。
使用keras构建一个不就好了,照猫画虎 代码奉上:
model = Sequential()
model.add(Conv2D(32,kernel_size = (3,3), strides = (1,1), padding = 'same', input_shape = (114,114,3), activation = 'relu'))
model.add(MaxPooling2D(pool_size = (2,2)))
model.add(Dropout(0.25))
model.add(Conv2D(64,kernel_size = (3,3), strides = (1,1), padding = 'same', activation = 'relu'))
model.add(MaxPooling2D(pool_size = (2,2)))
model.add(Dropout(0.25))
model.add(Conv2D(128,kernel_size = (3,3), strides = (1,1), padding = 'same', activation = 'relu'))
model.add(MaxPooling2D(pool_size = (2,2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128,activation = 'relu'))
model.add(Dense(64,activation = 'relu'))
model.add(Dense(len(classes),activation = 'softmax'))
说明:
Sequential:序贯模型
序贯模型是函数式模型的简略版,为最简单的线性、从头到尾的结构顺序,不分叉,是多个网络层的线性堆叠
add 网络添加
添加网络到序贯模型
Conv2D:二维卷积
图像的处理当然是二维卷积了
Conv2D(32,kernel_size = (3,3), strides = (1,1), padding = 'same', input_shape = (114,114,3), activation = 'relu')
参数说明:
- 32 输出的维度大小
- kernel_size 卷积核的大小
- strides 步长(每次卷积操作跳的步长)
- padding 自动填充输入
- input_shape 输入的shape我们输入的是114*114*3
- activation 激活函数
MaxPooling2D:最大池化层
就是弄个卷积比如(2*2)在这个2*2的图像里取最大值代替2*2所以输出减半喽
Dropout:防止过拟合的
按照一定的概率将一段神经网络暂时从网络中丢弃
Flatten:扁平化层
就是把多维的数据变成一维的
Dense:全连接层
把扁平化的数据全连接到我们输出的类的数量上,比如classes的长度
classes里面就是我们不同人的id呗。
网络构建好了 数据呢??
step2 数据
深度神经网络的主要做的就是就是 数据 --->网络模型学习--->识别
好的,那我们录下自己的数据呗,每个人一个名字一个文件夹,里面放114*114大小的脸部图片。
如:
之前我们做好了人脸检测的那我们在这基础上检测人脸并保存到文件夹里呗,代码奉上:
import cv2
import os
import numpy as np
xml_path = r'./haarcascade_frontalface_default.xml'
cascade_signal = cv2.CascadeClassifier(xml_path)
cap = cv2.VideoCapture(0)#注意这里是数字零、
dir_name='./xia/'#存放人脸的文件夹名称,你的名字
num=0
#检测到没有文件夹构建一个呗
if not os.path.isdir(dir_name):
os.mkdir(dir_name)
while True:
box = []
_,frame= cap.read()#读取第一帧画面
#读取成功
if _:
#置信度的与阈值1~1.5 越大识别越的要求高,但可能识别出你就很困难、
result = cascade_signal.detectMultiScale(frame, 1.3, 5)
#识别到了画出来
if result != ():
result_mean = np.mean(result, axis=0)
x = int(result_mean[0])
y = int(result_mean[1])
w = int(result_mean[2])
h = int(result_mean[3])
box = (x,y,x+w,y+h)
face_img = frame[y:y+h, x:x+w]
cv2.rectangle(frame,(x,y),(x+w,y+h),(0,255,0),1)
#显示出来
cv2.imshow('im',frame)
#保存脸部信息
cv2.imwrite(dir_name+('%06d.png'%num),cv2.resize(face_img,(114,114)))
cv2.waitKey(1)
num+=1
cap.replease()
好的我们有自己的脸再去找些其他人的脸吧!
一个萝卜一个坑 一个一个文件夹准备好:
当然不能写汉字,这里写汉字主要是皮一下。。。
数据数量:
样式越多越好,表情丰富,光线充足 。一千以上
构建数据集
按照比例构建数据集,有两个需要的,训练数据集,测试数据集
读取所有图片,每个人的脸部图片对应一个标签0~10递增当然也可以是0~100看你有多少文件夹多少个人了
还说啥代码:
def dataset(data_dir):
category_count=0
for dirname in os.listdir(data_dir):
if os.path.isdir(data_dir+'/'+dirname):
sample_count = 0
print("load-->"+dirname)
sub_dir = data_dir+"/"+dirname
for filename in os.listdir(sub_dir):
max_ = len(os.listdir(sub_dir))
sub_img = sub_dir+"/"+filename
img = cv2.imread(sub_img)
sample_count += 1
if(sample_count <= max_*0.2):
validation_images.append(img)
self.validation_labels.append(self.category_count)
else:
train_images.append(img)
train_labels.append(category_count)
category_count+=1
train_images = np.asarray(train_images)
train_labels = np.asarray(train_labels)
validation_images = np.asarray(validation_images)
validation_labels = np.asarray(validation_labels)
return train_images,train_labels,validation_images,validation_labels
完后就是训练了,点赞超百,马上开始训练,哭了帮兄弟一把吧
相关推荐
- 人生苦短,我要在VSCode里面用Python
-
轻沉发自浅度寺量子位出品|公众号QbitAI在程序员圈子里,VisualStudioCode(以下简称VSCode)可以说是目前最火的代码编辑器之一了。它是微软出品的一款可扩展的轻量...
- 亲测可用:Pycharm2019.3专业版永久激活教程
-
概述随着2020年的到来,又有一批Pycharm的激活码到期了,各位同仁估计也是在到处搜索激活方案,在这里,笔者为大家收录了一个永久激活的方案,亲测可用,欢迎下载尝试:免责声明本项目只做个人学习研究之...
- Python新手入门很简单(python教程入门)
-
我之前学习python走过很多的歧途,自学永远都是瞎猫碰死耗子一样,毫无头绪。后来心里一直都有一个做头条知识分享的梦,希望自己能够帮助曾经类似自己的人,于是我来了,每天更新5篇Python文章,喜欢的...
- Pycharm的设置和基本使用(pycharm运行设置)
-
这篇文章,主要是针对刚开始学习python语言,不怎么会使用pycharm的童鞋们;我来带领大家详细了解下pycharm页面及常用的一些功能,让大家能通过此篇文章能快速的开始编写python代码。一...
- 依旧是25年最拔尖的PyTorch实用教程!堪比付费级内容!
-
我真的想知道作者到底咋把PyTorch教程整得这么牛的啊?明明在内容上已经足以成为付费教材了,但作者偏要免费开源给大家学习!...
- 手把手教你 在Pytorch框架上部署和测试关键点人脸检测项目DBFace
-
这期教向大家介绍仅仅1.3M的轻量级高精度的关键点人脸检测模型DBFace,并手把手教你如何在自己的电脑端进行部署和测试运行,运行时bug解决。01.前言前段时间DBFace人脸检测库横空出世,...
- 进入Python的世界02外篇-Pycharm配置Pyqt6
-
为什么这样配置,要开发带UI的python也只能这样了,安装过程如下:一安装工具打开终端:pipinstallPyQt6PyQt6-tools二打开设置并汉化点击plugin,安装汉化插件,...
- vs code如何配置使用Anaconda(vscode调用anaconda库)
-
上一篇文章中(Anaconda使用完全指南),我们能介绍了Anaconda的安装和使用,以及如何在pycharm中配置Anaconda。本篇,将继续介绍在vscode中配置conda...
- pycharm中conda解释器无法配置(pycharm配置anaconda解释器)
-
之前用的好好的pycharm正常配置解释器突然不能用了?可以显示有这个环境然后确认后可以conda正在配置解释器,但是进度条结束后还是不成功!!试过了pycharm重启,pycharm重装,anaco...
- Volta:跨平台开发者的福音,统一前端js工具链从未如此简单!
-
我们都知道现在已经进入了Rust时代,不仅很多终端常用的工具都被rust重写了,而且现在很多前端工具也开始被Rust接手了,这不,现在就出现了一款JS工具管理工具,有了它,你可以管理多版本的js工具,...
- 开发者的福音,ElectronEgg: 新一代桌面应用开发框架
-
今天给大家介绍一个开源项目electron-egg。如果你是一个JS的前端开发人员,以前面对这项任务桌面应用开发在时,可能会感到无从下手,甚至觉得这是一项困难的挑战。ElectronEgg的出现,它能...
- 超强经得起考验的低代码开发平台Frappe
-
#挑战30天在头条写日记#开始进行管理软件的开发来讲,如果从头做起不是不可以,但选择一款免费的且经得起时间考验的低代码开发平台是非常有必要的,将大幅提升代码的质量、加快开发的效率、以及提高程序的扩展性...
- 一文带你搞懂Vue3 底层源码(vue3核心源码解析)
-
作者:妹红大大转发链接:https://mp.weixin.qq.com/s/D_PRIMAD6i225Pn-a_lzPA前言vue3出来有一段时间了。今天正式开始记录一下梗vue3.0.0-be...
- 基于小程序 DSL(微信、支付宝)的,可扩展的多端研发框架
-
Mor(发音为/mr/,类似more),是饿了么开发的一款基于小程序DSL的,可扩展的多端研发框架,使用小程序原生DSL构建,使用者只需书写一套(微信或支付宝)小程序,就可以通过Mor...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 人生苦短,我要在VSCode里面用Python
- 亲测可用:Pycharm2019.3专业版永久激活教程
- Python新手入门很简单(python教程入门)
- Pycharm的设置和基本使用(pycharm运行设置)
- 依旧是25年最拔尖的PyTorch实用教程!堪比付费级内容!
- 手把手教你 在Pytorch框架上部署和测试关键点人脸检测项目DBFace
- 进入Python的世界02外篇-Pycharm配置Pyqt6
- vs code如何配置使用Anaconda(vscode调用anaconda库)
- pycharm中conda解释器无法配置(pycharm配置anaconda解释器)
- Volta:跨平台开发者的福音,统一前端js工具链从未如此简单!
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)