OpenVINO人脸识别实战
ztj100 2025-01-03 20:48 26 浏览 0 评论
【转】OpenVINO是Intel推出的计算机视觉深度学习推理加速库,支持Intel CPU, 核心显卡,VPU和FPGA。前两篇文章分别介绍了OpenVINO的环境搭建、重要文件、目录和环境变量, 本文将详细介绍如何将人脸特征提取模型Insightface封装成C++ SDK, 以及基于SDK开发简单的特征提取程序。本文所有操作的系统环境为Ubuntu16.04。
本文完整的C++工程已经发布在Github:
adamydwang/insightface-openvino,可以直接clone下来使用。
InferenceEngine调用流程
OpenVINO InferenceEngine编程模型包含几个重要的类:
- InferenceEngine::Core
Core类内部管理了各种设备插件,如CPU,GPU,VPU等
- InferenceEngine::CNNNetwork
保存在Host内存里的CNN网络对象,可以通过InferenceEngine::Core的ReadNetwork方法载入。CNNNetwork对象不提供用于推理的方法,因此不能直接用于推理(只有载入具体设备的对象才能用于推理)。 - InferenceEngine::InputsDataMap
在Host程序中获取输入的接口,可通过InferenceEngine::CNNNetwork提供的getInputsInfo()方法获取。通过InputsDataMap对象可以对输入参数进行设置,比如输入参数的精度(U8, FP32等)和布局(NCHW, NHWC等)。 - InferenceEngine::OuputsDataMap
在Host程序中获取输出的接口,可通过InferenceEngine::CNNNetwork提供的getOutputsInfo()方法获取。通过OutputsDataMap对象可以对推理结果的格式进行设置,比如设置输出参数的精度(FP16, FP32等)。 - InferenceEngine::ExecutableNetwork
可执行网络对象ExecutableNetwork是将CNNNetwork加载到目标设备得到,该对象是实际用于推理的。可以通过InferenceEngine::Core的LoadNetwork方法获得。 - InferenceEngine::InferRequest
InferRequest对象对ExecutableNetwork执行提供了接口。InferRequest提供了加载输入数据(GetBlob)、执行推理(同步推理Infer和异步推理StartAsync)和获取推理结果(GetBlob)的方法。
Host和Device的区别:
- Device
在OpenVINO中Device是指用来实际执行CNN网络加速的设备,比如GPU,VPU。Device一般是 异构设备,由Host程序来控制执行、获取执行结果等。因为OpenVINO也支持CNN网络在CPU中执行,因此CPU也是Device。
- Host
Host一般是指通用的CPU,包括x86和arm。主要用来处理一些复杂的逻辑,以及给Device发送指令和数据,控制Device的开始停止。
CMake工程目录结构
CMake因其简单、易于理解的语法在C++工程构建中被普遍采用。本文人脸特征提取的工程构建采用CMake来完成, CMakeLists工程的目录结构如下图所示:
- bin:用于保存编译生成的二进制可执行程序。
- build:用于保存编译过程中产生的临时文件。
- image:保存了一张测试图片。
- include:用于保存C++头文件。
- model:用于保存openvino模型文件,大家可以根据前期文章自己从mxnet模型转换,也可以下载我已经转好的模型文件。
- src:用于保存C++源文件。
InsightFace类实现
InsightFace类定义:
class InsightFace {
public:
InsightFace(const std::string& model, const std::string& dev, int width=112, int height=112);
~InsightFace();
int init();
int process(cv::Mat& image, std::vector<float>& feature);
private:
void preprocess(cv::Mat& image);
private:
InferenceEngine::InferRequest m_ireq;
std::string m_model;
std::string m_device;
std::string m_input_name;
std::string m_output_name;
int m_width;
int m_height;
};
InsightFace类重要方法实现(有删减,完整版请参考Github:
adamydwang/insightface-openvino):
//初始化方法,InsightFace类实例话必须被执行一次
int InsightFace::init() {
try {
InferenceEngine::Core ie;
//1. 读取网络模型到Host内存
InferenceEngine::CNNNetwork network = ie.ReadNetwork(m_model);
//2. 设置输入参数
InferenceEngine::InputsDataMap input_info(network.getInputsInfo());
auto input = *input_info.begin();
m_input_name = input.first;
input.second->setPrecision(InferenceEngine::Precision::U8);
input.second->setLayout(InferenceEngine::Layout::NCHW);
//3. 将模型载入目标设备
InferenceEngine::ExecutableNetwork executable_network = ie.LoadNetwork(network, m_device);
m_ireq = executable_network.CreateInferRequest();
//4. 设置输出参数
InferenceEngine::OutputsDataMap output_info(network.getOutputsInfo());
m_output_name = output_info.begin()->first;
output_info.begin()->second->setPrecision(InferenceEngine::Precision::FP32);
catch(...) { }
return 0;
}
//CNN推理, 输入Mat格式BGR图片,输出float数组特征值
int InsightFace::process(cv::Mat& image, std::vector<float>& feature) {
//1.对输入图片预处理
preprocess(image);
//2.输入从Host拷贝至Device, 推理, 输出从Device拷贝至Host
m_ireq.Infer();
//3.从Host获取推理结果
InferenceEngine::Blob::Ptr output_blob = m_ireq.GetBlob(m_output_name);
const int dims = output_blob->size();
feature.resize(dims);
memcpy(feature.data(), output_blob->buffer(), dims * sizeof(float));
return 0;
}
//输入图片预处理
void InsightFace::preprocess(cv::Mat& image) {
cv::Mat resized;
//图片必须resize至模型所需要的大小
cv::resize(image, resized, cv::Size(m_width, m_height));
//将输入图片喂到可执行网络在Host对应的内存
InferenceEngine::Blob::Ptr blob = m_ireq.GetBlob(m_input_name);
unsigned char* ptr = (unsigned char*)blob->buffer();
for (int c = 0; c < 3; ++c) {
for (int y = 0; y < m_height; ++y) {
for (int x = 0; x < m_width; ++x) {
*(ptr++) = resized.at<cv::Vec3b>(y, x)[c];
}
}
}
}
Demo程序开发
Demo程序完成单张人脸图片的特征提取。
InsightFace face(model_path, device);
face.init();
cv::Mat image = cv::imread(image_name);
face.process(image, feature);
CMake工程构建
编写CMakeLists.txt文件如下,其中InferenceEngine和OpenCV由OpenVINO的环境变量提供。因此在cmake构建工程之前必须执行:source
/opt/intel/openvino/bin/setupvars.sh
cmake_minimum_required(VERSION 2.7)
project(insightface)
add_definitions(-std=c++11)
find_package(InferenceEngine REQUIRED)
find_package(OpenCV REQUIRED)
include_directories(${PROJECT_SOURCE_DIR}/include
${InferenceEngine_INCLUDE_DIRS}
${OpenCV_INCLUDE_DIRS})
set(LIBS ${InferenceEngine_LIBRARIES} ${OpenCV_LIBRARIES})
set(SRCS ${PROJECT_SOURCE_DIR}/src/insightface.cpp)
add_executable(demo ${PROJECT_SOURCE_DIR}/src/demo.cpp ${SRCS})
target_link_libraries(demo ${LIBS})
set(EXECUTABLE_OUTPUT_PATH ${PROJECT_SOURCE_DIR}/bin)
总结
完整的人脸识别包括人脸检测、特征提取、特征比对。InsightFace只是特征提取环节,若要完整实现人脸识别,需按照InsightFace的方式实现一个人脸检测类,然后再实现一个简单的特征比对类。
相关推荐
- Jquery 详细用法
-
1、jQuery介绍(1)jQuery是什么?是一个js框架,其主要思想是利用jQuery提供的选择器查找要操作的节点,然后将找到的节点封装成一个jQuery对象。封装成jQuery对象的目的有...
- 前端开发79条知识点汇总
-
1.css禁用鼠标事件2.get/post的理解和他们之间的区别http超文本传输协议(HTTP)的设计目的是保证客户机与服务器之间的通信。HTTP的工作方式是客户机与服务器之间的请求-应答协议。...
- js基础面试题92-130道题目
-
92.说说你对作用域链的理解参考答案:作用域链的作用是保证执行环境里有权访问的变量和函数是有序的,作用域链的变量只能向上访问,变量访问到window对象即被终止,作用域链向下访问变量是不被允许的。...
- Web前端必备基础知识点,百万网友:牛逼
-
1、Web中的常见攻击方式1.SQL注入------常见的安全性问题。解决方案:前端页面需要校验用户的输入数据(限制用户输入的类型、范围、格式、长度),不能只靠后端去校验用户数据。一来可以提高后端处理...
- 事件——《JS高级程序设计》
-
一、事件流1.事件流描述的是从页面中接收事件的顺序2.事件冒泡(eventbubble):事件从开始时由最具体的元素(就是嵌套最深的那个节点)开始,逐级向上传播到较为不具体的节点(就是Docu...
- 前端开发中79条不可忽视的知识点汇总
-
过往一些不足的地方,通过博客,好好总结一下。1.css禁用鼠标事件...
- Chrome 开发工具之Network
-
经常会听到比如"为什么我的js代码没执行啊?","我明明发送了请求,为什么反应?","我这个网站怎么加载的这么慢?"这类的问题,那么问题既然存在,就需要去解决它,需要解决它,首先我们得找对导致问题的原...
- 轻量级 React.js 虚拟美化滚动条组件RScroll
-
前几天有给大家分享一个Vue自定义滚动条组件VScroll。今天再分享一个最新开发的ReactPC端模拟滚动条组件RScroll。...
- 一文解读JavaScript事件对象和表单对象
-
前言相信做网站对JavaScript再熟悉不过了,它是一门脚本语言,不同于Python的是,它是一门浏览器脚本语言,而Python则是服务器脚本语言,我们不光要会Python,还要会JavaScrip...
- Python函数参数黑科技:*args与**kwargs深度解析
-
90%的Python程序员不知道,可变参数设计竟能决定函数的灵活性和扩展性!掌握这些技巧,让你的函数适应任何场景!一、函数参数设计的三大进阶技巧...
- 深入理解Python3密码学:详解PyCrypto库加密、解密与数字签名
-
在现代计算领域,信息安全逐渐成为焦点话题。密码学,作为信息保护的关键技术之一,允许我们加密(保密)和解密(解密)数据。...
- 阿里Nacos惊爆安全漏洞,火速升级!(附修复建议)
-
前言好,我是threedr3am,我发现nacos最新版本1.4.1对于User-Agent绕过安全漏洞的serverIdentitykey-value修复机制,依然存在绕过问题,在nacos开启了...
- Python模块:zoneinfo时区支持详解
-
一、知识导图二、知识讲解(一)zoneinfo模块概述...
- Golang开发的一些注意事项(一)
-
1.channel关闭后读的问题当channel关闭之后再去读取它,虽然不会引发panic,但会直接得到零值,而且ok的值为false。packagemainimport"...
- Python鼠标与键盘自动化指南:从入门到进阶——键盘篇
-
`pynput`是一个用于控制和监控鼠标和键盘的Python库...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)