利用神经网络模型检测摄像头上的可疑行为
ztj100 2024-12-12 16:14 17 浏览 0 评论
您可能想知道如何检测网络摄像头视频Feed中的可疑行为?我们将使用您计算机的网络摄像头作为视频源,用于训练数据和测试您的神经网络模型。这种方法是使用迁移学习的监督学习。
你需要遵循什么
您应该可以访问安装了以下组件的计算机。
- Python 3
- Keras/Tensorflow
- Pillow (PIL)
- NumPy
- CV2
他们都可以通过pip和conda。
虽然,我已经在Mac上测试了这段Python代码,但它应该适用于任何系统。给出的文字转语音是唯一的例外,我以前用它subprocess.call()来调用Mac OS X say命令。您的操作系统上可能有一个等效的命令。
导入Python库
# Create training videos import cv2 import numpy as np from time import sleep import glob import os import sys from PIL import Image import subprocess NUM_FRAMES = 100 TAKES_PER = 2 CLASSES = ['SAFE', 'DANGER'] NEG_IDX = 0 POS_IDX = 1 HIDDEN_SIZE = 256 MODEL_PATH='model.h5' TRAIN_MODEL = True EPOCHS = 10 HIDDEN_SIZE = 16
准备数据
首先,我们需要一些训练数据来学习。我们需要“可疑”和“安全”行为的视频,因此请准备好行动!为了更容易训练我们的模型,您可以抓住玩具枪或其他可识别的物品来处理“可疑”场景。这样,在没有大量训练数据的情况下,您的模型将更容易分离两个案例。
这是一段Python代码片段,可从计算机的网络摄像头中捕获四个视频(两个可疑和两个安全),并将它们存储在一个data目录中供以后处理。
def capture(num_frames, path='out.avi'): # Create a VideoCapture object cap = cv2.VideoCapture(0) # Check if camera opened successfully if (cap.isOpened() == False): print("Unable to read camera feed") # Default resolutions of the frame are obtained.The default resolutions are system dependent. # We convert the resolutions from float to integer. frame_width = int(cap.get(3)) frame_height = int(cap.get(4)) # Define the codec and create VideoWriter object.The output is stored in 'outpy.avi' file. out = cv2.VideoWriter(path, cv2.VideoWriter_fourcc('M','J','P','G'), 10, (frame_width,frame_height)) print('Recording started') for i in range(num_frames): ret, frame = cap.read() if ret == True: # Write the frame into the file 'output.avi' out.write(frame) # When everything done, release the video capture and video write objects cap.release() out.release() for take in range(VIDEOS_PER_CLASS): for cla in CLASSES: path = 'data/{}{}.avi'.format(cla, take) print('Get ready to act:', cla) # Only works on Mac subprocess.call(['say', 'get ready to act {}'.format(cla)]) capture(FRAMES_PER_VIDEO, path=path)
看看data目录中的视频。你视频根据类别命名,例如SAFE1.avi用于安全视频。
使用预训练的模型从视频中提取特征
接下来,您需要将这些视频转换为机器学习算法可以训练的内容。为此,我们将重新利用经过预训练的VGG16网络,该神经网络已在ImageNet上接受过训练。Python实现如下:
# Create X, y series from keras.preprocessing import image from keras.applications.vgg16 import VGG16 from keras.applications.vgg16 import preprocess_input import numpy as np class VGGFramePreprocessor(): def __init__(self, vgg_model): self.vgg_model = vgg_model def process(self, frame): img_data = cv2.resize(frame,(224,224)) img_data = np.expand_dims(img_data, axis=0) img_data = preprocess_input(img_data) x = self.vgg_model.predict(img_data).flatten() x = np.expand_dims(x, axis=0) return x def get_video_frames(video_path): vidcap = cv2.VideoCapture(video_path) success, frame = vidcap.read() while success: yield frame success,frame = vidcap.read() vidcap.release() frame_preprocessor = VGGFramePreprocessor(VGG16(weights='imagenet', include_top=False)) if TRAIN_MODEL: # Load movies and transform frames to features movies = [] X = [] y = [] for video_path in glob.glob('data/*.avi'): print('preprocessing', video_path) positive = CLASSES[POS_IDX] in video_path _X = np.concatenate([frame_preprocessor.process(frame) for frame in get_video_frames(video_path)]) _y = np.array(_X.shape[0] * [[int(not positive), int(positive)]]) X.append(_X) y.append(_y) X = np.concatenate(X) y = np.concatenate(y) print(X.shape) print(y.shape)
训练分类器
现在我们有了X和Y序列,现在是时候训练神经网络模型来区分可疑行为和安全行为了!在此示例中,我们将使用深度神经网络。你可以根据需要进行调整。Python代码如下:
from keras.models import Sequential, load_model from keras.layers import Dense, Activation, Dropout from sklearn.model_selection import train_test_split from sklearn.metrics import f1_score MODEL_PATH='model.h5' EPOCHS = 10 HIDDEN_SIZE = 16 if TRAIN_MODEL: model = Sequential() model.add(Dense(HIDDEN_SIZE, input_shape=(X.shape[1],))) model.add(Dense(HIDDEN_SIZE)) model.add(Dropout(0.2)) model.add(Dense(len(CLASSES), activation='softmax')) model.compile(loss='categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy']) x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=42) model.fit(x_train, y_train, batch_size=10, epochs=EPOCHS, validation_split=0.1) model.save(MODEL_PATH) y_true = [np.argmax(y) for y in y_test] y_pred = [np.argmax(pred) for pred in model.predict(x_test)] score = f1_score(y_true, y_pred) print('F1:', score) else: model = load_model(MODEL_PATH)
准备测试!
现在到了有趣的部分。现在我们将使用我们构建的所有部分。是时候将计算机的网络摄像头变成现场CCTV行为检测器了!
# Infer on live video from math import ceil import subprocess TEST_FRAMES = 500 # Initialize camera cap = cv2.VideoCapture(0) # Check if camera opened successfully if (cap.isOpened() == False): print("Unable to read camera feed") test_frames = 0 # Start processing video for i in range(TEST_FRAMES): ret, frame = cap.read() if not ret: continue x_pred = frame_preprocessor.process(frame) y_pred = model.predict(x_pred)[0] conf_negative = y_pred[NEG_IDX] conf_positive = y_pred[POS_IDX] cla = CLASSES[np.argmax(y_pred)] if cla == CLASSES[POS_IDX]: subprocess.call(['say', CLASSES[POS_IDX]]) progress = int(100 * (i / TEST_FRAMES)) message = 'testing {}% conf_neg = {:.02f} conf_pos = {:.02f} class = {} \r'.format(progress, conf_negative, conf_positive, cla) sys.stdout.write(message) sys.stdout.flush() cap.release()
结论
我希望你喜欢这个关于检测CCTV视频中可疑行为的教程。
一个明显的选择是在单一帧或帧序列上训练。为了简单起见,我为这个示例选择了单个帧,因为我们可以跳过一些正交任务,例如缓冲图像和排序训练数据。如果你想训练序列,你可以使用LSTM。
相关推荐
- sharding-jdbc实现`分库分表`与`读写分离`
-
一、前言本文将基于以下环境整合...
- 三分钟了解mysql中主键、外键、非空、唯一、默认约束是什么
-
在数据库中,数据表是数据库中最重要、最基本的操作对象,是数据存储的基本单位。数据表被定义为列的集合,数据在表中是按照行和列的格式来存储的。每一行代表一条唯一的记录,每一列代表记录中的一个域。...
- MySQL8行级锁_mysql如何加行级锁
-
MySQL8行级锁版本:8.0.34基本概念...
- mysql使用小技巧_mysql使用入门
-
1、MySQL中有许多很实用的函数,好好利用它们可以省去很多时间:group_concat()将取到的值用逗号连接,可以这么用:selectgroup_concat(distinctid)fr...
- MySQL/MariaDB中如何支持全部的Unicode?
-
永远不要在MySQL中使用utf8,并且始终使用utf8mb4。utf8mb4介绍MySQL/MariaDB中,utf8字符集并不是对Unicode的真正实现,即不是真正的UTF-8编码,因...
- 聊聊 MySQL Server 可执行注释,你懂了吗?
-
前言MySQLServer当前支持如下3种注释风格:...
- MySQL系列-源码编译安装(v5.7.34)
-
一、系统环境要求...
- MySQL的锁就锁住我啦!与腾讯大佬的技术交谈,是我小看它了
-
对酒当歌,人生几何!朝朝暮暮,唯有己脱。苦苦寻觅找工作之间,殊不知今日之事乃我心之痛,难道是我不配拥有工作嘛。自面试后他所谓的等待都过去一段时日,可惜在下京东上的小金库都要见低啦。每每想到不由心中一...
- MySQL字符问题_mysql中字符串的位置
-
中文写入乱码问题:我输入的中文编码是urf8的,建的库是urf8的,但是插入mysql总是乱码,一堆"???????????????????????"我用的是ibatis,终于找到原因了,我是这么解决...
- 深圳尚学堂:mysql基本sql语句大全(三)
-
数据开发-经典1.按姓氏笔画排序:Select*FromTableNameOrderByCustomerNameCollateChinese_PRC_Stroke_ci_as//从少...
- MySQL进行行级锁的?一会next-key锁,一会间隙锁,一会记录锁?
-
大家好,是不是很多人都对MySQL加行级锁的规则搞的迷迷糊糊,一会是next-key锁,一会是间隙锁,一会又是记录锁。坦白说,确实还挺复杂的,但是好在我找点了点规律,也知道如何如何用命令分析加...
- 一文讲清怎么利用Python Django实现Excel数据表的导入导出功能
-
摘要:Python作为一门简单易学且功能强大的编程语言,广受程序员、数据分析师和AI工程师的青睐。本文系统讲解了如何使用Python的Django框架结合openpyxl库实现Excel...
- 用DataX实现两个MySQL实例间的数据同步
-
DataXDataX使用Java实现。如果可以实现数据库实例之间准实时的...
- MySQL数据库知识_mysql数据库基础知识
-
MySQL是一种关系型数据库管理系统;那废话不多说,直接上自己以前学习整理文档:查看数据库命令:(1).查看存储过程状态:showprocedurestatus;(2).显示系统变量:show...
- 如何为MySQL中的JSON字段设置索引
-
背景MySQL在2015年中发布的5.7.8版本中首次引入了JSON数据类型。自此,它成了一种逃离严格列定义的方式,可以存储各种形状和大小的JSON文档,例如审计日志、配置信息、第三方数据包、用户自定...
你 发表评论:
欢迎- 一周热门
-
-
MySQL中这14个小玩意,让人眼前一亮!
-
旗舰机新标杆 OPPO Find X2系列正式发布 售价5499元起
-
【VueTorrent】一款吊炸天的qBittorrent主题,人人都可用
-
面试官:使用int类型做加减操作,是线程安全吗
-
C++编程知识:ToString()字符串转换你用正确了吗?
-
【Spring Boot】WebSocket 的 6 种集成方式
-
PyTorch 深度学习实战(26):多目标强化学习Multi-Objective RL
-
pytorch中的 scatter_()函数使用和详解
-
与 Java 17 相比,Java 21 究竟有多快?
-
基于TensorRT_LLM的大模型推理加速与OpenAI兼容服务优化
-
- 最近发表
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)