百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

105.人工智能——猫十二分类:新手练习项目

ztj100 2024-11-27 23:33 18 浏览 0 评论

图像分类任务是计算机视觉的基础,也是新手必须要掌握的知识和技能,其中卷积神经网络(CNN)就是最常用的提取图像特征的方法。

数据集来源于飞桨新手赛,一个cat_12_train目录,包含2160张大小不一的图像,标注信息存放在data_list.txt中。每行的格式内容如下:

图像名称 分类ID

cat_12_train/8GOkTtqw7E6IHZx4olYnhzvXLCiRsUfM.jpg	0
cat_12_train/hwQDH3VBabeFXISfjlWEmYicoyr6qK1p.jpg	0
cat_12_train/RDgZKvM6sp3Tx9dlqiLNEVJjmcfQ0zI4.jpg	0
cat_12_train/ArBRzHyphTxFS2be9XLaU58m34PudlEf.jpg	0

还有一个cat_12_test目录,包含240张测试图像,没有标注信息。

为了方便的模型训练,需要把数据集拆分成训练集和验证集,就是把data_list.txt 按8:2拆分成train_list.txt和val_list.txt

实现想法

先从data_list.txt读所有的数据存放在numpy数组datanp中,并随机乱序,然后对datanp进行切片,把切片后的数据写回训练集和验证集文本文件。

实现代码

import os
import numpy as np

datadir="cat_12"
datalst=[]
#打开文本文件
with open(os.path.join(datadir,"data_list.txt")) as f:
    for line in f.readlines():
        d=line.split("\t")
        imgpath=d[0]
        imglabel=d[1]
        datalst.append([imgpath,imglabel])

datanp=np.array(datalst)
np.random.shuffle(datanp)
trainnp=datanp[:int(0.8*len(datanp))]
valnp=datanp[int(0.8*len(datanp)):]

#写入训练集文本文件
with open(os.path.join(datadir,"train_list.txt"),"w") as f:
    for d in trainnp:
        f.write(d[0]+"\t"+d[1])
        
#写入验证集文本文件
with open(os.path.join(datadir,"val_list.txt"),"w") as f:
    for d in valnp:
        f.write(d[0]+"\t"+d[1])

模型训练

这里使用的是ResNet50_vd_ssld分类模型,使用paddlex来训练,代码和过程这里省略,可以参看前面的文章:2.人工智能-图像分类

结果预测

把训练模型转换成部署模型,对给的240个测试数据集进行预测,并保存预测结果到result.csv文件。

import paddlex as pdx
import cv2
import os
import pandas as pd
import numpy as np
import matplotlib.image as mpimg
testdir="cat_12/cat_12_test"
testlst=[]
predictor=pdx.deploy.Predictor("inference_model",use_gpu=True)
for f in os.listdir(testdir):
    fpath=os.path.join(testdir,f)
    #img = cv2.imdecode(np.fromfile(fpath,dtype = np.uint8),-1) 
    img=cv2.imread(fpath)
    #因编码问题读不出图像内容的
    if img is None:
        img=mpimg.imread(fpath)
        img=cv2.cvtColor(img,cv2.COLOR_RGB2BGR)
    result=predictor.predict(img)
    print(result[0]["category"],result[0]["score"])
    testlst.append([f,result[0]["category"]])

#把testlst列表写入csv
pd.DataFrame(testlst).to_csv("test.csv",index=False,header=False)

这里有一个注意项:在cv2读取图像的时候,如果文件名存在中文或编码问题,会引起cv2无法读取出图像内容,返回None,导致程序无法正常进行。碰到这种情况大部分解决方式就是中文改为英文。例如上面的这张图像。

本文在这里换个思路,cv2无法读取,就换成matplotlib.image来读取。


提交结果

提交结果来看,0.91的得分并不是很高,看到最高的分数都达到0.99以上。如果对训练数据进行预处理,和训练参数的调整,应该还是可以提高分数的。

#说明:
1.结果文件总行数应为240,否则成绩无效;
2.结果文件命名应为result.csv,每行内容格式为:文件名,分类结果,文件名和分类结果使用英文逗号","分隔;
评价指标
评比标准为分类正确的准确率,计算方式如下:
准确率 = 正确的分类个数 / 测试集图片个数

相关推荐

人生苦短,我要在VSCode里面用Python

轻沉发自浅度寺量子位出品|公众号QbitAI在程序员圈子里,VisualStudioCode(以下简称VSCode)可以说是目前最火的代码编辑器之一了。它是微软出品的一款可扩展的轻量...

亲测可用:Pycharm2019.3专业版永久激活教程

概述随着2020年的到来,又有一批Pycharm的激活码到期了,各位同仁估计也是在到处搜索激活方案,在这里,笔者为大家收录了一个永久激活的方案,亲测可用,欢迎下载尝试:免责声明本项目只做个人学习研究之...

Python新手入门很简单(python教程入门)

我之前学习python走过很多的歧途,自学永远都是瞎猫碰死耗子一样,毫无头绪。后来心里一直都有一个做头条知识分享的梦,希望自己能够帮助曾经类似自己的人,于是我来了,每天更新5篇Python文章,喜欢的...

Pycharm的设置和基本使用(pycharm运行设置)

这篇文章,主要是针对刚开始学习python语言,不怎么会使用pycharm的童鞋们;我来带领大家详细了解下pycharm页面及常用的一些功能,让大家能通过此篇文章能快速的开始编写python代码。一...

依旧是25年最拔尖的PyTorch实用教程!堪比付费级内容!

我真的想知道作者到底咋把PyTorch教程整得这么牛的啊?明明在内容上已经足以成为付费教材了,但作者偏要免费开源给大家学习!...

手把手教你 在Pytorch框架上部署和测试关键点人脸检测项目DBFace

这期教向大家介绍仅仅1.3M的轻量级高精度的关键点人脸检测模型DBFace,并手把手教你如何在自己的电脑端进行部署和测试运行,运行时bug解决。01.前言前段时间DBFace人脸检测库横空出世,...

进入Python的世界02外篇-Pycharm配置Pyqt6

为什么这样配置,要开发带UI的python也只能这样了,安装过程如下:一安装工具打开终端:pipinstallPyQt6PyQt6-tools二打开设置并汉化点击plugin,安装汉化插件,...

vs code如何配置使用Anaconda(vscode调用anaconda库)

上一篇文章中(Anaconda使用完全指南),我们能介绍了Anaconda的安装和使用,以及如何在pycharm中配置Anaconda。本篇,将继续介绍在vscode中配置conda...

pycharm中conda解释器无法配置(pycharm配置anaconda解释器)

之前用的好好的pycharm正常配置解释器突然不能用了?可以显示有这个环境然后确认后可以conda正在配置解释器,但是进度条结束后还是不成功!!试过了pycharm重启,pycharm重装,anaco...

Volta:跨平台开发者的福音,统一前端js工具链从未如此简单!

我们都知道现在已经进入了Rust时代,不仅很多终端常用的工具都被rust重写了,而且现在很多前端工具也开始被Rust接手了,这不,现在就出现了一款JS工具管理工具,有了它,你可以管理多版本的js工具,...

开发者的福音,ElectronEgg: 新一代桌面应用开发框架

今天给大家介绍一个开源项目electron-egg。如果你是一个JS的前端开发人员,以前面对这项任务桌面应用开发在时,可能会感到无从下手,甚至觉得这是一项困难的挑战。ElectronEgg的出现,它能...

超强经得起考验的低代码开发平台Frappe

#挑战30天在头条写日记#开始进行管理软件的开发来讲,如果从头做起不是不可以,但选择一款免费的且经得起时间考验的低代码开发平台是非常有必要的,将大幅提升代码的质量、加快开发的效率、以及提高程序的扩展性...

一文带你搞懂Vue3 底层源码(vue3核心源码解析)

作者:妹红大大转发链接:https://mp.weixin.qq.com/s/D_PRIMAD6i225Pn-a_lzPA前言vue3出来有一段时间了。今天正式开始记录一下梗vue3.0.0-be...

Windows 11 + WSL2 打造轻量级 Linux 本地开发环境实战教程

一、前言...

基于小程序 DSL(微信、支付宝)的,可扩展的多端研发框架

Mor(发音为/mr/,类似more),是饿了么开发的一款基于小程序DSL的,可扩展的多端研发框架,使用小程序原生DSL构建,使用者只需书写一套(微信或支付宝)小程序,就可以通过Mor...

取消回复欢迎 发表评论: