【AI 和机器学习】PyTorch BASIC 基础知识(节0):快速入门
ztj100 2024-12-17 17:48 27 浏览 0 评论
【AI 和机器学习】PyTorch BASIC 基础知识:节0
—— 快速入门
前言
—— 哪个更适合初学者?
想要学习并掌握 AI,最直接的办法就是自己动手进行实操。有一些流行的来源可供练习 AI 技能,例如:
- Kaggle:一个托管各种数据集和机器学习竞赛的平台。
- UCI 机器学习存储库:用于机器学习研究的数据集集合。
- TensorFlow 教程:TensorFlow 团队提供的教程和示例。
- PyTorch 教程:PyTorch 团队提供的教程和示例。
其中PyTorch和TensorFlow的AI教程资源非常丰富。但对于初学者来说,哪个更合适,可能还得取决于您的特定目标(研究与生产)以及您的偏好等:
- PyTorch 因其简单、易读和易于调试而通常被认为更适合初学者。PyTorch 的动态特性使新手可以学习概念而不会被复杂的语法所困扰。
- TensorFlow 随着 TensorFlow 2.x 和 Keras 的推出变得更加适合初学者,但它仍可能对初学者构成挑战。
本文先选择PyTorch来和大家一起学习,学习它的一些基础内容。其中所有素材均取自其教程。对于每一节内容,我们都将先给出摘要,然后把译文稍作整理后附在后面,供参考。
目录
【续前文】
本节摘要
本节概述了如何使用 PyTorch 执行常见的机器学习任务,重点介绍数据处理、模型创建、训练和保存/加载模型。
- 使用数据
- 数据处理基元:PyTorch 使用 'torch.utils.data.DataLoader' 和 'torch.utils.data.Dataset'。“Dataset”存储样本和标签,而“DataLoader”包装数据集以便于迭代。
- 数据加载示例:本节演示了如何使用 'torchvision.datasets' 下载 FashionMNIST 数据集,并通过 'ToTensor()' 应用转换。
- 创建数据加载器:为具有指定批量大小(例如 64)的训练和测试数据集创建“DataLoader”。
- 创建模型
- 定义神经网络:神经网络是通过创建一个继承自 nn.Module的模块中。网络层在 __init__ 方法中设置,数据流在 'forward' 方法中定义。
- 设备选择:该代码检查可用的计算设备(CPU、GPU 或 MPS),以便加速训练。
- 优化模型参数
- 损失函数和优化器:模型使用交叉熵损失和 SGD 作为优化器。训练循环批量处理数据集、计算预测、计算损失,并通过反向传播更新模型参数。
- 测试模型:一个单独的函数评估模型在测试数据集上的性能,计算准确率和平均损失。
- 训练过程
- Epochs:模型在多个 epoch 上进行训练,在每个 epoch 打印损失和准确率来监控进度。
- 保存和加载模型
- 保存模型:模型的 state 字典使用 'torch.save()' 保存。
- 加载模型:要加载模型,需要重新创建结构,并将状态字典重新加载回其中。
- 进行预测
- 加载模型后,它可以对新数据进行预测,并提供用于解释结果的示例。
本节是使用 PyTorch 进行机器学习的基础介绍,重点介绍数据处理、模型训练和部署的实际步骤。
本节正文
本节介绍机器学习中常见任务的 API。请参阅每个部分中的“更多信息”深入了解。
使用数据
PyTorch 有两个用于处理数据的基元: torch.utils.data.DataLoader 和 torch.utils.data.Dataset 。Dataset 存储样本及其相应的标签,而 DataLoader 则围绕 Dataset 包装了一个可迭代对象。
PyTorch 提供特定于域的库,例如 TorchText、TorchVision 和 TorchAudio,所有这些库都包含数据集。在本教程中,我们将使用 TorchVision 数据集。
torchvision.datasets 模块包含许多真实世界视觉数据的 Dataset 对象,如 CIFAR、COCO。在本教程中,我们使用 FashionMNIST 数据集。每个 TorchVision 数据集都包含两个参数: transform 和 target_transform 分别用于修改样本和标签。
输出:
我们将 Dataset 作为参数传递给 DataLoader。这将把一个可迭代对象包装在我们的数据集上,并且支持自动批处理、采样、混洗和多进程数据加载。这里我们定义了一个 batch size 为 64,即 dataloader iterable 中的每个元素将返回一个 64 个特征和标签的批次。
输出:
【注:更多信息请参阅“在 PyTorch 中加载数据”一节】
创建模型
为了在 PyTorch 中定义神经网络,我们创建了一个继承自 nn.Module 的模型。我们在 __init__ 函数中定义网络层,并在 forward 函数中指定数据如何通过网络。为了加速神经网络中的操作,我们将其移到 GPU 或 MPS(如果可用的话)。
输出:
【注:更多信息请参阅“在 PyTorch 中构建神经网络”一节】
优化模型参数
要训练模型,我们需要一个损失函数和一个优化器。
在单个训练循环中,模型对训练数据集进行预测(分批提供给它),并反向传播预测误差来调整模型的参数。
我们还根据测试数据集检查模型的性能,以确保它正在学习。
训练过程分多次迭代 (epoch) 进行。在每个 epoch 期间,模型会学习参数以做出更好的预测。我们打印模型在每个 epoch 的准确率和损失;我们希望看到每个 epoch 的准确率增加,损失减少。
输出:
【注:更多信息请参阅“训练模型”一节】
保存模型
保存模型的常用方法是序列化内部状态字典(包含模型参数)。
输出:
加载模型
加载模型的过程包括重新创建模型结构,并且将状态字典加载到其中。
输出:
此模型现在可用于进行预测。
输出:
【注:更多信息请参阅“保存和加载模型”一节】
【未完待续】
农历甲辰十月廿三
2024.11.23
【部分图片来源网络,侵删】
- 上一篇:【AI系统】推理文件格式 ai推理加速
- 下一篇:这模型有毒! 制作模型会中毒
相关推荐
- sharding-jdbc实现`分库分表`与`读写分离`
-
一、前言本文将基于以下环境整合...
- 三分钟了解mysql中主键、外键、非空、唯一、默认约束是什么
-
在数据库中,数据表是数据库中最重要、最基本的操作对象,是数据存储的基本单位。数据表被定义为列的集合,数据在表中是按照行和列的格式来存储的。每一行代表一条唯一的记录,每一列代表记录中的一个域。...
- MySQL8行级锁_mysql如何加行级锁
-
MySQL8行级锁版本:8.0.34基本概念...
- mysql使用小技巧_mysql使用入门
-
1、MySQL中有许多很实用的函数,好好利用它们可以省去很多时间:group_concat()将取到的值用逗号连接,可以这么用:selectgroup_concat(distinctid)fr...
- MySQL/MariaDB中如何支持全部的Unicode?
-
永远不要在MySQL中使用utf8,并且始终使用utf8mb4。utf8mb4介绍MySQL/MariaDB中,utf8字符集并不是对Unicode的真正实现,即不是真正的UTF-8编码,因...
- 聊聊 MySQL Server 可执行注释,你懂了吗?
-
前言MySQLServer当前支持如下3种注释风格:...
- MySQL系列-源码编译安装(v5.7.34)
-
一、系统环境要求...
- MySQL的锁就锁住我啦!与腾讯大佬的技术交谈,是我小看它了
-
对酒当歌,人生几何!朝朝暮暮,唯有己脱。苦苦寻觅找工作之间,殊不知今日之事乃我心之痛,难道是我不配拥有工作嘛。自面试后他所谓的等待都过去一段时日,可惜在下京东上的小金库都要见低啦。每每想到不由心中一...
- MySQL字符问题_mysql中字符串的位置
-
中文写入乱码问题:我输入的中文编码是urf8的,建的库是urf8的,但是插入mysql总是乱码,一堆"???????????????????????"我用的是ibatis,终于找到原因了,我是这么解决...
- 深圳尚学堂:mysql基本sql语句大全(三)
-
数据开发-经典1.按姓氏笔画排序:Select*FromTableNameOrderByCustomerNameCollateChinese_PRC_Stroke_ci_as//从少...
- MySQL进行行级锁的?一会next-key锁,一会间隙锁,一会记录锁?
-
大家好,是不是很多人都对MySQL加行级锁的规则搞的迷迷糊糊,一会是next-key锁,一会是间隙锁,一会又是记录锁。坦白说,确实还挺复杂的,但是好在我找点了点规律,也知道如何如何用命令分析加...
- 一文讲清怎么利用Python Django实现Excel数据表的导入导出功能
-
摘要:Python作为一门简单易学且功能强大的编程语言,广受程序员、数据分析师和AI工程师的青睐。本文系统讲解了如何使用Python的Django框架结合openpyxl库实现Excel...
- 用DataX实现两个MySQL实例间的数据同步
-
DataXDataX使用Java实现。如果可以实现数据库实例之间准实时的...
- MySQL数据库知识_mysql数据库基础知识
-
MySQL是一种关系型数据库管理系统;那废话不多说,直接上自己以前学习整理文档:查看数据库命令:(1).查看存储过程状态:showprocedurestatus;(2).显示系统变量:show...
- 如何为MySQL中的JSON字段设置索引
-
背景MySQL在2015年中发布的5.7.8版本中首次引入了JSON数据类型。自此,它成了一种逃离严格列定义的方式,可以存储各种形状和大小的JSON文档,例如审计日志、配置信息、第三方数据包、用户自定...
你 发表评论:
欢迎- 一周热门
-
-
MySQL中这14个小玩意,让人眼前一亮!
-
旗舰机新标杆 OPPO Find X2系列正式发布 售价5499元起
-
【VueTorrent】一款吊炸天的qBittorrent主题,人人都可用
-
面试官:使用int类型做加减操作,是线程安全吗
-
C++编程知识:ToString()字符串转换你用正确了吗?
-
【Spring Boot】WebSocket 的 6 种集成方式
-
PyTorch 深度学习实战(26):多目标强化学习Multi-Objective RL
-
pytorch中的 scatter_()函数使用和详解
-
与 Java 17 相比,Java 21 究竟有多快?
-
基于TensorRT_LLM的大模型推理加速与OpenAI兼容服务优化
-
- 最近发表
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)