torch.save - 高槐编程网

torch.save

基于TensorRT_LLM的大模型推理加速与OpenAI兼容服务优化: 在之前的讨论中，我们探讨了NVIDIATensorRT在加速深度学习推理方面的能力。今天，我们将这一探索扩展到TensorRT-LLM，这是一个专门的开源库，旨在优化和加速NVIDIAGPU上的大型语言模型(LLM)推理。...

使用PyTorch实操分步指南:针对稻米进行分类: 在快节奏的农业世界中，能够快速准确地对不同水稻品种进行分类可能会改变游戏规则。但是，我们如何利用机器学习来完成像水稻分类这样小众的事情呢？好吧，这就是强大的深度学习库PyTorch发挥作用的地方。今天，我将指导您使用PyTorch创建卷积神经网络(CNN)，以根据图像对水稻品种进行分类。本...

Python 深度学习十大技巧，开启人工智能之旅新大门: 引言：在Python深度学习的浩瀚征程中，你是否常常被模型训练的缓慢节奏所困扰？是否为难以解决的过拟合问题而焦虑？别担心！本次倾心分享Python深度学习的十个小技巧，助力你突破困境，高效提升模型性能，勇敢开启人工智能的精彩新征程。...

神经网络-LeNet 神经网络概念股: LeNet在1990年被提出，是一系列网络的统称，包括了LeNet1~LeNet5，对于神经网络的学习者来说，大家对下面这个图一定很熟悉，该图是对LeNet的简化展示。在LeNet中已经提出了卷积层、Pooling层等概念，只是但是由于缺乏大量数据和计算机硬件资源限制，导致LeNet的表现并不理想。...

掌握深度学习，为什么要用 PyTorch、TensorFlow 框架?: 人工智能专栏推荐...

深度学习实战:手把手教你构建多任务、多标签模型: 多任务多标签模型是现代机器学习中的基础架构，这个任务在概念上很简单-训练一个模型同时预测多个任务的多个输出。在本文中,我们将基于流行的MovieLens数据集,使用稀疏特征来创建一个多任务多标签模型,并逐步介绍整个过程。所以本文我们将涵盖数据准备、模型构建、训练循环、模型诊断,最后使用Ray...

简单梳理Pytorch保存和重载模型的参数、优化器和损失函数: 第一、实现模型保存的意义大家应该都遇到过，在模型训练过程中会发生意外中断(例如断电)的情况。假设我们需要训练10000个epoch(迭代训练)，当我们训练到第9990次时突然中断了，而且整个模型也没有得到保存，则我们的模型需要重新开始训练。众所周知，训练一个模型需要耗费大量的电能和GPU资源。因此在...

详解策略梯度算法策略梯度损失函数: 本文首发于行者AI引言根据智能体学习的不同，可将其分为Value-based方法、Policy-based方法以及Actor-Critic方法。之前我们介绍的Q-learning、Saras和DQN都是基于价值去学习，虽然这种强化学习方法在很多领域都获得较多的应用，但是它的局限性也是比较明显。首先这...

深入解析图神经网络:Graph Transformer的算法基础与工程实践: GraphTransformer是一种将Transformer架构应用于图结构数据的特殊神经网络模型。该模型通过融合图神经网络(GNNs)的基本原理与Transformer的自注意力机制，实现了对图中节点间关系信息的处理与长程依赖关系的有效捕获。GraphTransformer的技术优势在处理图...

机器学习-GAN生成对抗网络生成对抗网络的原理: 1、什么是GAN？GAN是2014年6月，Bengio团队提出来的，感兴趣的可以搜索论文：《GenerativeAdversarialNetworks》由生成器和判别器组成，即Generator和Discriminator，可以完成很多匪夷所思的生成问题。在图像生成、语音转换、文本生成领域均占有...

‹‹ 1 2 › ››

首页
收录
顶部