百度360必应搜狗淘宝本站头条

torch.save

    基于TensorRT_LLM的大模型推理加速与OpenAI兼容服务优化

    在之前的讨论中,我们探讨了NVIDIATensorRT在加速深度学习推理方面的能力。今天,我们将这一探索扩展到TensorRT-LLM,这是一个专门的开源库,旨在优化和加速NVIDIAGPU上的大型语言模型(LLM)推理。...

    使用PyTorch实操分步指南:针对稻米进行分类

    在快节奏的农业世界中,能够快速准确地对不同水稻品种进行分类可能会改变游戏规则。但是,我们如何利用机器学习来完成像水稻分类这样小众的事情呢?好吧,这就是强大的深度学习库PyTorch发挥作用的地方。今天,我将指导您使用PyTorch创建卷积神经网络(CNN),以根据图像对水稻品种进行分类。本...

    Python 深度学习十大技巧,开启人工智能之旅新大门

    引言:在Python深度学习的浩瀚征程中,你是否常常被模型训练的缓慢节奏所困扰?是否为难以解决的过拟合问题而焦虑?别担心!本次倾心分享Python深度学习的十个小技巧,助力你突破困境,高效提升模型性能,勇敢开启人工智能的精彩新征程。...

    神经网络-LeNet 神经网络概念股

    LeNet在1990年被提出,是一系列网络的统称,包括了LeNet1~LeNet5,对于神经网络的学习者来说,大家对下面这个图一定很熟悉,该图是对LeNet的简化展示。在LeNet中已经提出了卷积层、Pooling层等概念,只是但是由于缺乏大量数据和计算机硬件资源限制,导致LeNet的表现并不理想。...

    掌握深度学习,为什么要用 PyTorch、TensorFlow 框架?

    人工智能专栏推荐...

    深度学习实战:手把手教你构建多任务、多标签模型

    多任务多标签模型是现代机器学习中的基础架构,这个任务在概念上很简单-训练一个模型同时预测多个任务的多个输出。在本文中,我们将基于流行的MovieLens数据集,使用稀疏特征来创建一个多任务多标签模型,并逐步介绍整个过程。所以本文我们将涵盖数据准备、模型构建、训练循环、模型诊断,最后使用Ray...

    简单梳理Pytorch保存和重载模型的参数、优化器和损失函数

    第一、实现模型保存的意义大家应该都遇到过,在模型训练过程中会发生意外中断(例如断电)的情况。假设我们需要训练10000个epoch(迭代训练),当我们训练到第9990次时突然中断了,而且整个模型也没有得到保存,则我们的模型需要重新开始训练。众所周知,训练一个模型需要耗费大量的电能和GPU资源。因此在...

    详解策略梯度算法 策略梯度损失函数

    本文首发于行者AI引言根据智能体学习的不同,可将其分为Value-based方法、Policy-based方法以及Actor-Critic方法。之前我们介绍的Q-learning、Saras和DQN都是基于价值去学习,虽然这种强化学习方法在很多领域都获得较多的应用,但是它的局限性也是比较明显。首先这...

    深入解析图神经网络:Graph Transformer的算法基础与工程实践

    GraphTransformer是一种将Transformer架构应用于图结构数据的特殊神经网络模型。该模型通过融合图神经网络(GNNs)的基本原理与Transformer的自注意力机制,实现了对图中节点间关系信息的处理与长程依赖关系的有效捕获。GraphTransformer的技术优势在处理图...

    机器学习-GAN生成对抗网络 生成对抗网络的原理

    1、什么是GAN?GAN是2014年6月,Bengio团队提出来的,感兴趣的可以搜索论文:《GenerativeAdversarialNetworks》由生成器和判别器组成,即Generator和Discriminator,可以完成很多匪夷所思的生成问题。在图像生成、语音转换、文本生成领域均占有...