百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

循环神经网络的使用RNN和LSTM rnn循环神经网络实例

ztj100 2024-12-18 18:19 24 浏览 0 评论

专栏推荐




(此处已添加圈子卡片,请到今日头条客户端查看)

RNN

ht = tαnh(Wih*Xt+bih+whh*ht-1+bhh)

在pytorch中我们使用nn.RNN()就可以创建出RNN神经网络,它有如下参数:

input_size表示输入xt的特征维度

hidden_size表示输出ht的特征维度,或者理解为隐藏层的神经元数

num_layers表示RNN网络的层数,默认是1层

nonlinearity表示非线性激活函数的选择,默认tanh,当然也可以选择relu

bias表示是否使用偏置,默认是Ture,使用

batch_first这个参数是决定网络输入的维度顺序,默认是(seq,batch,feature)输入,seq表示序列长度,batch表示批量,feature表示特征维度,我们也可以将其修改为(batch,seq,feature),只用将这个参数设置为True

dropout个参数接受一个0~1的数值,这个dropout层会在除了最后一层之外的其他输出层加上

bidirectional默认的False,如果我们要是使用双向循环网络的话,那么我们就可以设置这个参数是True

以上就是使用nn.RNN()的一些使用参数

当我们创建好一个RNN网络之后,我们要出入到神经网络数据,神经网络会接收一个序列输入xt,还有一个记忆输入h0,这个记忆输入的维度是(lαyers * direction, batch, hidde),其中layers表示RNN的层数,direction表示RNN的方向,如果双向就是2,如果单向那么就是1,batch表示批量,hidden表示输出维度,还有一点隐藏网络记忆输出的维度也是(lαyers * direction, batch, hidden)

RNN的输出维度是(seq,batch, hidden * diredion),

建立输入维度是20,输出维度是50,两层层的单项RNN网络

Rnn=nn.RNN(input_size=20,hidden_size=50,num_layers=2)

输入20,可以简单的理解为一个RNN模块的输入层的神经元数是20

输出50,可以简单的理解为一个RNN模块的输出层的神经元数是50,也可以理解为隐藏层为50个神经元

Wih为(50*20)

Whh为(50*50)

当我们创建这样的神经网络的时候,我们就可以往这个网络中输入数据了,但要注意维度

因为创建网络的时候,已经指定了input_size=30了,所以我们输入的feature也应该是30,假如输入的维度xt是100,32,20,这个表示序列长度是100,也就是一个样本的长度,有32个样本,然后样本中的每个词的维度是32

然后还可以指定h0的维度2 , 32 , 50。,2表示层数*方向数。32表示样本数,50表示隐藏层的维数。如果在传入网络的时候不特别注明隐藏状态问,那么初始的隐藏状态默认参数全 是 0

input = Variable(torch.randn(100,32,20))

h0 = Variable (torch. randn (2 , 32 , 50))

将数据输入到网络中

output,hn=RNN(input,h0)

此时output的维度是100,32,50,50是输出层的神经元个数

此时hn的维度是2 , 32 , 50

LSTM

LSTM中的维度是普通RNN的四倍,可以理解为wih的维度为(50x4, 20)它的隐藏状态除了h0以外,还多了一个C0它们合在一起成为网络的隐藏状态,而且它们的大小完全一样,就是 (1αyer * direction, batch, hidden),

lstm=nn.LSTM(input_size=20,hidden_size=50,num_layers=2)

创建一个lstm神经网络,它的输入层的神经元是20,输出层的神经元数是50,层数是2层

input = Variable(torch.randn(100,32,20))

out, (hn, cn) = lstm(input)

out100,32,50

hn2,32,50

cn2,32,50

GRU号LSTM相似,先它的隐藏状态参数不再是标准 RNNrr叫的 4 倍,而是 3 倍,可以理解为wih的维度为(50x3,20),而且此时网络的隐藏状态也不在是h0和c0,而只有h0.

相关推荐

SpringBoot整合SpringSecurity+JWT

作者|Sans_https://juejin.im/post/5da82f066fb9a04e2a73daec一.说明SpringSecurity是一个用于Java企业级应用程序的安全框架,主要包含...

「计算机毕设」一个精美的JAVA博客系统源码分享

前言大家好,我是程序员it分享师,今天给大家带来一个精美的博客系统源码!可以自己买一个便宜的云服务器,当自己的博客网站,记录一下自己学习的心得。开发技术博客系统源码基于SpringBoot,shiro...

springboot教务管理系统+微信小程序云开发附带源码

今天给大家分享的程序是基于springboot的管理,前端是小程序,系统非常的nice,不管是学习还是毕设都非常的靠谱。本系统主要分为pc端后台管理和微信小程序端,pc端有三个角色:管理员、学生、教师...

SpringBoot+LayUI后台管理系统开发脚手架

源码获取方式:关注,转发之后私信回复【源码】即可免费获取到!项目简介本项目本着避免重复造轮子的原则,建立一套快速开发JavaWEB项目(springboot-mini),能满足大部分后台管理系统基础开...

Spring Boot的Security安全控制——认识SpringSecurity!

SpringBoot的Security安全控制在Web项目开发中,安全控制是非常重要的,不同的人配置不同的权限,这样的系统才安全。最常见的权限框架有Shiro和SpringSecurity。Shi...

前同事2024年接私活已入百万,都是用这几个开源的SpringBoot项目

前言不得不佩服SpringBoot的生态如此强大,今天给大家推荐几款优秀的后台管理系统,小伙伴们再也不用从头到尾撸一个项目了。SmartAdmin...

值得学习的15 个优秀开源的 Spring Boot 学习项目

SpringBoot算是目前Java领域最火的技术栈了,除了书呢?当然就是开源项目了,今天整理15个开源领域非常不错的SpringBoot项目供大家学习,参考。高富帅的路上只能帮你到这里了,...

开发企业官网就用这个基于SpringBoot的CMS系统,真香

前言推荐这个项目是因为使用手册部署手册非常...

2021年超详细的java学习路线总结—纯干货分享

本文整理了java开发的学习路线和相关的学习资源,非常适合零基础入门java的同学,希望大家在学习的时候,能够节省时间。纯干货,良心推荐!第一阶段:Java基础...

jeecg-boot学习总结及使用心得(jeecgboot简单吗)

jeecg-boot学习总结及使用心得1.jeecg-boot是一个真正前后端分离的模版项目,便于二次开发,使用的都是较流行的新技术,后端技术主要有spring-boot2.x、shiro、Myb...

后勤集团原料管理系统springboot+Layui+MybatisPlus+Shiro源代码

本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目描述后勤集团原料管理系统spr...

白卷开源SpringBoot+Vue的前后端分离入门项目

简介白卷是一个简单的前后端分离项目,主要采用Vue.js+SpringBoot技术栈开发。除了用作入门练习,作者还希望该项目可以作为一些常见Web项目的脚手架,帮助大家简化搭建网站的流程。...

Spring Security 自动踢掉前一个登录用户,一个配置搞定

登录成功后,自动踢掉前一个登录用户,松哥第一次见到这个功能,就是在扣扣里边见到的,当时觉得挺好玩的。自己做开发后,也遇到过一模一样的需求,正好最近的SpringSecurity系列正在连载,就结...

收藏起来!这款开源在线考试系统,我爱了

大家好,我是为广大程序员兄弟操碎了心的小编,每天推荐一个小工具/源码,装满你的收藏夹,每天分享一个小技巧,让你轻松节省开发效率,实现不加班不熬夜不掉头发,是我的目标!今天小编推荐一款基于Spr...

Shiro框架:认证和授权原理(shiro权限认证流程)

优质文章,及时送达前言Shiro作为解决权限问题的常用框架,常用于解决认证、授权、加密、会话管理等场景。本文将对Shiro的认证和授权原理进行介绍:Shiro可以做什么?、Shiro是由什么组成的?举...

取消回复欢迎 发表评论: