百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

Dropout和标准化(Batch Normalization)

ztj100 2025-07-20 00:02 5 浏览 0 评论

1.介绍

深度学习的世界不仅仅是致密层。有几十种类型的层可以添加到模型中(尝试浏览Keras文档以获取示例!)有些像致密层,定义了神经元之间的联系,有些则可以进行预处理或其他类型的转换。

这儿,我们将介绍两种特殊的层,它们本身不包含任何神经元,但它们添加了一些功能,有时可以以各种方式使模型受益。

2.Dropout

其中第一个是“dropout layer”,它可以帮助纠正过拟合。

在上一课中,我们讨论了网络学习训练数据中的模型是如何导致过度拟合的。为了识别这些模型,一个网络通常会依赖于一个非常特定的权重组合。如此具体,他们往往是脆弱的:删除一个将会分崩离析。

这就是dropout背后的想法。为了打破这些问题,我们在训练的每一步都会随机丢弃一层输入单元的一小部分,这使得网络很难从训练数据中学习到那些虚假的信息。相反,它必须寻找广泛的、一般的模式,这些模式的权重往往更为稳健。

你也可以把dropout看作是创造一种网络的集合。这些预测将不再由一个大的网络做出,而是由一个较小的网络组成的委员会做出。委员会中的个人往往会犯各种各样的错误,但同时使委员会作为一个整体比任何个人都好(如果你熟悉将随机林作为决策树的集合,则是相同的想法。)

3.Batch Normalization

我们将看到的下一个特殊层执行“批处理标准化”(“batch normalization”, “batchnorm”),这有助于纠正缓慢或不稳定的训练。

对于神经网络,将所有数据放在一个共同的尺度上通常是一个好主意,也许可以使用sciketlearn的StandardScaler或MinMaxScaler之类的工具。原因是SGD将根据数据产生的激活量按比例改变网络权重。倾向于产生不同大小激活的特性可能导致不稳定的训练行为。

现在,如果在数据进入网络之前对其进行规范化是好的,那么在网络内部进行规范化也会更好!事实上,我们有一种特殊的层可以做到这一点,批处理规范化层。批处理标准化层在每个批处理进入时查看它,首先用它自己的平均值和标准偏差对批处理进行标准化,然后用两个可训练的重缩放参数将数据放在一个新的尺度上。实际上,Batchnorm对其输入执行一种协调的重缩放。

大多数情况下,batchnorm是作为优化过程的辅助工具添加的(尽管有时也有助于预测性能)。具有batchnorm的模型往往需要较少的时间来完成训练。此外,batchnorm还可以解决各种可能导致训练“卡住”的问题。在训练过程中遇到问题时,可以考虑向模型添加批量规范化。

4.例子

相关推荐

爬取电影视频数据(电影资源爬虫)

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。作者:yangrq1018原文链接:https://segmentfault.com/a/11900...

Python效率倍增的10个实用代码片段

引言Python是一门功能强大且灵活的编程语言,广泛应用于数据分析、Web开发、人工智能等多个领域。它的简洁语法和高可读性让开发者能够快速上手,但在实际工作中,我们常常会遇到一些重复性或繁琐的任务。这...

Python数据处理:深入理解序列化与反序列化

在现代编程实践中,数据的序列化与反序列化是数据持久化、网络通信等领域不可或缺的技术。本文将深入探讨Python中数据序列化与反序列化的概念、实现方式以及数据验证的重要性,并提供丰富的代码示例。...

亿纬锂能:拟向PKL买地,在马来西亚建立锂电池制造厂

亿纬锂能5月12日公告,亿纬马来西亚与PEMAJUKELANGLAMASDN.BHD.(PKL)签订《MEMORANDUMOFUNDERSTANDING》(谅解备忘录),亿纬马来西亚拟向PKL购买标的...

一个超强的机器学习库(spark机器学习库)

简介PyCaret...

30天学会Python编程:9. Python文件与IO操作

9.1文件操作基础9.1.1文件操作流程9.1.2文件打开模式表9-1Python文件打开模式...

Python的Pickle序列化与反序列化(python反序列化json)

动动小手,点击关注...

python进阶突破内置模块——数据序列化与格式

数据序列化是将数据结构或对象转换为可存储/传输格式的过程,反序列化则是逆向操作。Python提供了多种工具来处理不同场景下的序列化需求。一、核心内置模块...

微信聊天记录可视化工具详细介绍(微信聊天记录分析报告小程序)

功能概要能做什么...

Python常用文件操作库使用详解(python中文件操作的相关函数有哪些)

Python生态系统提供了丰富的文件操作库,可以处理各种复杂的文件操作需求。本教程将介绍Python中最常用的文件操作库及其实际应用。一、标准库核心模块1.1os模块-操作系统接口主要功能...

Vue3+Django4全新技术实战全栈项目(已完结)

获课》aixuetang.xyz/5739/Django与推荐算法的集成及模型部署实践...

性能调优方面,经常要优化跑的最慢的代码,教你一种快速的方法

在我们遇到性能问题的时候,很多时候需要去查看性能的瓶颈在哪里,本篇文章就是提供了多种常用的方案来监控函数的运行时间。1.time首先说明,time模块很多是系统相关的,在不同的OS中可能会有一些精度差...

Python解决读取excel数据慢的问题

前言:在做自动化测试的时候,我思考了一个问题,就是如果我们的测试用例随着项目的推进越来越多时,我们做自动化回归的时间也就越来越长,其中影响自动化测试速度的一个原因就是测试用例的读取问题。用例越多,所消...

【Python机器学习系列】基于Flask来构建API调用机器学习模型服务

这是我的第364篇...

不会用mmdet工具?速看MMDetection工具的终极指南

来源:计算机视觉工坊添加微信:dddvisiona,备注:目标检测,拉你入群。文末附行业细分群...

取消回复欢迎 发表评论: