百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

Keras各种Callbacks介绍(keras中backend常用)

ztj100 2025-06-13 18:13 31 浏览 0 评论

1 前言

在tensorflow.keras中,callbacks能在fitevaluatepredict过程中加入伴随着模型的生命周期运行,目前tensorflow.keras已经构建了许多种callbacks供用户使用,用于防止过拟合、可视化训练过程、纠错、保存模型checkpoints和生成TensorBoard等。通过这篇文章,我们来了解一下如何使用tensorflow.keras里的各种callbacks,以及如何自定义callbacks。

2 使用callbacks

使用callbacks的步骤很简单,先定义callbacks,然后在model.fitmodel.evaluatemodel.predict中把定义好的callbacks传到callbacks参数里即可。

以最常见的ModelCheckpoint为例,使用过程如下示例:

...
model_checkpoint_callback = tf.keras.callbacks.ModelCheckpoint(
    filepath=filePath,
    save_weights_only=True,
    monitor='val_accuracy',
    mode='max')

model.fit(x, y, callbacks=model_checkpoint_callback)

这样在模型训练时,就会将模型checkpoints存储在对应的位置供后续使用。除了ModelCheckpoint,在Tensorflow 2.0中,还有许多其他类型的callbacks供使用,让我们一探究竟。

2.1 EarlyStopping

这个callback能监控设定的评价指标,在训练过程中,评价指标不再上升时,训练将会提前结束,防止模型过拟合,其默认参数如下:

tf.keras.callbacks.EarlyStopping(monitor='val_loss',
        min_delta=0,
        patience=0,
        verbose=0,
        mode='auto',
        baseline=None,
        restore_best_weights=False)

其中各个参数:

  • monitor:callbacks监控的评价指标。
  • min_delta:计作指标提升的最小度量。
  • patience:当评价指标没有提升时,等待的epochs数量,超过此数没有提升后训练将停止。
  • verbose:是否打印日志。
  • mode:设定监控指标的模式,如监控指标是否下降、上升或者根据指标名字自动推断。
  • baseline:监控指标的基准,当模型训练结果不及标准线,训练将停止。
  • restore_best_weights:是否从训练效果最好的epoch恢复模型,如果设置成False,将从最后一个step的模型权重恢复模型。

2.2 LearningRateScheduler

这个callback能在模型训练过程中调整学习率,通常而言,随着训练次数的变多,适当地降低学习率有利于模型收敛在全局最优点,因此这个callback需要搭配一个学习率调度器使用,在每个epoch开始时,schedule函数会获取最新的学习率并用在当前的epoch中:

tf.keras.callbacks.LearningRateScheduler(
    schedule, verbose=0
)

# 调度函数在10个epoch前调用初始学习率,随后学习率呈指数下降
def scheduler(epoch, lr):
  if epoch < 10:
    return lr
  else:
    return lr * tf.math.exp(-0.1)

model = tf.keras.models.Sequential([tf.keras.layers.Dense(10)])
model.compile(tf.keras.optimizers.SGD(), loss='mse')
callback = tf.keras.callbacks.LearningRateScheduler(scheduler)
history = model.fit(np.arange(100).reshape(5, 20), np.zeros(5),
                    epochs=15, callbacks=[callback], verbose=0)

2.3 ReduceLROnPlateau

相比于LearningRateScheduler,ReduceLROnPlateau不是按照预先设定好的调度调整学习率,它会在评价指标停止提升时降低学习率。

tf.keras.callbacks.ReduceLROnPlateau(
    monitor='val_loss', factor=0.1, patience=10, verbose=0,
    mode='auto', min_delta=0.0001, cooldown=0, min_lr=0, **kwargs
)

其中重要参数:

  • factor:学习率降低的程度,new_lr = lr * factor。
  • cooldown:重新监控评价指标前等待的epochs。
  • min_lr:允许的学习率最小值。

2.4 TensorBoard

TensorBoard能很方便地展示模型架构、训练过程,这个callback能生成TensorBoard的日志,当训练结束后可以在TensorBoard里查看可视化结果。

tf.keras.callbacks.TensorBoard(
    log_dir='logs', histogram_freq=0, write_graph=True,
    write_images=False, write_steps_per_second=False, update_freq='epoch',
    profile_batch=2, embeddings_freq=0, embeddings_metadata=None, **kwargs
)

其中重要参数:

  • log_dir:日志输出的路径。
  • histogram_freq:计算激活函数和权重直方图的频率,如果设置为0,则不计算直方图。
  • write_graph:是否在TensorBoard中可视化图像。
  • update_freq:取值为batchepoch或整数,将在指定的过程结束后将损失和评价指标写入TensorBoard。如果设置为整数,则意味着在设定数量的样本训练完后将损失和评价指标写入TensorBoard。

2.5 CSVLogger

顾名思义,这个callback能将训练过程写入CSV文件。

tf.keras.callbacks.CSVLogger(
    filename, separator=',', append=False
)

其中重要参数:

  • append:是否接着现有文件继续写入日志。

2.6 TerminateOnNaN

在损失变为NaN时停止训练。

tf.keras.callbacks.TerminateOnNaN()

2.7 自定义callback

除了上述callback外,还有一些callback可以查询TensorFlow官网[1],在使用多个callbacks时,可以使用列表将多个callbacks传入、或者使用
tf.keras.callbacks.CallbackList
[2]
。除此之外,也可以自定义callback,需要继承keras.callbacks.Callback,然后重写在不同训练阶段的方法。

training_finished = False

class MyCallback(tf.keras.callbacks.Callback):
  def on_train_end(self, logs=None):
    global training_finished
    training_finished = True

model = tf.keras.Sequential([tf.keras.layers.Dense(1, input_shape=(1,))])
model.compile(loss='mean_squared_error')
model.fit(tf.constant([[1.0]]), tf.constant([[1.0]]),
          callbacks=[MyCallback()])

assert training_finished == True

3 总结

本文总结了若干常用的tf.keras.callbacks,实际工作中,请按需使用,并且查看tf.keras.callbacks的官方文档确认参数取值。

希望这次的分享对你有帮助,欢迎在评论区留言讨论!

参考资料

[1] tf.keras.callbacks: 'https://www.tensorflow.org/api_docs/python/tf/keras/callbacks'

[2] tf.keras.callbacks.CallbackList: https://www.tensorflow.org/api_docs/python/tf/keras/callbacks/CallbackList

相关推荐

Jquery 详细用法

1、jQuery介绍(1)jQuery是什么?是一个js框架,其主要思想是利用jQuery提供的选择器查找要操作的节点,然后将找到的节点封装成一个jQuery对象。封装成jQuery对象的目的有...

前端开发79条知识点汇总

1.css禁用鼠标事件2.get/post的理解和他们之间的区别http超文本传输协议(HTTP)的设计目的是保证客户机与服务器之间的通信。HTTP的工作方式是客户机与服务器之间的请求-应答协议。...

js基础面试题92-130道题目

92.说说你对作用域链的理解参考答案:作用域链的作用是保证执行环境里有权访问的变量和函数是有序的,作用域链的变量只能向上访问,变量访问到window对象即被终止,作用域链向下访问变量是不被允许的。...

Web前端必备基础知识点,百万网友:牛逼

1、Web中的常见攻击方式1.SQL注入------常见的安全性问题。解决方案:前端页面需要校验用户的输入数据(限制用户输入的类型、范围、格式、长度),不能只靠后端去校验用户数据。一来可以提高后端处理...

事件——《JS高级程序设计》

一、事件流1.事件流描述的是从页面中接收事件的顺序2.事件冒泡(eventbubble):事件从开始时由最具体的元素(就是嵌套最深的那个节点)开始,逐级向上传播到较为不具体的节点(就是Docu...

前端开发中79条不可忽视的知识点汇总

过往一些不足的地方,通过博客,好好总结一下。1.css禁用鼠标事件...

Chrome 开发工具之Network

经常会听到比如"为什么我的js代码没执行啊?","我明明发送了请求,为什么反应?","我这个网站怎么加载的这么慢?"这类的问题,那么问题既然存在,就需要去解决它,需要解决它,首先我们得找对导致问题的原...

轻量级 React.js 虚拟美化滚动条组件RScroll

前几天有给大家分享一个Vue自定义滚动条组件VScroll。今天再分享一个最新开发的ReactPC端模拟滚动条组件RScroll。...

一文解读JavaScript事件对象和表单对象

前言相信做网站对JavaScript再熟悉不过了,它是一门脚本语言,不同于Python的是,它是一门浏览器脚本语言,而Python则是服务器脚本语言,我们不光要会Python,还要会JavaScrip...

Python函数参数黑科技:*args与**kwargs深度解析

90%的Python程序员不知道,可变参数设计竟能决定函数的灵活性和扩展性!掌握这些技巧,让你的函数适应任何场景!一、函数参数设计的三大进阶技巧...

深入理解Python3密码学:详解PyCrypto库加密、解密与数字签名

在现代计算领域,信息安全逐渐成为焦点话题。密码学,作为信息保护的关键技术之一,允许我们加密(保密)和解密(解密)数据。...

阿里Nacos惊爆安全漏洞,火速升级!(附修复建议)

前言好,我是threedr3am,我发现nacos最新版本1.4.1对于User-Agent绕过安全漏洞的serverIdentitykey-value修复机制,依然存在绕过问题,在nacos开启了...

Python模块:zoneinfo时区支持详解

一、知识导图二、知识讲解(一)zoneinfo模块概述...

Golang开发的一些注意事项(一)

1.channel关闭后读的问题当channel关闭之后再去读取它,虽然不会引发panic,但会直接得到零值,而且ok的值为false。packagemainimport"...

Python鼠标与键盘自动化指南:从入门到进阶——键盘篇

`pynput`是一个用于控制和监控鼠标和键盘的Python库...

取消回复欢迎 发表评论: