百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

对比 MyBatis 和 MyBatis-Plus 批量插入、批量更新的性能和区别

ztj100 2025-02-18 14:22 14 浏览 0 评论

1 环境准备

1.1 搭建 MyBatis-Plus 环境

  1. 创建 maven springboot 工程
  2. 导入依赖:web 启动器、jdbc、、java 连接 mysql、Lombok、druid 连接池启动器、mybatis-plus 启动器
  3. 编写 yaml 配置文件,配置 druid 数据源、mybatis-plus

注意要点:

  1. mapper 接口继承 BaseMapper<实体类>
  2. service 接口继承 IService<实体类>
  3. service 接口实现类继承 ServiceImpl 实现 service 接口

1.2 批量插入测试接口

  1. MyBatis 批量插入接口
@GetMapping("/mybatis-batch-insert") public String mybatisBatchInsert(){ // 开始时间 long stime = System.currentTimeMillis(); // 批量插入 orderService.mySaveBatch(list); // 结束时间 long etime = System.currentTimeMillis(); return "mybatis 批量插入 1w 条数据的时间: " + (etime - stime) / 1000.0 + "秒"; }
  1. Mybatis 的批量插入是调用 mapper 的批量插入接口,使用 标签拼接 sql 进行插入
  2. Mybatis-Plus 批量插入接口
  3. @GetMapping("/mybatis-batch-insert") public String mybatisBatchInsert(){ // 开始时间 long stime = System.currentTimeMillis(); // 批量插入 orderService.mySaveBatch(list); // 结束时间 long etime = System.currentTimeMillis(); return "mybatis 批量插入 1w 条数据的时间: " + (etime - stime) / 1000.0 + "秒"; }
  4. MyBatis-Plus 的批量插入是调用 mybatis-plus 的 IService 接口的 saveBatch 进行批量插入

1.3 批量更新测试接口

  1. MyBatis 批量更新接口
  2. @GetMapping("/mybatis-batch-update") public String mybatisBatchUpdate(){ long stime = System.currentTimeMillis(); orderService.myUpdateBatchById(updateList); long etime = System.currentTimeMillis(); return "mybatis 批量更新 1w 条数据的时间: " + (etime - stime) / 1000.0 + "秒"; }
  3. MyBatis 的批量插入是调用 mapper 的批量更新接口,使用 标签拼接 sql 进行更新,是将多个更新语句拼接在同一个 mapper 接口中,需要在数据库连接 url 添加 allowMultiQueries=true 开启多查询
  4. MyBatis-Plus 批量更新接口
  5. @GetMapping("/mybatis-plus-batch-update") public String mybatisPlusBatchUpdate(){ long stime = System.currentTimeMillis(); orderService.updateBatchById(updateList); long etime = System.currentTimeMillis(); return "mybatis plus 批量更新 1w 条数据的时间: " + (etime - stime) / 1000.0 + "秒"; }
  6. MyBatis -Plus 的批量更新是调用 mybatis-plus 的 IService 接口的 updateBatchById 进行批量更新

2. 性能对比

经过预热,尽量避免了缓存的影响。

2.1 批量插入性能对比

数据量:1w 条数据,每条数据 4 个字段

测试结果:

  • MyBatis:5 次运行平均耗时:0.3212 秒
  • MyBatis-Plus:5次运行平均耗时:1.35 秒
  • MyBatis-Plus(开启批处理):5次运行平均耗时:0.2424 秒

2.2 批量更新性能对比

数据量:1w 条数据,每条数据更新 4 个字段

测试结果:

  • MyBatis:5 次运行平均耗时:1.0378 秒
  • MyBatis-Plus:5次运行平均耗时:1.6448 秒
  • MyBatis-Plus(开启批处理):5次运行平均耗时:0.743 秒

3. 原理探究

3.1 批量插入

3.1.1 MyBatis

MyBatis 的批量插入 xml


    insert into order_table(id, product_id, total_amount, status) values
    
        (#{item.id}, #{item.productId}, #{item.totalAmount}, #{item.status})
    

通过 标签,将插入的数据拼接成一条 SQL 语句,一次性进行插入操作,拼接完的 SQL 语句如下例子:

insert into order_table(id, product_id, total_amount, status) values(1, 2. 2.0, 1),(2, 2, 2.0, 1);

3.1.2 MyBatis-Plus

MyBatis-Plus 的批量插入本质采用 for 遍历每条数据依次插入,但使用了批处理优化,默认是每 1000 条数据,刷新一次 statement 提交到数据库,执行插入操作。

注意:批处理需要在数据库连接中添加 rewriteBatchedStatements=true 否则 jdbc 驱动在默认情况下会无视executeBatch() 语句

源码如下:

@Transactional(rollbackFor = Exception.class)   // 开启事务
@Override
public boolean saveBatch(Collection entityList, int batchSize) {
    String sqlStatement = getSqlStatement(SqlMethod.INSERT_ONE);    // 获得插入 statement
    // 执行批处理操作
    // 参数是:待插入集合,批次大小(默认1000),函数式接口 accept
    return executeBatch(entityList, batchSize, (sqlSession, entity) ->  sqlSession.insert(sqlStatement, entity)); 
}
public static  boolean executeBatch(Class entityClass, Log log, Collection list, int batchSize, BiConsumer consumer) {
    Assert.isFalse(batchSize < 1, "batchSize must not be less than one");
    return !CollectionUtils.isEmpty(list) && executeBatch(entityClass, log, sqlSession -> {
        int size = list.size();
        int idxLimit = Math.min(batchSize, size);
        int i = 1;
        // 遍历插入
        for (E element : list) {
            // 调用 sqlSession.insert(sqlStatement, entity)); 
            // 对元素执行插入操作,但此时数据库还没真正执行插入语句
            consumer.accept(sqlSession, element);   
            // 计数达到 1000 或者 集合结束
            if (i == idxLimit) {        
                 // 刷新 statement 提交批处理语句,数据库真正执行 SQL
                sqlSession.flushStatements();
                idxLimit = Math.min(idxLimit + batchSize, size);
            }
            i++;
        }
    });
}

3.2 批量更新

3.2.1 MyBatis

MyBatis 的批量更新 xml


    
        update order_table
        
            product_id = #{item.productId},
            total_amount = #{item.totalAmount},
            status = #{item.status}
        
        where id = #{item.id}
    

通过 标签,拼接成多条更新的 SQL 语句,一次性提交数据库执行。语句例子如下:

update order_table set product_id = 1, total_amount = 2, status = 1 where id = 1;
update order_table set product_id = 1, total_amount = 2, status = 1 where id = 2;

3.1.2 MyBatis-Plus

MyBatis-Plus 批量更新的原理基本和其批量插入的原理一致,都是调用 executeBatch 执行批处理操作。

4. 优缺点分析

4.1 批量插入

对于批量插入,MyBatis 拼接 SQL 的写法比 MyBatis-Plus 的批量插入方法有明显更高的性能。
但在开启批处理优化之后,MyBatis-Plus 的方法性能更高了。

MyBatis:

  • 优点:性能较高
  • 缺点:在处理大数据量(SQL 语句大于 64MB 时)会报错,MySQL 8.0.33 默认最大 SQL 大小为 64MB
    也要考虑内存异常等问题。

MyBatisPlus:

  • 优点:分组提交,适用于大数据量的处理
  • 缺点:单条插入语句执行,性能较低

总结:

  • 没开启批处理时:10w 数据量以下建议使用 MyBatis、10w 数据量以上建议使用 MyBatis-Plus
  • 开启批处理时:建议使用 MyBatis-Plus

4.2 批量更新

对于批量更新,MyBatis 拼接 SQL 的写法与 MyBatis-Plus 的批量更新方法无明显的性能差别.
大于大数据量,拼接写法甚至容易出现内存耗尽等问题,相比之下 MyBatis-Plus 的方法更优。

总结:建议使用 MyBatis-Plus



相关推荐

其实TensorFlow真的很水无非就这30篇熬夜练

好的!以下是TensorFlow需要掌握的核心内容,用列表形式呈现,简洁清晰(含表情符号,<300字):1.基础概念与环境TensorFlow架构(计算图、会话->EagerE...

交叉验证和超参数调整:如何优化你的机器学习模型

准确预测Fitbit的睡眠得分在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它们的性能。在...

机器学习交叉验证全指南:原理、类型与实战技巧

机器学习模型常常需要大量数据,但它们如何与实时新数据协同工作也同样关键。交叉验证是一种通过将数据集分成若干部分、在部分数据上训练模型、在其余数据上测试模型的方法,用来检验模型的表现。这有助于发现过拟合...

深度学习中的类别激活热图可视化

作者:ValentinaAlto编译:ronghuaiyang导读使用Keras实现图像分类中的激活热图的可视化,帮助更有针对性...

超强,必会的机器学习评估指标

大侠幸会,在下全网同名[算法金]0基础转AI上岸,多个算法赛Top[日更万日,让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。选择正确的验证指...

机器学习入门教程-第六课:监督学习与非监督学习

1.回顾与引入上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。2.监督学习监督学习就像是有老师的教学...

Python教程(三十八):机器学习基础

...

Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置

你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...

超全面讲透一个算法模型,高斯核!!

...

神经网络与传统统计方法的简单对比

传统的统计方法如...

AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程

...

自回归滞后模型进行多变量时间序列预测

下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。假设要预测其中一个变量。比如,sparklingwine。如何建立一个模型来进行预测呢?一种常见的方...

苹果AI策略:慢哲学——科技行业的“长期主义”试金石

苹果AI策略的深度原创分析,结合技术伦理、商业逻辑与行业博弈,揭示其“慢哲学”背后的战略智慧:一、反常之举:AI狂潮中的“逆行者”当科技巨头深陷AI军备竞赛,苹果的克制显得格格不入:功能延期:App...

时间序列预测全攻略,6大模型代码实操

如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,欢迎移步宝藏公众号...

AI 基础知识从 0.4 到 0.5—— 计算机视觉之光 CNN

...

取消回复欢迎 发表评论: