百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

Mysql索引优化,分表为什么要基于索引高度,100%经验干活

ztj100 2025-05-27 19:15 7 浏览 0 评论

真正处理过Mysql大数据量优化的面试官,一般都会问:Mysql单表超过多少行就要考虑分表呢?那咱们就看下面试官的套路吧。

一、说一下Mysql索引的底层原理(开胃小菜,面试官埋坑的开始)

1、Hash索引:

1.1、hash索引存储的是索引列的hash值+数据指针,适合直接命中查询,就是等于查询

1.2、比如:select xxx from xx表 where xx字段=xxx值,这时候,会得到xxx值的hashcode值,然后刚才提到了hash表存了hashcode和数据指针,然后就根据数据指针找寻对应的行数据。

2、B+Tree索引

1.1、B+Tree索引底层是一种改良版的而查询,节点可以存多个值,而且叶子节点通过指针链接,适合范围遍历,所以范围检索的时候适合使用B+tree索引。

二、为什么B+tree索引那么设计树结构(这才是面试官的主题开始,接招吧)

1、节点存放多个值,主要是为了降低树的高度,因为树的高度降低了,那么相应的磁盘IO的代价也降低了。

三、那你有没有做过分表操作(看你挺明白,不会是背的八股文吧,考考你实战经验)

1、做过的(入坑啊,不这么回答也不行啊,你面的都是高级岗对吧)

四、那你分表的依据,或者你单表超过多少就考虑分表的(好了,核心来了,迎战吧)

1、网上那些流言真是头疼,什么所谓的单表超过2000万就要分表。听到这些一般都是回去等通知吧。

2、实际是需要计算,同时还需要看mysql元信息表:information_schema的innode_sys信息,会准确显示表的B+tree树的高度,一般情况下不要超过4层(但是实际还是需要进行查询压测的哈,没那么绝对)。

3、Mysql最小存储单元是Page(页),B+Tree每一层的每一个节点都是一个Page(叶子节点存的是整行数据,非叶子节点存的是键值对和子节点的Page指针)

4、计算过程:

4.1、 一个Page大概是16K。

4.2、一张表的主键一般都是bigint,先不考虑自定义的。那么占用8个字节,page指针占用6个字节,那么一共14个字节,那么一个page16K*1024字节/14字节=1170个存储单元。

4.3、假设一条数据2K,那么可以存储1170*(16/2)=9360条数据。

4.4、那么树高度为3的话能存储1170*1170*8=10951200条数据。

4.5、树高度为4的话存储就得数十亿了,检索性能就会急剧下降。

5、所以最好的判断依据是:基于数据压测+查看mysql元数据的Btree树高度来决策。阿里开发手册建议是超过500万行分表,但是我还是建议按上述逻辑执行得出一个数值来执行。

相关推荐

Spring IoC Container 原理解析

IoC、DI基础概念关于IoC和DI大家都不陌生,我们直接上martinfowler的原文,里面已经有DI的例子和spring的使用示例...

SQL注入:程序员亲手打开的潘多拉魔盒,如何彻底封印它?

一、现象:当你的数据库开始"说话",灾难就来了场景还原:...

Java核心知识3:异常机制详解

1什么是异常异常是指程序在运行过程中发生的,由于外部问题导致的运行异常事件,如:文件找不到、网络连接失败、空指针、非法参数等。异常是一个事件,它发生在程序运行期间,且中断程序的运行。...

MyBatis常用工具类三-使用SqlRunner操作数据库

MyBatis中提供了一个非常实用的、用于操作数据库的SqlRunner工具类,该类对JDBC做了很好的封装,结合SQL工具类,能够很方便地通过Java代码执行SQL语句并检索SQL执行结果。SqlR...

爆肝2W字梳理50道计算机网络必问面试题

1.说说HTTP常用的状态码及其含义?思路:这道面试题主要考察候选人,是否掌握HTTP状态码这个基础知识点。...

SpringBoot整合Vue3实现发送邮箱验证码功能

1.效果演示2.思维导图...

最全JAVA面试题及答案(200+)

Java基础1.JDK和JRE有什么区别?JDK:JavaDevelopmentKit的简称,Java开发工具包,提供了Java的开发环境和运行环境。JRE:JavaRunti...

Java程序员找工作翻车现场!你的项目描述踩了这几个坑?

Java程序员找工作翻车现场!你的项目描述踩了这几个坑?噼里啪啦敲了三年代码,简历一投石沉大海?兄弟,问题可能出在项目描述上!知道为什么面试官看你的项目像看天书吗?因为你写了三个致命雷区:第一,把项目...

2020最新整理JAVA面试题附答案,包含19个模块共208道面试题

包含的模块:本文分为十九个模块,分别是:Java基础、容器、多线程、反射、对象拷贝、JavaWeb、异常、网络、设计模式、Spring/SpringMVC、SpringBoot/Spring...

底层原理深度解析:equals() 与 == 的 JVM 级运作机制

作为Java开发者,你是否曾在集合操作时遇到过对象比较的诡异问题?是否在使用HashMap时发现对象丢失?这些问题往往源于对equals()和==的误解,以及实体类中这两个方法的不当实...

雪花算法,什么情况下发生 ID 冲突?

分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的...

50个Java编程技巧,免费送给大家

一、语法类技巧1.1.使用三元表达式普通:...

如何规划一个合理的JAVA项目工程结构

由于阿里Java开发手册对于工程结构的描述仅限于1、2节简单的概述,不能满足多样的实际需求,本文根据多个项目中工程的实践,分享一种较为合理实用的工程结构。工程结构的原则有依据、实用。有依据的含义是指做...

Java 编程技巧之单元测试用例编写流程

温馨提示:本文较长,同学们可收藏后再看:)前言...

MyBatis核心源码解读:SQL执行流程的奇妙之旅

MyBatis核心源码解读:SQL执行流程的奇妙之旅大家好呀!今天咱们要来一场既烧脑又有趣的旅程——探索MyBatis这个强大框架的核心秘密。你知道吗?当你在项目里轻轻松松写一句“select*f...

取消回复欢迎 发表评论: