百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

重新刷新你对Redis集群的理解(重新刷新你对redis集群的理解和看法)

ztj100 2025-02-03 16:17 19 浏览 0 评论

Redis集群

Redis 集群通过 分片 来进行数据共享,并提供复制和故障转移功能。

1. 节点

1.1 节点的握手

Redis 集群中各个节点使用 CLUSTER MEET 命令进行连接。

CLUSTER MEET <ip> <port>

向一个节点 node 发送 CLUSTER MEET 命令,可以让 node 节点与 ip 和 port 的指定节点进行 握手 。握手成功后,node 节点会将目标节点添加到 node 节点所在的集群中。

重复这个操作,可以让多个节点处于同一集群。

1.2 集群数据结构

  • clusterNode 结构 保存了一个节点的当前状态,包括节点创建时间、节点名字、节点配置纪元、节点 IP 地址和端口号等等。
  • clusterLink 结构 是 clusterNode 的一个属性,保存了连接节点所需的有关信息,比如套接字描述符、输入缓冲区和输出缓冲区等等。
  • clusterState 结构 被每个节点所保存,记录了当前节点视角下集群所处状态,例如集群是在线还是下线,集群包含多少个节点,集群当前的配置纪元等等。

1.3 CLUSTER MEET命令实现

收到命令的节点 A 将与目标节点 B 进行 握手

2. 槽指派

2.1 Redis中的槽

Redis 集群通过分片来保存数据库中的键值对,集群的整个数据库被分为 16384 个槽,数据库中的每个键都属于这 16384 个槽中的一个,集群中的每个节点可以处理 0 个或最多 16384 个槽。

当数据库中的 16384 个槽都有节点在处理,集群处于 上线状态 。如果有任何一个槽没有节点处理,那么集群处于 下线状态

通过向节点发送 CLUSTER ADDSLOTS 命令,我们可以将一个或多个槽指派给节点负责。例如以下命令可以将槽 0~5000 指派给节点 7000 负责:

127.0.0.1:7000> CLUSTER ADDSLOTS 0 1 2 3 4 ... 5000

2.2 记录节点的槽指派信息

clusterNode 结构的 slots 属性和 numslot 属性记录了节点负责处理哪些槽。

slots
numslots

2.3 传播节点的槽指派信息

节点会将自己的 slots 数组通过消息发送给集群中的其他节点,告诉他们自己目前负责处理哪些槽。

当节点 A 通过消息从节点 B 那里接收到节点 B 的 slots 数组时,会在自己的 clusterState.nodes 字典中查找节点 B 对应的 clusterNode 结构,并进行更新。

3. 在集群中执行命令

上线状态的集群可以执行命令。

当客户端向节点发送命令时,接受命令的节点会检查命令要处理的数据库键属于哪个槽,并检查这个槽是否指派给了自己。

MOVED

3.1 计算键属于哪个槽

redis使用如下算法来计算给定的 key 属于哪个槽

def slot_number(key):
	return CRC16(key) & 16383

CRC16(key) 语句计算出 keyCRC-16 校验和,而 & 16383 计算出一个介于 0 和 16383 之间的整数作为key的槽号。

CLUSTER KEYSLOT 命令是根据上面的槽分配算法来实现的。

3.2 判断槽是否由当前节点负责

检查自己的 slots 数组中的对应位置即可。

3.3 MOVED错误

MOVED 错误的格式为:

MOVED <slot> <ip>:<port>

客户端可以根据 MOVED 错误,转向正确的节点。

3.4 节点数据库的实现

除了将键值对保存在数据里面外,节点还会用 clusterState 结构中的 slots_to_keys 跳跃表来保存槽和键之间的关系。

该跳表的每个节点的分值都是一个槽号。而每个节点的成员都是一个数据库键。

使用这个跳表,可以方便地对属于某些槽的所有数据库键进行批量操作。

4. 重新分片

4.1 重新分片流程

Redis 集群的重新分片操作可以令分派给某个槽的节点重新分派给另一个节点。重新分片可以在线进行,过程中集群不需要下线,且可以正常处理命令请求。

重新分片由 Redis 集群管理软件 redis-trib 负责执行。

重新分片流程如上图。如果要分片的槽属于多个节点,就要对多个节点发送命令。

4.2 ASK错误

重新分片期间可能出现一种情况:属于被迁移槽的一部分键值对保存在源节点里面,另一部分键值对保存在目标节点里面。

此时当客户端向源节点发送一个命令,并且要求处理的数据库键恰好正在被迁移:

  • 源节点现在自己的数据找,找到就直接发送命令。
  • 没找到就向客户端返回 ASK 错误,指引客户端转向目标节点执行命令。

一个 ASK 错误如下图所示:

收到 ASK 错误的客户端会根据错误提供的 IP 地址和端口号,转向目标节点,先向目标节点发送一个 ASKING 命令,之后再重新发送原本要执行的命令。

ASKING 命令可以打开发送该命令的客户端的 REDIS_ASKING 标识。这在服务端接收到后面的命令时有用。

正在进行重新分片的服务端判断发送请求的客户端的 ASKING 标识是否打开

  • 如果打开,该客户端的请求是一个槽分派时的重定向请求,正常执行。
  • 如果没打开,该客户端的请求是一个普通的寻址错误的命令请求,返回 MOVED 错误。

5. 复制和故障转移

Redis 集群中的主节点用于处理槽,从节点用于复制某个主节点,并且在被复制的主节点下线时接替它。

假如某个场景下服务器间的状态如下:

假如主服务器 7000 下线,那么剩余的主服务器即 7001、7002、7003 会从 7000 的两个从服务器 7004、7005 选择一个接管 7000 负责的槽。另一个从服务器会变成新主服务器的从服务器。

如果后续 7000 重新上线,它会变成 7004 的新主节点。

5.1 故障检测

集群中每个节点会定时向集群中的其它节点发送 PING 消息,以此检测对方是否下线。如果接收 PING 的节点没有在规定时间内返回 PONG 消息,就会被标记为 疑似下线

集群中的节点在别的节点的视角下有三种状态: 在线、疑似下线、已下线。

当一个主节点 A 通过消息得知主节点 B 认为主节点 C 进入疑似下线时,主节点 A 会在自己的 clusterState.nodes 字典中找到主节点 C 对应的 clusterNode 结构,并将主节点 B 的下线报告添加到 clusterNode 结构的 fail_reports 链表中。

如果在集群中,有一个主节点发现半数以上的主节点都将某个主节点 x 标记为意思下线,那么他将把这个主节点标记为已下线,并向其他所有节点广播 FAIL 消息。

5.2 故障转移

当一个从节点发现自己正在复制的主节点进入已下线状态时,从节点将开始对下线主节点进行故障转移操作:

  1. 第一个发现问题的主节点举行一个选举,要求自己称为新的主节点。选举的规则和 Sentinel 中选举领头 Sentinel 非常相似,他们都基于 Raft 算法的领头选举方法。
  2. 成功则称为新主节点
  3. 失败则等待下一个从节点提出选举。
  4. 被选中的从节点执行 SLAVEOF no one 命令,成为新的主节点。
  5. 新的主节点接管已下线主节点的全部槽指派。
  6. 新主节点广播 PONG 消息,让别的节点知道自己已经成为主节点。
  7. 新主节点开始行使主节点职责

原文 https://www.cnblogs.com/WangXianSCU/p/15898007.html

相关推荐

其实TensorFlow真的很水无非就这30篇熬夜练

好的!以下是TensorFlow需要掌握的核心内容,用列表形式呈现,简洁清晰(含表情符号,<300字):1.基础概念与环境TensorFlow架构(计算图、会话->EagerE...

交叉验证和超参数调整:如何优化你的机器学习模型

准确预测Fitbit的睡眠得分在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它们的性能。在...

机器学习交叉验证全指南:原理、类型与实战技巧

机器学习模型常常需要大量数据,但它们如何与实时新数据协同工作也同样关键。交叉验证是一种通过将数据集分成若干部分、在部分数据上训练模型、在其余数据上测试模型的方法,用来检验模型的表现。这有助于发现过拟合...

深度学习中的类别激活热图可视化

作者:ValentinaAlto编译:ronghuaiyang导读使用Keras实现图像分类中的激活热图的可视化,帮助更有针对性...

超强,必会的机器学习评估指标

大侠幸会,在下全网同名[算法金]0基础转AI上岸,多个算法赛Top[日更万日,让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。选择正确的验证指...

机器学习入门教程-第六课:监督学习与非监督学习

1.回顾与引入上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。2.监督学习监督学习就像是有老师的教学...

Python教程(三十八):机器学习基础

...

Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置

你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...

超全面讲透一个算法模型,高斯核!!

...

神经网络与传统统计方法的简单对比

传统的统计方法如...

AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程

...

自回归滞后模型进行多变量时间序列预测

下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。假设要预测其中一个变量。比如,sparklingwine。如何建立一个模型来进行预测呢?一种常见的方...

苹果AI策略:慢哲学——科技行业的“长期主义”试金石

苹果AI策略的深度原创分析,结合技术伦理、商业逻辑与行业博弈,揭示其“慢哲学”背后的战略智慧:一、反常之举:AI狂潮中的“逆行者”当科技巨头深陷AI军备竞赛,苹果的克制显得格格不入:功能延期:App...

时间序列预测全攻略,6大模型代码实操

如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,欢迎移步宝藏公众号...

AI 基础知识从 0.4 到 0.5—— 计算机视觉之光 CNN

...

取消回复欢迎 发表评论: