专栏中心

EEPW首页 > 专栏 > 分布式系统心跳机制（一）

分布式系统心跳机制（一）

发布人：天翼云开发者时间：2024-07-26 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

本文分享自天翼云开发者社区《分布式系统心跳机制（一）》，作者:白杨

分布式系统架构

当前大部分分布式系统架构如下图：

有一个中心节点来存储集群元数据和管理work儿节点，中心节点采用主备模式来实现HA。当中心节点主故障后，备节点接管业务成为主节点。我们下面讨论的心跳机制就是基于这种分布式架构而设计的。

心跳设计目标：

1.master控制节点的切换，不可以影响server的心跳。

2.server可以感知到master的每一次切换。

3.master在任意场景下都不会丢失server故障的事件。

4.心跳可以作为其它控制消息是否需要重试的依据。

心跳Clien端设计：

a.worker2启动后只有master的列表，并不知道哪个是leader，因此先广播bootstrap信息。

b.只有leader节点响应bootstrap信息，leader生成session id并持久化，返回bootstrap ack 给worker2，标记worker2为Up。

c.worker2收到ack信息本地记录leader的epoch，sessionid等信息作为后续发送心跳的凭证，并进入connected状态。

d.bootstrap ack消息还需要携带，心跳超时时间，假心跳超时时间。

假心跳超时：假心跳超时的时间一般小于心跳超时的时间，例如：心跳超时的时间为5s，假心跳超时的时间就为3s。这主要是为了识别leader切换，当到了假心跳超时时间后，worker将开始广播心跳，尝试连接到新的leader，在心跳超时时间内连接上新的leader则对外是无感知的。

a.worker2进入connected状态后，后续定期发送HB消息给leader，leader返回ACK。

b.如果这时候leader故障了，follwer变成leader，超过假心跳超时时间后将会触发心跳广播。

a.leader故障后，新的leader接管了业务，并且从持久化存储中load起worker2的相关信息，主要是sessionid信息。

b.worker2到达假心跳时间后意识到旧leader可能故障，因此开始广播心跳寻找新的leader。

c.新的leader收到worker2的信息，并且比对sessionid是一致的则接收并返回hb ack。

d.worker2收到新的HB ack后更新新的leader地址与epoch信息，整个流程对外是透明的。

a.worker2找到新leader后，不再广播心跳而是单一的给leader发送。

专栏文章内容及配图由作者撰写发布，仅供工程师学习之用，如有侵权或者其他违规问题，请联系本站处理。联系我们

关键词： 分布式系统 心跳机制

PC机与多MCS-51单片机间的串行通信设计

【摘　要】　主要讲解了IBM－PC机与MCS－51单片机多机系统的通信原理，给出了其硬件接口框图，并详细地分析了系统的 ......

嵌入式系统单片机分布式系统串行通信 2011-07-21

智能手机的耗电特征及APP耗电量测试的两种方法

设计方案心跳机制耗电测试智能手机锂电池移动互联 2015-03-22

光-氢转换系统电力电子模块研究

摘要：研究了用于氢电解槽的数字控制电力电子模块。提出以光伏作为主要能源，以分布式发电的方式进行氢气制备的系统架构，并对系统负载电解槽进行了小信号建模。在此基础上设计了双相降压数字电力电子模块，将光伏输...

电源与新能源电力电子模块光-氢转换分布式系统数字控制 2013-03-19

嵌入式移动数据库与Agent技术原理设计

电子产品世界,为电子工程师提供全面的电子产品信息和行业解决方案,是电子工程师的技术中心和交流中心,是电子产品的市场中心,EEPW 20年的品牌历史,是电子工程师的网络家园...

嵌入式系统分布式系统 Agent技术移动计算 2012-01-06

使用NI VeriStand 2010创建分布式系统

　　概览　　分布式系统有多种形式。例如，在与中央处理器不同的位置处理输入和输出(I/O)的方法通常称为分布式I/O。另一个例子是为单系统添加多个处理器，对运算分布式化。本文讨论了如何使用NI VeriStand 20...

嵌入式系统 NI 分布式系统 2010-11-23

RTI公司和Ansys合作推动关键任务分布式系统设计、仿真和部署创新

最大的自主系统软件框架提供商RTI公司宣布与模拟仿真软件领先提供商Ansys确立合作伙伴关系。此项合作将会加速高性能、高可靠性分布式系统的开发、测试和部署，支持开发团队在没有底层硬件的情况下对其进行模拟仿真，从而使开发设...

嵌入式系统 RTI Ansys 关键任务分布式系统 2023-01-11

基于DSP芯片的分级分布式管理系统设计方案

嵌入式系统 DSP 分布式系统 CCD探测器 2012-05-25

一种基于多DSP协同工作的控制系统

介绍了一种由三个DSP嵌入式子系统构成的基于CAN总线的分布式系统.该系统具有多路信号实时处理、过程控制、与外部测控中心实时交互等功能. ...

资源下载协同工作 DSP 分布式系统 2009-04-03

黑魔书第一章

黑魔书第一章...

资源下载集中式系统分布式系统频率均方根值电抗衰减时间共模电容共模电感 2008-05-26

石定寰：分布式光伏应与新型城镇化建设结合

　　谈及新型城镇化建设，更多的人会想到其将撬动房地产业新一轮的发展。而在国务院参事、中国可再生能源学会理事长石定寰看来，这将为新能源产业尤其是分布式光伏产业的发展带来新的机遇。　　分布式光伏产业目前遇到哪些障碍?如何...

电源与新能源光伏分布式系统 2014-05-19

基于CPCI总线的分布式系统设计应用

...

工控自动化 CompactPCI 分布式系统抽屉机制 2010-12-18

Vxworks下的分布式系统中StarFabric通信协议

为了解决分布式系统中主要采用的以太网互联中高延时、低带宽等问题,采用StarFabric高速总线互联,设计了一个高效的StarFabric传输应用层协议,并在VxWorks操作系统中实现了这个协议的编程接口.经测试Sta...

资源下载 StarGen StarFabric VxWorks 分布式系统通信协议以太网互联 2009-02-12

基于CAN总线的分布式电动型AMT系统

引言电控机械式自动变速器(AMT),是运用微电子技术改造传统手动变速器的典型机电一体化产品。AMT是在干式......

嵌入式系统 CAN总线分布式系统;AMT系统 2012-10-24

基于ARM微控制LPC2138的分布式系统设计

引言分布式控制系统(DistributedControl System，DCS)是应用计算机技术对生产过程进行集中监测、管理和分散 ......

嵌入式系统 ARM LPC2138 分布式系统 2012-11-01

更多 培训课堂

更多焦点

更多视频