不可靠通道下的容错计算
摘要:基于消息传递系统中的进程崩溃和广泛的通信故障,我们研究了基本容错原语(如一致性和寄存器)的实现。我们的研究结果表明,在连接约束和同步假设的条件下,实现这些原语所需的必要和充分条件。我们的主要贡献是一种新的部分同步一致性算法,它对进程崩溃和信道故障具有弹性,并且在其连接需求方面是最优的。与之前的工作不同,我们的算法假设消息丢失的最一般模型,其中故障信道是不可靠的,即可以在没有任何公平保证的情况下丢失消息。这种故障模型对一致性算法来说特别具有挑战性,因为它排除了基于领导者神谕和故障检测器的标准解决方案。为了克服这个限制,我们使用一种新的改进的观点同步器抽象构建了我们的解决方案,将其调整为在具有故障信道的崩溃易发生环境中使用。
作者:Alejandro Naser Pastoriza, Gregory Chockler, Alexey Gotsman
论文ID:2305.15150
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-05-25