易受链接故障影响的网络中的断连协议
摘要:在任意拓扑结构的同步网络中,我们考虑用确定性分布式算法达成一致。链接是双向的,容易发生故障,而节点始终保持无故障状态。有故障的链接可能会省略消息。节点之间一致是指在通过移除有故障的链接而获得的每个连通子图中都成立。我们称之为“断开一致性(disconnected agreement)”。我们引入了“延伸(stretch)”的概念,它是通过移除有故障的链接获得的连通子图的数量减去1,再加上连通子图的直径之和。我们通过引用延伸来定义“快速(fast)”和“提前停止(early-stopping)”算法,用于断开一致性。一个网络有n个节点和m个链接。通常假设节点知道自己的名称,并能够将通信与本地端口关联起来。如果我们还假设所有节点都知道延伸的上界lambda,那么存在一个在时间O(lambda)内使用O(log n)位消息的断开一致性算法。我们给出了一个通用的断开一致性算法,在n+1个回合内使用O(log n)位消息。设lambda是在执行过程中发生的未知延伸,我们给出了一个在时间(lambda+2)^3内使用O(nlog n)位消息的算法。我们证明了断开一致性可以在最优O(lambda)的时间内解决,但代价是将消息大小增加到O(mlog n)。我们还设计了一种算法,只使用O(n)个无故障链接,在时间O(n m)内工作,节点初始时将其端口映射到邻居,并且消息携带O(mlog n)位。我们对断开一致性解决方案的性能进行了下界证明,这些下界与不断变化的网络拓扑参数和节点可用的知识有关。
作者:Bogdan S. Chlebus and Dariusz R. Kowalski and Jan Olkowski and Jedrzej Olkowski
论文ID:2102.01251
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-06-27