利用约束编程解决网格上的多源/多站点数据移动范式
摘要:高效的数据移动是分布式环境中最重要的方面之一,既能实现快速且协调的数据传输到协作站点,又能在多个站点上分布数据。有了这样的能力,国际分布式合作(如高能物理实验中的合作)可以寻求在地理上分布的计算资源上进行资源利用最佳化或最大化,从而实现真正分布式的任务调度,并且最小化延迟。然而,通常并不清楚如何在有多个源头可用时移动数据,也不清楚如何将数据移动到多个计算资源中以实现可用资源的最优利用。我们提出了一种创建约束编程(CP)模型的方法,该模型包括站点、连接及其属性,如网格网络数据传输的带宽,同时考虑用户任务作为目标函数的一部分,以实现最优解。我们将探讨并解释调度生成时间与最优解之间的权衡,并展示如何通过使用搜索树时间限制、近似、约束(如破对称或将相似任务分组)或通过分割输入问题生成一系列最优调度来改进和有效地确定解决方案。每种情况的数据传输模拟结果还将包括一个著名的点对点模型,并将比较生成调度所需的时间以及执行调度所需的时间与CP最优解。此外,我们还将提出一个可能的实现,旨在以最短时间将分布式数据集(多个源)传输到给定站点。
作者:Michal Zerola, Jerome Lauret, Roman Bartak and Michal Sumbera
论文ID:0901.0148
分类:Performance
分类简称:cs.PF
提交时间:2009-04-14