为会计目的定义一个规范单位

摘要:批量计算系统旨在最大化计算资源的利用率,但这类集群中的计算节点(包括物理和逻辑节点)通常包含多个互补资源,例如CPU、GPU、内存和临时存储。用户的作业通常需要多种资源,因此在多用户环境中需要对部分节点进行协同调度权衡。为了计费或调度开销的考虑,同时考虑所有这些资源是非常重要的。因此,我们定义了基于阈值的“规范单位”的概念,将多种资源类型组合成单个离散单位,并将其用于描述调度开销并使资源计费更加公平,既适用于资源提供者,也适用于用户。需要注意的是,规范单位的确切定义不是固定的,可能因不同的资源提供者而有所差异。然而,在Open Science Grid的背景下,我们提供了一个模板和两个示例定义,认为这些是合适的。

作者:Fabio Andrijauskas, Igor Sfiligoi and Frank W"urthwein

论文ID:2305.10551

分类:Distributed, Parallel, and Cluster Computing

分类简称:cs.DC

提交时间:2023-05-19

PDF 下载: 英文版 中文版pdf翻译中