大规模微服务集群弹性资源配置的阿里巴巴云实践
摘要:云原生架构在当前的云计算环境中变得越来越重要,因为它需要在应用程序开发中实现速度和灵活性。它利用微服务技术将传统的单片应用程序分解成轻量级、自包含的微服务组件。然而,随着微服务规模的增长和动态相互依赖关系的产生,传统的资源调度方法无法完全解决资源分配方面的新挑战。不同资源需求和延迟要求的各种微服务可以创建复杂的调用链,这使得难以为每个组件提供细粒度和准确的资源分配,同时保持整个链路的服务质量。在这项工作中,我们旨在解决如何为不断增长的微服务平台高效提供资源并确保延迟关键的微服务性能的研究问题。为了解决这个问题,我们对阿里巴巴的微服务集群进行了深入分析,并提出了优化的资源分配算法,以提高资源利用率并确保延迟需求。首先,我们分析了阿里巴巴集群中微服务与传统应用程序的不同特点。然后,我们介绍了阿里巴巴的资源能力配置工作流和框架,以应对大规模和延迟关键的微服务集群中的资源分配挑战。最后,我们提出了基于不同工作负载模式的改进资源分配算法,通过做出积极和反应式的调度决策,可以在阿里巴巴集群中提高10-15%的资源使用率,同时保持微服务所需的必要延迟。
作者:Minxian Xu, Lei Yang, Yang Wang, Chengxi Gao, Linfeng Wen, Guoyao Xu, Liping Zhang, Kejiang Ye, Chengzhong Xu
论文ID:2308.15315
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-08-30