FaaSwap:基于SLO感知和高效GPU的无服务器推断通过模型交换

摘要:FaaSwap: 一种支持资源高效的机器学习推理的服务器平台

作者:Minchen Yu, Ao Wang, Dong Chen, Haoxuan Yu, Xiaonan Luo, Zhuohao Li, Wei Wang, Ruichuan Chen, Dapeng Nie, Haoran Yang

论文ID:2306.03622

分类:Distributed, Parallel, and Cluster Computing

分类简称:cs.DC

提交时间:2023-06-07

PDF 下载: 英文版 中文版pdf翻译中