FaaSwap:基于SLO感知和高效GPU的无服务器推断通过模型交换
摘要:FaaSwap: 一种支持资源高效的机器学习推理的服务器平台
作者:Minchen Yu, Ao Wang, Dong Chen, Haoxuan Yu, Xiaonan Luo, Zhuohao Li, Wei Wang, Ruichuan Chen, Dapeng Nie, Haoran Yang
论文ID:2306.03622
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-06-07