Flow-Bench:用于计算工作流异常检测的数据集
摘要:工作流程异常检测对于提高工作流程执行的可靠性是一项重要任务,需要借助基于机器学习的技术。然而,由于缺乏开放数据集和基准测试,该应用有一定的限制。为了填补这一空白,本文提出了以下贡献:(1)我们系统地注入异常并收集在分布式基础设施上执行的工作流程的原始执行日志;(2)我们总结了新数据集的统计信息以及一组开放的数据集,并提供了有启发性的分析;(3)我们通过将工作流程转化为表格和图形结构化数据,对无监督异常检测技术进行了基准测试。我们的研究结果使我们能够检验基准方法的有效性和效率,并确定改进和推广的潜在研究机会。数据集和基准代码可在MIT许可证下在线公开使用。
作者:George Papadimitriou, Hongwei Jin, Cong Wang, Krishnan Raghavan, Anirban Mandal, Prasanna Balaprakash, Ewa Deelman
论文ID:2306.09930
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-06-19