应用过程挖掘于科学工作流程:案例研究
摘要:基于计算机的科学实验越来越数据密集。高性能计算(HPC)集群非常适合执行大型科学实验工作流。在HPC集群中执行大型科学工作流将导致系统内部复杂的数据和控制流,这些流难以分析。本文提出了一个案例研究,应用过程挖掘技术来分析从基于SLURM的HPC集群中提取的日志,以记录运行的工作流并找到性能瓶颈。挑战在于将系统中记录的作业相关联,以应用主流的过程挖掘技术。用户可能提交具有显式或隐式依赖关系的作业,这要考虑不同的事件相关技术。我们提出了从SLURM集群中提取日志的技术,结合了一个实验。
作者:Zahra Sadeghibogar, Alessandro Berti, Marco Pegoraro, Wil M.P. van der Aalst
论文ID:2307.02833
分类:Databases
分类简称:cs.DB
提交时间:2023-07-07