现代喷射子标签开发框架
摘要:基于高通量系统的高效开发方法:一种新的工具用于高效全面地进行喷注标记器开发的各个步骤。在训练和性能评估数据中,使用了统一的数据结构。引入这个新的框架减少了需要存储的数据量,同时完成相同的任务,并将算法开发与数据到仿真结果的等待时间从月份缩短到几天,参考了典型的CMS实验流程。充分利用高通量系统,利用最新的神经网络架构Particle Transformer对喷注标记的适应性进行了首次数据到仿真研究。与合作伙伴的官方实现不同,这个新框架允许研究不同的变体,比如不同的训练范式,以及它们对数据/仿真一致性的影响,而不会在磁盘上产生任何新的大文件,并在分析框架的同一运行中进行。除了更加节省时间和存储空间,因此在神经网络训练完成后几个小时内就能获得这类结果之外,该框架目前是唯一一个能够研究对手技术如何影响标记器算法输出和输入的数据/仿真一致性的实现。
作者:Annika Stein
论文ID:2306.17846
分类:High Energy Physics - Experiment
分类简称:hep-ex
提交时间:2023-07-11