基于深度生成模型的数据增强与演示:使用BFBT基准空隙率数据集

摘要:深度学习在计算机视觉和自然语言处理等多个领域取得了显著的成功,这要归功于“大数据”的可用性。然而,在许多核工程问题中,这样的成功很难复制,因为训练数据有限,特别是当数据来自高成本实验时。为了克服这种数据匮乏的问题,本文探讨了深度生成模型(DGMs)在科学数据增强中的应用。DGMs,如生成对抗网络(GANs),归一化流(NFs),变分自动编码器(VAEs)和条件VAEs(CVAEs),可以被训练用来学习训练数据集的潜在概率分布。一旦训练完成,它们可以用来生成与训练数据相似的合成数据,并显著扩大数据集的大小。通过使用DGMs增强基于NUPEC沸腾水堆全尺寸细网束试验(BFBT)基准的TRACE模拟数据的稳态空穴率,本研究证明VAEs,CVAEs和GANs在合成数据中具有可比较的生成性能,以及类似的误差,其中CVAEs的误差最小。研究结果表明,DGMs在核工程中增强科学数据具有巨大潜力,这对于扩大训练数据集并使其他深度学习模型更准确地训练起到了积极的作用。

作者:Farah Alsafadi, Xu Wu

论文ID:2308.10120

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-22

PDF 下载: 英文版 中文版pdf翻译中