物理学中的机器学习:有毒训练集的陷阱

摘要:用于识别数据中隐藏模式的人工神经网络被认为是最强大的机器学习工具之一。特别是,在凝聚态物理领域,神经网络在识别物质状态和相变方面起到了重要作用。迄今为止,大多数研究都集中在已知不同物质相及其相变的系统上,因此神经网络的性能可以得到有效控制。虽然神经网络提供了一种令人兴奋的新工具来探测新的物质相,但我们在这里证明,当训练集被污染(即糟糕的训练数据或错误标记的数据)时,神经网络很容易给出具有误导性的预测。

作者:Chao Fang, Amin Barzegar, Helmut G. Katzgraber

论文ID:2003.05087

分类:Disordered Systems and Neural Networks

分类简称:cond-mat.dis-nn

提交时间:2020-09-15

PDF 下载: 英文版 中文版pdf翻译中