物理是新数据
摘要:机器学习方法的快速发展从根本上影响了从计算机视觉、生物学和医学到会计和文本分析等各种应用。迄今为止,大规模的并且通常带有标签的数据集的可用性促使了重大突破的实现。然而,这些方法在经典物理学领域的应用相对较慢,这种趋势可以追溯到只基于数据的机器学习的相关方法与物理科学的因果假设驱动本质之间的内在差异。此外,经典机器学习中的异常行为需要解决解释性和公平性等问题。我们还注意到深度学习成为不同科学学科主流的顺序-首先是医学和生物学,然后是理论化学,最后是物理学-这是基于可供 incorporation在机器学习架构中的描述符、约束和因果结构的逐渐复杂程度的根源。在这里,我们提出,在未来十年内,物理学将成为一种新的数据,这将继续从90年代的网络公司和科学计算概念过渡到2000-2010年的大数据,再过渡到2010-2020年的深度学习,最终到启用物理的科学机器学习。
作者:Sergei V. Kalinin, Maxim Ziatdinov, Bobby G. Sumpter, Andrew D. White
论文ID:2204.05095
分类:Data Analysis, Statistics and Probability
分类简称:physics.data-an
提交时间:2022-04-12