大数据空间统计的第二次竞赛
摘要:大型空间和时空数据集的规模在过去几十年中随着数据收集技术的发展迅速增加,这给空间统计中的经典统计方法带来了计算挑战。例如,地质统计中的克里金预测器在处理大密集矩阵运算时,需要高计算能力和内存占用,因此在传统硬件体系结构上变得难以实现。多年来,各种近似方法已被提出来解决这些计算问题,然而,社区缺乏一个全面的评估过程来评估它们的近似效率。为了提供公正的评估,在2021年,我们组织了第一个关于大规模空间统计的竞赛,由我们的ExaGeoStat软件生成数据集,并要求参与者报告估计和预测的结果。由于其广泛的成功和许多参与者的要求,我们在2022年组织了第二次竞赛,重点关注更复杂的空间和时空过程的预测,包括非平稳单变量空间过程、平稳单变量时空过程和平稳双变量空间过程。在本文中,我们详细描述了数据生成过程,并公开提供有价值的数据集以供更广泛地采用。然后,我们回顾了来自全球14个团队的参赛方法,分析了竞赛结果,并评估了每个团队的表现。
作者:Sameh Abdulah, Faten Alamri, Pratik Nag, Ying Sun, Hatem Ltaief, David E. Keyes, Marc G. Genton
论文ID:2211.03119
分类:Other Statistics
分类简称:stat.OT
提交时间:2022-11-08