在复杂系统中测试统计定律

摘要:在复杂系统中,如词频的Zipf定律、地震震级的 Gutenberg-Richter定律或网络中的无标度度分布,大数据集的可用性要求对统计规律有更好的理解。本文讨论了这些规律的统计分析如何受到观测数据中存在的相关性的影响,这是来自复杂系统的数据的典型情况。我们首先展示了标准最大似然方法在存在相关性的情况下会导致对统计规律的错误拒绝。然后,我们提出了一种保守的方法(基于数据的重排和欠采样)来测试统计规律,并发现考虑相关性导致了更小的拒绝率和对估计参数的更大置信区间。

作者:Martin Gerlach and Eduardo G. Altmann

论文ID:1904.11624

分类:Data Analysis, Statistics and Probability

分类简称:physics.data-an

提交时间:2019-04-30

PDF 下载: 英文版 中文版pdf翻译中