基于大数据的小区域估计的校准数据驱动方法
摘要:大数据集中的响应变量与小区域估计的变量一致时,大数据本身可以提供小区域的估计。这些估计通常受到来自大数据的覆盖和测量误差偏差的影响。然而,如果有同一变量的概率调查数据可用,调查数据可以用作训练数据集,以开发一个算法来对大数据中缺失的数据进行插补,并调整测量误差。在本文中,我们概述了一种基于kNN算法的插补方法,该方法校准到渐近设计无偏估计的国家总体,并用固定-渐近自助法估计小区域混合估计器的方差。我们使用一个公共使用数据集来说明本文的方法,并用它来比较我们的混合估计器与Fay-Harriot(FH)估计器的准确性和精度。最后,我们还在数值上检验了当链接模型中的辅助变量受到覆盖不足误差的影响时,FH估计器的准确性和精度。
作者:Siu-Ming Tam and Shaila Sharmeen
论文ID:2306.03384
分类:Methodology
分类简称:stat.ME
提交时间:2023-08-30