稳健回归带惩罚修剪平方的快速算法
摘要:线性回归模型中存在包含高杠杆异常值的群体,使得该问题变得困难,因为存在掩盖效应。基于最小修剪平方的高容忍异常值估计器通常在有限样本中无法成功检测掩盖的高杠杆异常值。本文作者在cite{ZiouAv:05,ZiAvPi:07}中引入了一种名为修剪罚函数(PTS)估计量,它似乎对掩盖问题不太敏感。该估计量通过二次混合整数规划(QMIP)问题来定义,其中目标函数中包括每个观测点的罚函数成本,该成本用作任何可行回归线的残差误差的上界。由于PTS不需要预先设置从数据集中删除的异常值数量,因此它相对于其他估计量具有更好的效率。然而,由于产生的QMIP问题的高计算复杂性,对于适度大的回归问题来说,精确求解是不可行的。本文进一步建立了PTS估计量的理论性质,如高容忍性和效率,并提出了一种名为快速PTS的近似算法,以高效计算大型数据集的PTS估计量。在具有不同程度异常值污染的基准实例集上进行的广泛计算实验表明,所提出的算法能够在合理的计算时间内很好地识别出高杠杆异常值群体。
作者:L. Pitsoulis and G. Zioutas
论文ID:0901.0876
分类:Computation
分类简称:stat.CO
提交时间:2011-03-23