当设计矩阵包含编码的分类变量时计算稳健的杠杆诊断

摘要:一个稳健的杠杆诊断在线性回归中,Rousseeuw和van Zomeren [1990] 提出使用稳健的距离(使用位置和协方差的稳健估计计算的Mahalanobis距离)。然而,包含编码分类预测变量的设计矩阵X往往是足够稀疏的,以至于无法计算位置和协方差的稳健估计。具体来说,通过取X的行的子集形成的矩阵可能是奇异的,导致依赖于子采样的算法失败。在Maronna和Yohai [2000] 的精神指导下,我们认为极端杠杆点在连续的预测变量中是极端的。因此,我们提出了一个稳健的杠杆诊断方法, 结合了对连续预测变量的稳健分析和杠杆的经典定义。

作者:Kjell Konis

论文ID:1301.5035

分类:Computation

分类简称:stat.CO

提交时间:2013-01-23

PDF 下载: 英文版 中文版pdf翻译中