当设计矩阵包含编码的分类变量时计算稳健的杠杆诊断
摘要:一个稳健的杠杆诊断在线性回归中,Rousseeuw和van Zomeren [1990] 提出使用稳健的距离(使用位置和协方差的稳健估计计算的Mahalanobis距离)。然而,包含编码分类预测变量的设计矩阵X往往是足够稀疏的,以至于无法计算位置和协方差的稳健估计。具体来说,通过取X的行的子集形成的矩阵可能是奇异的,导致依赖于子采样的算法失败。在Maronna和Yohai [2000] 的精神指导下,我们认为极端杠杆点在连续的预测变量中是极端的。因此,我们提出了一个稳健的杠杆诊断方法, 结合了对连续预测变量的稳健分析和杠杆的经典定义。
作者:Kjell Konis
论文ID:1301.5035
分类:Computation
分类简称:stat.CO
提交时间:2013-01-23