计算投影回归深度及其导致的中位数

摘要:回归深度的概念已经在文献中引入并进行了研究。最著名的例子是回归深度(Regression Depth,RD),它是定位深度在回归中的直接扩展。投影回归深度(Projection Regression Depth,PRD)是另一种盛行的定位深度,投影深度的扩展到回归。RD的计算问题已在文献中进行了讨论。PRD的计算问题以前从未处理过。现在解决了PRD和其诱导中位数(最大深度估计)在回归设置中的计算问题。对于给定的$s{eta}inR^p$,提出了PRD的精确算法,计算成本为$O(n^2log n)$($p=2$)和$O(N(n, p)(p^{3}+nlog n+np^{1.5}+npN\_{Iter}))$($p>2$),以及PRD及其诱导中位数的近似算法,计算成本分别为$O(N\_{mb{v}}np)$和$O(RpN\_{s{eta}}(p^2+nN\_{mb{v}}N\_{Iter}))$。这里$N(n, p)$是一个基于样本点和$s{eta}$导出的点形成的$(p-1)$维超平面的总数;$N\_{mb{v}}$是使用的单位方向$mb{v}$的总数;$N\_{s{eta}}$是使用的候选回归参数$s{eta}$的总数;$N\_{Iter}$是在优化算法中执行的迭代总数;$R$是复制的总数。此外,作为第二个主要贡献,引入了三个PRD诱导估计量,其计算速度比PRD诱导中位数快30倍,同时保持相似的精度水平。例子和模拟研究表明,从PRD中诱导出的深度中位数在鲁棒性和效率方面比从RD诱导的最大深度估计量更有优势,后者是目前领先的回归中位数。

作者:Yijun Zuo

论文ID:1905.11846

分类:Computation

分类简称:stat.CO

提交时间:2021-01-19

PDF 下载: 英文版 中文版pdf翻译中