重叠组套索的理论特性-arXiv论文预印本中文版

重叠组套索的理论特性

摘要：线性回归中具有重叠的Jacob、Obozinski和Vert（2009）的分组套索方法的两组理论结果。该方法允许在稀疏回归中联合选择预测变量，可以将预测变量的复杂结构化稀疏编码为一组组。这种灵活的框架表明，可以使用一组复杂的组来编码任意复杂的结构。我们的结果显示，这种策略对程序产生了意想不到的理论后果。具体而言，我们给出了两组结果：（1）预测和估计的有限样本界限，以及（2）渐近分布和选择。这两组结果都揭示了选择越来越复杂的组对程序的影响，以及当组的集合无法恢复真实的稀疏模式时会发生什么。此外，这些结果还展示了具有和没有重叠组的分组套索程序之间的差异和相似之处。我们的分析表明，必须谨慎选择一组组 - 过于复杂的组将破坏分析。

作者：Daniel Percival

论文ID：1103.4614

分类：Machine Learning

分类简称：stat.ML

提交时间：2011-11-11

PDF 下载： 英文版中文版pdf翻译中