稀疏矩阵线性模型用于结构化高通量数据
摘要:高通量生物数据的快速生成一直是科研领域面临的挑战。这些数据可以看作一个包含行列注释的大矩阵。矩阵线性模型为对这些数据进行建模提供了便利。在许多情况下,我们需要对这些模型进行稀疏估计。本文提出了一种针对结构化高通量数据拟合稀疏矩阵线性模型的快速通用方法。我们使用L1正则化来建立模型的稀疏性,并考虑了响应矩阵和协变量矩阵都很大的情况。由于数据规模的问题,如果问题转化为对应的单变量回归场景,传统的惩罚回归模型的估计方法会失败。通过利用我们模型的矩阵属性,我们开发了几种快速估计算法(坐标下降法,FISTA和ADMM),并讨论了它们的权衡。我们通过对模拟数据、大肠杆菌化学遗传筛选数据和两个拟南芥遗传数据集进行性能评估。我们的算法已经在Julia编程语言中实现,并可在https://github.com/senresearch/MatrixLMnet.jl上获得。
作者:Jane W. Liang and Saunak Sen
论文ID:1712.05767
分类:Computation
分类简称:stat.CO
提交时间:2021-03-01