基于角度的联合与个体变异解释

摘要:整合分析在现代数据分析中是一个重要挑战,它涉及对一组实验对象上测量到的不同数据块进行综合。这种数据结构自然地激发了对每个数据块中的联合和个体变异的同时探索,从而产生了新的见解。例如,有强烈的愿望将癌症基因组中的多个基因组数据集进行整合,以表征每个来源的癌症遗传学和细胞生物学的共同和独特的方面。在本文中,我们引入了基于角度的联合和个体变异解释,以捕捉每个数据块中的联合和个体变异。从新的概念理解、更好地适应数据异质性以及快速线性代数计算等方面来看,这是对此挑战的早期方法的重大改进。重要的数学贡献是使用得分子空间作为主要变异结构的指示符,并使用扰动理论作为变异分割的指导。这导致了一种对数据块之间的异质性不敏感并且不需要单独归一化的探索性数据分析方法。应用于癌症数据的结果显示了不同类型信号在表征肿瘤亚型方面的不同行为。应用于一个死亡数据集的结果揭示了有趣的历史教训。软件和数据可在GitHub上找到

作者:Qing Feng, Meilei Jiang, Jan Hannig, J. S. Marron

论文ID:1704.02060

分类:Machine Learning

分类简称:stat.ML

提交时间:2018-03-20

PDF 下载: 英文版 中文版pdf翻译中