快速、准确和可扩展的稀疏耦合矩阵-张量分解方法

摘要:同时从张量和矩阵数据中快速、准确和可扩展地捕捉隐藏属性的方法是什么?耦合矩阵-张量分解(CMTF)是一种从张量和矩阵中同时提取潜在因子的主要工具。设计一种准确高效的CMTF方法已经变得更加重要,因为现实世界数据的规模和维度正在迅速增长。然而,现有的CMTF方法缺乏准确性、运行时间慢和可扩展性有限。在本文中,我们提出了一种快速、准确和可扩展的CMTF方法S3CMTF。通过利用现实世界张量的稀疏性,S3CMTF实现了高速度,并通过捕捉因子之间的相互关系实现了高准确性。此外,S3CMTF通过无锁并行SGD更新多核共享内存系统,实现了额外的速度提升。我们提出了两种方法,S3CMTF-naive和S3CMTF-opt。S3CMTF-naive是S3CMTF的基本版本,S3CMTF-opt通过利用中间数据提高了其速度。理论和实证结果表明,S3CMTF是最快的,超过了现有的方法。实验结果表明,S3CMTF比现有方法快11~43倍,准确性提高了2.1~4.1倍。S3CMTF在数据条目数量和核心数上表现出线性可扩展性。此外,我们将S3CMTF应用于Yelp推荐张量数据和3个附加矩阵,以发现有趣的属性。

作者:Dongjin Choi, Jun-Gi Jang, U Kang

论文ID:1708.08640

分类:Numerical Analysis

分类简称:cs.NA

提交时间:2017-12-06

PDF 下载: 英文版 中文版pdf翻译中