基于计算存储的混合精度深度学习

摘要:混合精度硬件/软件培训通过使用相变存储器阵列的建议架构在手写数字分类任务上实现了97.73%的测试准确度,这与软件基线准确度仅相差0.6%。使用PCM的精确行为模型对卷积神经网络、长短期记忆网络和生成对抗网络进行进一步评估,达到了与浮点实现相当的准确性,而不受PCM设备的非理想性约束。系统级研究表明,与专用的完全数字32位实现相比,使用此架构培训多层感知器的能源效率提高了173倍。

作者:S. R. Nandakumar, Manuel Le Gallo, Christophe Piveteau, Vinay Joshi, Giovanni Mariani, Irem Boybat, Geethan Karunaratne, Riduan Khaddam-Aljameh, Urs Egger, Anastasios Petropoulos, Theodore Antonakopoulos, Bipin Rajendran, Abu Sebastian, Evangelos Eleftheriou

论文ID:2001.11773

分类:Emerging Technologies

分类简称:cs.ET

提交时间:2020-05-13

PDF 下载: 英文版 中文版pdf翻译中