基于RRAM的量化神经网络硬件:现状与待解决问题

摘要:通过在边缘处理的数据量增加以及对大型神经网络架构能源消耗的需求,开始从传统的冯·诺伊曼架构向基于内存计算的范式转变。量化是通过限制比特精度来降低神经网络的能源消耗和计算需求的方法之一。电阻式随机访问存储器(RRAM)设备是实现量化神经网络(QNN)的理想选择。由于RRAM中可能的导电状态受限,设计基于RRAM的神经网络时总会考虑一定程度的量化。在这项工作中,我们对最新的基于RRAM的QNN实现进行了综合分析,展示了RRAM在满足高效QNN硬件要求方面的现状。我们涵盖了与QNN相关的硬件和设备挑战,并展示了主要未解决的问题和可能的未来研究方向。

作者:O. Krestinskaya, L. Zhang and K.N. Salama

论文ID:2209.12260

分类:Emerging Technologies

分类简称:cs.ET

提交时间:2022-09-27

PDF 下载: 英文版 中文版pdf翻译中