基于混合CMOS-OxRAM构件的量化神经网络映射的时分复用内存计算方案
摘要:实现二/三值神经网络(BNNs/TNNs)的两个关键构建模块的实验演示:(i)基于130纳米CMOS的S形神经元和(ii)基于HfOx的多级(MLC)OxRAM-突触块。还提出了一种优化的矢量矩阵乘法编程方案,利用这两个构建模块。与利用差分突触结构的先前方法相比,每个突触仅使用一个器件,并进行两组读取操作。所提出的硬件映射策略在Fashion MNIST(FMNIST)数据集上的分类问题中与理想量子化神经网络(QNN)相比,性能变化<5\%(TNN下降2-5\%,BNN增加0.2\%),并显著节省内存,达到16-32倍。还分析了OxRAM器件变异对硬件QNN(BNN/TNN)性能的影响。
作者:Sandeep Kaur Kingra, Vivek Parmar, Manoj Sharma and Manan Suri
论文ID:2206.00250
分类:Emerging Technologies
分类简称:cs.ET
提交时间:2022-07-29