在芯片网络中,具有区域感知和共享路径经验的强化学习框架用于高效路由
摘要:基于强化学习的网络芯片(NoC)路由策略对性能有显著影响。现有的NoC路由的强化学习策略未能充分表示路径争用和区域拥塞,并且没有完全整合共享相同路径的数据包流的经验到强化学习更新机制中。本文提出了一种新颖的区域拥塞感知强化学习NoC路由策略Q-RASP,能够共享使用相同路由的数据包的经验。与现有强化学习NoC路由实现相比,Q-RASP平均数据包延迟提升了18.3\%,NoC能耗减少了最多6.7\%,而面积开销很小。
作者:Kamil Khan, Sudeep Pasricha
论文ID:2307.11712
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-07-24