少即是多:利用标准编译器优化级别以提高性能和节能
摘要:通过在标准编译优化级别(如-O2)中执行更少的优化操作,同时保持其原始顺序,可以显著节省执行时间和能量消耗。该观察结果已在两个嵌入式处理器(ARM Cortex-M0和ARM Cortex-M3)上进行了验证,使用了LLVM编译框架的两个不同版本:v3.8和v5.0。通过71个嵌入式基准测试的实验评估表明,对于两个处理器,至少有一半的基准测试取得了性能提升。对于Cortex-M0处理器,平均执行时间减少了2.4%,Cortex-M3处理器的平均执行时间减少了5.3%,并且执行时间的改进范围从1%到90%。该方法达到的节省效果与使用迭代编译或机器学习选择标志或确定阶段顺序以获得更高效代码的最新编译方法相当。与这些耗时且昂贵的方法相比,我们的方法只需要测试少于64个优化配置,即可获得类似甚至更好的节省效果。此外,我们的方法可以同时支持多指标优化,包括执行时间、能量消耗和代码大小。
作者:Kyriakos Georgiou, Craig Blackmore, Samuel Xavier-de-Souza, Kerstin Eder
论文ID:1802.09845
分类:Performance
分类简称:cs.PF
提交时间:2018-06-19