当前x86-64体系结构上浮点运算的成本简述:非规格化数、溢出、下溢和除零
摘要:浮点数的简单操作,如加法或乘法,对于当前的AMD和Intel处理器而言,可以在三到五个周期内完成。而对于非规范化数值来说,情况就不同了。当发生下溢并且该数值不能再以规范化浮点数的形式表示时,计算成本将高出约两个数量级。
作者:Markus Wittmann and Thomas Zeiser and Georg Hager and Gerhard Wellein
论文ID:1506.03997
分类:Performance
分类简称:cs.PF
提交时间:2015-06-15