当前x86-64体系结构上浮点运算的成本简述:非规格化数、溢出、下溢和除零

摘要:浮点数的简单操作,如加法或乘法,对于当前的AMD和Intel处理器而言,可以在三到五个周期内完成。而对于非规范化数值来说,情况就不同了。当发生下溢并且该数值不能再以规范化浮点数的形式表示时,计算成本将高出约两个数量级。

作者:Markus Wittmann and Thomas Zeiser and Georg Hager and Gerhard Wellein

论文ID:1506.03997

分类:Performance

分类简称:cs.PF

提交时间:2015-06-15

PDF 下载: 英文版 中文版pdf翻译中