GF(2)上稠密矩阵的高效乘法
摘要:在本文中,我们描述了一种在二元域(GF(2))上进行密集矩阵乘法的算法层次结构的高效实现。特别地,我们介绍了在M4RI库中实现的Strassen-Winograd矩阵乘法和“Four Russians”乘法(M4RM),并将其与其他可用的实现进行比较。 在AMD Opteron上表现良好,并在Intel Core 2 Duo上表现特别出色。 开放源代码的M4RI库可作为独立工具使用,也可作为Sage数学软件的一部分使用。 从机器角度来看,在GF(2)中的加法是逻辑异或,乘法是逻辑与,因此64位的机器字可以并行操作64个GF(2)元素:最多一个CPU周期可以进行64个并行加法或乘法。因此,GF(2)上的逐元素操作相对较廉价。实际上,在本文中,我们得出的结论是实际的瓶颈在于内存读写和数据局部性问题。我们介绍了与最小化这些问题相关的实证结果,并对其进行了分析。
作者:Martin Albrecht, Gregory Bard, William Hart
论文ID:0811.1714
分类:Mathematical Software
分类简称:cs.MS
提交时间:2012-03-27