模块化多项式乘法自动生成图书馆
摘要:用于计算机代数系统(CAS)的多项式乘法是关键的算法,其高效实现对于CAS的性能非常重要。我们在本文中设计和实现了基于快速傅里叶变换(FFT)和截断傅里叶变换(TFT)的多项式乘法算法。在理论和实际性能方面,我们改进了最先进的技术。我们扩展了{SPIRAL}库生成系统,并用它来自动生成和优化内存层次结构、向量化和多线程优化的多项式乘法库,使用新的和现有的算法。性能调优受到自动化的帮助,其中许多代码选择是生成的,并且利用智能搜索来找到在给定体系结构下的"最佳"实现。自动调优实现的性能与最佳手动调优代码相当,甚至在某些情况下更好。
作者:Lingchuan Meng
论文ID:1609.01010
分类:Symbolic Computation
分类简称:cs.SC
提交时间:2016-09-06