高性能Python在数据科学和机器学习应用开发中的应用场景

摘要:Python在数据科学和机器学习领域已成为应用开发的主要语言。然而,数据科学家并不一定是有经验的程序员。尽管Python可以让他们快速实现算法,但在规模化运算时,计算效率成为不可避免的问题。因此,将多核处理器和图形处理单元(GPU)等高性能设备发挥到最大潜力通常并不容易。本文档旨在成为这些从业者的参考资料,帮助他们在Python语言的众多工具和技术中找到适合自己的方式。我们的文档围绕用户场景展开,旨在涵盖他们可能遇到的大多数情况。我们相信,这个文档对于工具开发者也可能有实际用途,他们可以利用我们的工作来发现现有工具的潜在缺陷,并帮助他们推动自己的贡献。

作者:Oscar Castro and Pierrick Bruneau and Jean-S''ebastien Sottet and Dario Torregrossa

论文ID:2302.03307

分类:Distributed, Parallel, and Cluster Computing

分类简称:cs.DC

提交时间:2023-08-24

PDF 下载: 英文版 中文版pdf翻译中