Java并行I/O库的设计与开发
摘要:并行I/O是指科学程序在计算集群等分布式存储平台上多个进程并发读写单个文件的能力。在高性能计算领域,I/O成为许多现实科学应用程序的瓶颈。在过去的二十年里,对传统语言(包括C、C++和Fortran)的科学计算I/O操作的性能进行了大量研究。由此结果,现在有几个成熟的高性能库可用,包括ROMIO(MPI-IO的实现)、并行HDF5、并行I/O(PIO)和平行netCDF,它们提供了科学应用程序的高效I/O。然而,目前很少有关于评估和提高基于Java的HPC应用程序的I/O性能的研究。有效的并行I/O Java库的开发主要受到了缺乏标准API(类似于MPI-IO)的限制。一些临时解决方案已经被开发和用于专有应用程序,但没有通用解决方案可以满足性能要求较高的应用程序的需求。作为该项目的一部分,我们计划开发一个基于Java的并行I/O API,灵感来自于C、C++和Fortran的MPI-IO绑定(MPI 2.0标准文档)。一旦开发出Java等价的MPI-IO API,我们将在现有的Java消息传递库上开发一个参考实现。接下来,我们将使用基准测试和实际应用程序来评估和比较我们的Java并行I/O库与C/C++对应库的性能。
作者:Muhammad Sohaib Ayub, Muhammad Adnan, Muhammad Yasir Shafi
论文ID:2305.07414
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-05-15