USID和Pycroscopy -- 存储和分析光谱和成像数据的开放框架
摘要:材料科学由于表征工具的进步而发生了深刻变革,导致数据的数量、速度、种类和复杂性大幅增加。为了将这些数据用于科学研究,需要对相关的计算和数据基础设施进行改进,将科学仪器与超级和云计算相结合。在这里,我们描述了一种称为Universal Spectroscopy and Imaging Data (USID)的数据模型,能够表示来自大多数常见仪器、模态、维度和大小的数据。我们将这个模式与层次数据文件格式(HDF5)结合在一起,以最大程度地提高兼容性、交换能力、可追溯性和可重复性。我们讨论了一个由社区驱动的、开源的、免费的Python软件包族,用于存储、处理和可视化数据。第一个是pyUSID,它提供了读写USID HDF5文件的工具,以及一个可扩展的数据分析并行化框架。第二个是Pycroscopy,它提供了用于纳米尺度成像和光谱学模态的科学分析算法,并建立在pyUSID和USID之上。USID的仪器无关特性有助于在Pycroscopy中开发与仪器和任务无关的分析代码,从而可以在开放科学时代促进科学社区的交流和突破障碍。鼓励感兴趣的读者参与到这个持续进行中的社区驱动努力中,通过大数据的领域集体加速材料研究和发现。
作者:Suhas Somnath, Chris R. Smith, Nouamane Laanait, Rama K. Vasudevan, Anton Ievlev, Alex Belianinov, Andrew R. Lupini, Mallikarjun Shankar, Sergei V. Kalinin, Stephen Jesse
论文ID:1903.09515
分类:Data Analysis, Statistics and Probability
分类简称:physics.data-an
提交时间:2019-03-28