关于微生物群落动态平衡数据的整合、FAIR和可重复管理框架
摘要:微生物群落研究数据管理框架:设计与实现 摘要:高通量仪器产生的日益增长的数据量,结合科学计算的先进基础设施,实现了基于对大型数据集的探索的所谓“第四范式”的科学研究。当前的科学研究常常是跨学科的,因此数据整合是一种关键技术,用于合并来自不同科学领域的数据。研究数据管理是这种范式的关键部分,通过提出和开发方法、技术和实践,对科学数据进行生命周期管理。微生物群落的研究数据遵循类似的模式,产生大量的数据,这些数据通常是通过测序环境样本中的微生物获得的。微生物群落的数据可以来自多种来源,可以以不同的格式存储。例如,微生物组学、微生物转录组学、代谢组学和生物成像的数据经常在研究中进行组合。在本文中,我们介绍了一个综合性的研究数据管理框架的设计和当前实施状态,该框架旨在允许更容易地发现、访问、组合和重用微生物群落的数据。这个框架基于研究数据仓库和微生物群落分析中使用的工作流程管理的最佳实践,包括记录来源信息以跟踪数据派生。
作者:Luiz Gadelha, Martin Hohmuth, Mahnoor Zulfiqar, David Sch"one, Sheeba Samuel, Maria Sorokina, Christoph Steinbeck, Birgitta K"onig-Ries
论文ID:2207.06890
分类:Databases
分类简称:cs.DB
提交时间:2022-12-20