农业遗传学、基因组学和育种数据库与资源的数据共享和本体使用──AgBioData协会
摘要:农业遗传学、基因组学和育种(GGB)数据库和资源的数量和范围在过去几十年里迅速增长。AgBioData协会目前代表着44个数据库和资源,涵盖模型作物植物和动物的GGB数据、本体论、途径、遗传变异和育种平台(在本文中称为“数据库”)。协会的一个目标是促进FAIR(可发现、可访问、可互操作和可重用)数据管理和数据集整合,这需要数据共享以及结构化词汇和/或本体论。AgBioData的两个工作组,专注于数据共享和本体论,进行了一项调查,以评估成员在这些领域的现状和未来需求。共有33位研究人员回答了调查,代表了37个数据库。结果表明,AgBioData数据库的数据共享实践处于良好状态,但不清楚这是否适用于跨所有数据库的所有元数据和数据类型;并且在类似于2017年进行的调查后,本体论的使用并没有显著变化。我们建议:1)为数据库人员提供特定的数据共享技术和本体论使用的培训;2)进一步研究在数据库之间共享的元数据以及共享情况如何;3)在利益相关者社区推动对数据共享和本体论的理解;4)改进特定表型数据类型和格式的数据共享和本体论;5)通过识别可持续解决方案、制定、推广或开发数据标准,降低数据共享和本体论使用的特定障碍。综上所述,这些改进有助于AgBioData数据库加大对改进本体论使用和通过编程手段进行数据共享的发展工作。
作者:Jennifer L. Clarke, Laurel D. Cooper, Monica F. Poelchau, Tanya Z. Berardini, Justin Elser, Andrew D. Farmer, Stephen Ficklin, Sunita Kumari, Marie-Ang''elique Laporte, Rex T. Nelson, Rie Sadohara, Peter Selby, Anne E. Thessen, Brandon Whitehead, Taner Z. Sen
论文ID:2307.08958
分类:Databases
分类简称:cs.DB
提交时间:2023-07-19