促进生物信息学的可重复性
摘要:生物信息学中的研究可重复性对于证实、拓展和从科学研究结果中学习至关重要,但在生物信息学领域中,这一点常常具有挑战性。生物信息学常涉及大规模数据集和复杂的分析工作流,涉及多种不同的工具。此外,许多生物学家在如何有效记录其生物信息学分析步骤以确保可重复性方面没有受过良好的培训,因此关键信息常常遗漏。生物信息学中使用的软件工具可以自动跟踪它们生成的结果的溯源,消除了大部分生物信息学可重复性面临的障碍。在这里,我们介绍了这一思想的一个实现,Provenance Replay,这是一个从在QIIME 2生物信息学平台上生成的结果中生成新的可执行代码的工具,并讨论了希望在其软件中实现类似功能的生物信息学开发人员需要考虑的问题。
作者:Christopher R. Keefe, Matthew R. Dillon, Chloe Herman, Mary Jewell, Colin V. Wood, Evan Bolyen, J. Gregory Caporaso
论文ID:2305.11198
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2023-05-22