使用机器学习和代谢建模预测21种假单胞菌植物根附生生态位
摘要:通过使用基因组数据和媒介依赖的代谢模型信息,我们的目标是了解是否比使用媒介独立模型或纯基于基因组的物种树来训练机器学习预测细菌生态位更好。我们考虑了三种机器学习技术:支持向量机、非负矩阵分解和人工神经网络。在这三种机器学习方法中,基于媒介的代谢模型和流通平衡分析比基因组或PRMT模型更有效地预测细菌生态位。在以曼诺糖、脯氨酸和缬氨酸为基础的最小介质上训练的支持向量机对所有模型和媒介类型的预测最为准确,菌株在根际的f-score为0.8,在内生区的f-score为0.97。因此,我们可以得出结论,基于媒介的代谢建模提供了代谢组的整体视角,使机器学习算法能够突出内生区和根际细菌之间的差异并对其进行分类。没有任何单一的媒介类型能够最好地突出内生区和根际细菌代谢之间的差异,因此也没有任何单一的酶、反应或化合物能够定义细菌的起源是内生区还是根际区。
作者:Jennifer Chien, Peter Larsen
论文ID:1701.03220
分类:Genomics
分类简称:q-bio.GN
提交时间:2017-01-13