图像和图卷积网络提高基于微生物组的机器学习准确性
摘要:人体肠道微生物群与许多疾病的病因有关。因此,它是基于机器学习的多种疾病和状况的生物标志物开发的自然候选者。微生物群通常使用16S rRNA基因测序进行分析。然而,微生物16S rRNA基因测序的几个特性限制了机器学习,包括非均匀表示,与每个样本的维度相比,样本数量较少,数据的稀疏性,大多数细菌只存在于少数样本中。我们提出了两种结合来自不同细菌的信息并改善机器学习数据表示的新方法,即iMic和gMic。iMic和gMic将微生物群转化为图像和图表,然后分别应用于图表或图像的卷积神经网络。我们证明了这两种算法相对于最先进的方法,可以提高基于静态16S rRNA基因序列的机器学习的性能。此外,这些方法还简化了分类器的解释。然后,将iMic扩展到动态的微生物群样本,并提出了一个iMic可解释的AI算法来检测与每种条件相关的细菌。
作者:Shtossel Oshrit, Isakov Haim, Turjeman Sondra, Koren Omry, Louzoun Yoram
论文ID:2205.06525
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2022-05-16