使用广义公共因子方法进行微生物丰度的跨研究分析

摘要:利用生物化学反应网络,微生物群体能够调节它们的环境特性甚至宿主体内的代谢过程。新一代高通量测序为微生物生态学开辟了新的研究领域,有望利用微生物组在环境和生物医学科学中取得重要进展。然而,由于基因组数据维度高、稀疏且噪音较大,这也带来了挑战。其中,噪音主要体现在测序所处的确切条件上,它会严重限制通过共识验证研究结果。我们提出了一种集合方法,用于跨研究的微生物丰度数据的探索性分析。我们首先估计每个数据集中基于泊松抽样的对数尺度下潜在丰度的方差-协方差矩阵,然后联合建模这些协方差,以找到共享的低维特征空间。通过将潜在真实丰度的投影到这个共同结构上,将变异减少到所有数据集共享的部分,并且可能反映出比个别数据集中更具概括性的生物学信号。我们对实现这一目标的几种方法进行了研究,并证明了它们在模拟和真实的宏基因组数据方面具有良好的信号保留性和可解释性。

作者:Molly G. Hayes, Morgan G. I. Langille, Hong Gu

论文ID:2303.15211

分类:Applications

分类简称:stat.AP

提交时间:2023-03-28

PDF 下载: 英文版 中文版pdf翻译中