基于知识的多组学数据集与Anansi的整合:特定相互作用的基于注释的分析

摘要:在多种类型的“组学”数据集中,包含多种类型的研究越来越普遍。整合这些数据集可以巩固发现结果甚至做出新的发现。然而,整合多组学数据集是一项具有挑战性的任务。通常情况下,通过进行全对全的相关性分析来集成数据集,其中第一个数据集的每个特征与第二个数据集的每个特征进行相关性分析。然而,全对全关联测试产生的结果无结构,很难解释,并且涉及对假阳性率(FDR)进行调整导致了可能是不必要的假设检验,从而降低了统计功效。 在这里,我们提出了anansi框架和伴随的R包,作为改进全对全关联分析的方法。我们采用基于知识的方法,使用诸如KEGG之类的外部数据库来限制全对全关联假设空间,只考虑先验已知的成对关联。 这产生了易于解释的结构化结果,并通过跳过不必要的假设检验来提高统计功效。在本文中,我们介绍了anansi框架,并展示了它在宿主-微生物相互作用背景下学习代谢物功能相互作用的应用。我们进一步将我们的框架扩展到差异关联测试,并展示了如何使用anansi来识别基于样本协变量(如病例/对照状态)的关联强度或程度不同的关联。 可访问性:https://github.com/thomazbastiaanssen/anansi

作者:Thomaz F. S. Bastiaanssen, Thomas P. Quinn, John F. Cryan

论文ID:2305.10832

分类:Biomolecules

分类简称:q-bio.BM

提交时间:2023-05-19

PDF 下载: 英文版 中文版pdf翻译中