组成数据的假设驱动中介分析:肠道微生物组应用
摘要:生物测序数据包括读数,例如特定分类器的读数,并且通常呈现稀疏性(零计数膨胀)和过度离散(超泊松变异性)。由于大多数测序技术提供任意总数,理想情况下,特定分类器的读数应该在组成数据分析框架下被视为比例。越来越多的人对肠道微生物组成在调节不同暴露对健康结果的影响的作用越来越感兴趣。以前大多数处理组成中介的方法解决了在大量候选者中确定潜在介导分类器的问题。在这里,我们考虑当有关仅限少数分类器的层次结构的先验知识可用时的组成中介的因果推断,建立在一个用适当子组成之间的对比结构化的单一假设上。基于多个同时存在的介导因子的理论和假设的因果图,我们对总体和坐标化中介效应定义了非参数估计量,并展示了如何从基于简单参数线性模型的经验数据中估计这些间接效应。这些中介因子有简单而一致的解释,与有关子组成之间相互关系的特定因果问题相关。我们进行了一项模拟研究,重点研究了稀疏性和过度离散对中介估计的影响。尽管无偏,估计量的精度在给定间接效应大小的情况下,以复杂的方式取决于稀疏性以及暴露-介导因子和介导因子-结果效应的相对大小。我们在实证数据上演示了这种方法,并发现纤维摄入与胰岛素水平呈负相关,主要归因于直接效应而不是间接效应。
作者:Noora Kartiosuo, Jaakko Nevalainen, Olli Raitakari, Katja Pahkala, Kari Auranen
论文ID:2308.16000
分类:Applications
分类简称:stat.AP
提交时间:2023-08-31