使用字符串核对16S rRNA基因测序数据集中的系统发生建模
摘要:基于16S rRNA基因测序来测量细菌群落组成,在这里,我们展示了使用最初在自然语言处理中提出的字符串核技术对这些关系建模的实用性,用于两个统计任务(双样本检验和宿主性状预测)。我们通过模拟研究表明,使用所提出的显式建模进化关系的核两样本检验是强大的,同时也对两个种群之间进化尺度的差异敏感。我们还展示了如何将所提出的核与高斯过程结合,以改善宿主性状预测的预测性能。我们的方法已经在Python软件包StringPhylo中实现(可在github.com/jonathanishhorowicz/stringphylo获得)。
作者:Jonathan Ish-Horowicz and Sarah Filippi
论文ID:2210.07696
分类:Applications
分类简称:stat.AP
提交时间:2023-02-17