超过3,500,000个SARS-CoV-2基因组序列的时间上的顺序关系推断
摘要:通过直接耦合分析(DCA),我们确定了SARS-CoV-2病毒变异位点之间的上位互作关系,并按照采样月份对基因组进行了分割。我们使用了来自GISAID库的全长高质量基因组,截至2021年10月,总计超过350万个基因组。我们发现,DCA术语比相关性在时间上更稳定,但仍然会随着突变从全球人群中消失或固定而发生变化。相关性富集了系统发育效应,特别是在短的基因组距离下存在统计依赖关系,而DCA揭示了更长的基因组距离上的连接。我们讨论了在这些条件下进行DCA分析的有效性,从一个短暂的准连锁平衡状态的角度来看。我们确定了涉及刺突中位点的潜在互作突变。
作者:Hong-Li Zeng, Yue Liu, Vito Dichio and Erik Aurell
论文ID:2112.12957
分类:Genomics
分类简称:q-bio.GN
提交时间:2022-06-07