细菌染色体中Hi-C数据的多尺度分析的计算工具
摘要:高通量染色体构象捕捉(Hi-C)数据揭示了细菌染色体聚集成重叠的相互作用域的嵌套组织,与真核生物相似。在本章中,我们提出了一个多尺度分析框架,旨在捕捉和量化这些属性。这些属性包括标准工具(例如接触定律)和一种索引,可以独立于所涉及的尺度来识别参与域形成的基因座位。我们的目标是双重的。一方面,我们旨在提供一个完整、可理解的基于Python/Jupyter的代码,可供计算机科学家和没有高级计算背景的生物学家使用。另一方面,我们讨论了Hi-C数据分析中固有的统计问题,重点是如何正确评估结果的统计显著性。作为一个示范案例,我们分析了产生于模型致病菌假单胞菌(Pseudomonas aeruginosa)的数据。所有文件(代码和输入数据)均可在github存储库中找到。我们还将这些文件嵌入到Binder软件包中,以便通过互联网在任何计算机上运行完整的分析。
作者:Nelle Varoquaux, Virginia S. Lioy, Fr\'ed\'eric Boccard and Ivan Junier
论文ID:2010.01718
分类:Genomics
分类简称:q-bio.GN
提交时间:2020-10-06