MetaHMM:一个用于在宏基因组样本中识别具有指定功能的新基因的网络服务器

摘要:从医学和生物技术应用的角度来看,快速、经济的测序大型临床和环境宏基因组数据集打开了新的视野。我们相信,目前我们只描述了地球上大约1%的微生物物种,因此,宏基因组分析主要涉及样本中的未知物种。极端环境中的微生物群落可能含有具有高生物技术潜力的基因,与疾病有关的临床宏基因组可能揭示仍未知的病原体和已知疾病的病理机制。虽然目前似乎无法对样本中的分类群进行物种级别的鉴定和描述,但我们可以使用多种技术,包括人工智能工具(如隐藏的Markov模型(HMMs)),在这些样本中搜索具有已知功能的新基因。在这里,我们描述了一个简单易用的Web服务器MetaHMM,它能够进行基于同源性的自动模型构建,用于搜索基因,并在宏基因组中找到最接近的匹配项。该Web服务器使用已经非常成功的构建模块:它通过应用Clustal Omega进行多序列比对,使用HMMER组件的hmmbuild构建隐藏的Markov模型,并使用hmmsearch在宏基因组中查找与指定模型相似的序列。该Web服务器可以在url{https://metahmm.pitgroup.org}上公开访问。

作者:Balazs Szalkai and Vince Grolmusz

论文ID:1710.10995

分类:Genomics

分类简称:q-bio.GN

提交时间:2017-10-31

PDF 下载: 英文版 中文版pdf翻译中