扩展生物序列的递归Jensen-Shannon分段
摘要:生物序列的递归熵分割方案的扩展, 基于马尔科夫链建模生物序列中的统计平稳段,并定义了一种区分两个马尔科夫链的广义Jensen-Shannon散度。我们进行了均场分析,从中识别出递归Jensen-Shannon分割方案中存在的问题。在此基础上,我们解释了分割优化的必要性,并描述了两种局部优化方案,以改善在每个递归阶段发现的域墙位置。我们还根据统计波动的强度开发了递归Jensen-Shannon分割的新终止准则,以达到最小可靠统计片段长度,避免了对目标序列进行不现实的空值和替代片段模型的需要。最后,我们通过递归分割大肠杆菌K-12 MG1655基因组来比较扩展方案和原始方案。
作者:Siew-Ann Cheong, Paul Stodghill, David J. Schneider, Samuel W. Cartinhour, and Christopher R. Myers
论文ID:0904.2466
分类:Genomics
分类简称:q-bio.GN
提交时间:2009-04-17