一种针对间隔种子的覆盖准则及其在支持向量机字符串核和k-mer距离中的应用
摘要:均匀分布的种子不仅能检测更多的对准,而且能更准确地衡量系统发生学距离 (Boden等,2013; Horwege等,2014; Leimeister等,2014),并且在与支持向量机 (SVM) 结合使用时,提供了较低的误分类率 (Onodera和Shibuya,2013)。我们通过独立实验验证了这两个结果,并在本文中提出使用覆盖率准则 (Benson和Mak,2008; Martin,2013; Martin和No{''e},2014) 在这两种情况下衡量种子效率以设计更好的种子模式。我们首先展示了如何通过完全自动机方法直接测量这一覆盖率准则。然后,我们通过与单击和多击标准的相关系数比较,说明了这一准则在性能上的表现。最后,对于无对准距离,我们通过采用覆盖率准则进行扩展,展示了其性能,并指出如何高效计算。
作者:Laurent No''e (LIFL, INRIA Lille - Nord Europe), Donald E. K. Martin
论文ID:1412.2587
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2014-12-09