在图中寻找最大精确匹配

摘要:在查询字符串$Q$和带标签的图$G$之间寻找最大精确匹配(MEM)的问题是我们研究的内容。MEM是一类重要的种子,在种子链扩展类实际对齐方法中经常使用,因为它们与经典度量之间有着强烈的联系。一种合理的加速链式操作的方法是通过仅考虑长度至少为$kappa$($kappa$-MEM)的MEM来限制MEM的数量。然而,在任意输入图中,即使在无环图中,根据SETH(Equi等,ICALP 2019)的测试,找到MEM的问题在真正的次二次时间内也无法解决。在本文中,我们展示了一个$O(n \cdot L \cdot d^{L-1} + m + M_{kappa,L})$时间复杂度的算法,用于找到$Q$和$G$之间在$G$中恰好跨越$L$个节点的所有$kappa$-MEM,其中$n$是节点标签的总长度,$d$是$G$中节点的最大度数,$m=|Q|$,$M_{kappa,L}$是输出的MEM数量。我们使用这个算法在可索引的弹性创始图(Equi等,Algorithmica 2022)上开发了一个$kappa$-MEM查找解决方案,时间复杂度为$O(nH^2 + m + M_kappa)$,其中$H$是块中节点的最大数量,$M_kappa$是$kappa$-MEM的总数量。我们的结果推广到了多个查询字符串的分析($G$和任何字符串之间的MEM)。此外,我们提供了一些初步的实验结果,显示图MEM的数量比相应的连接集合的字符串MEM的数量小一个数量级。

作者:Nicola Rizzo, Manuel C''aceres, Veli M"akinen

论文ID:2305.09752

分类:Data Structures and Algorithms

分类简称:cs.DS

提交时间:2023-07-04

PDF 下载: 英文版 中文版pdf翻译中