后缀托盘和后缀Trist:快速文本索引的结构

@第{Cole2006SuffixTA条,title={后缀送纸器和后缀Trists:用于快速文本索引的结构},author={理查德·科尔(Richard J.Cole)、茨维·科佩洛维茨(Tsvi Kopelowitz)和莫舍·勒文斯坦(Moshe Lewenstein)},journal={Algorithmica},年份={2006},体积={72},页数={450-466},网址={https://api.semanticscholar.org/CorpusID:9222555}}
这项工作创建了后缀树和后缀列表(后缀数组的动态变体)之间的交叉,称为后缀trist;它支持O(m+log|∑|)时间内的查询,并使用线性空间。

使用后缀托盘、数组和树的模式匹配

在模拟真实生活场景的实验中,通过与后缀树和后缀数组的比较,研究了新后缀托盘结构的实际相关性,表明后缀托盘不仅具有理论相关性,而且具有实际相关性,因为后缀Tray是较小查询大小的首选结构。

压缩字符串的确定性索引

在确定性和压缩设置中创建一个新的字符串索引,以便给定长度为m的压缩模式字符串,作者可以支持在(确定性)时间O(m/A+log m+log log s)中的查询,其中A=w/log s是在大小为w=log n的字中压缩的字符数。

长模式的文本索引:锚定是您所需要的全部

研究表明,当作者手头有查询模式长度的下限时,使用局部一致锚定的文本索引(lc-anchors)在所有四个度量中都提供了非常好的性能,这在实际应用中可以说是一个相当合理的假设。

使用局部一致锚定的长模式文本索引

这项工作表明,当作者手头上有查询模式长度的下限时,基于局部一致锚(lc-anchors)的抽样文本索引在所有四个度量中都提供了非常好的性能,并基于lc-anchors分区集的概念,给出了具有最坏情况保证的索引的对应项。

压缩后缀数组构造中O(n)-障碍的打破

新的数据结构被一个新的模式匹配索引打破,该索引同时最小化了所有已知紧索引(即使用O(n logσ)位的索引)的构造时间和查询时间,并允许小字母的次线性时间构造。

使用联机索引应用程序管理比较驱动数据结构中的无限长键

本文提出了一种通用技术,用于通过恒定时间比较将操作原子键和不可分割键的任何动态数据结构优化转换为

基于后缀数组的两个简单全文索引

提出了两种受后缀数组启发的全文索引,其中一种索引使用哈希表来增加后缀数组,以加快模式搜索,因为二进制搜索阶段之前的搜索间隔大大缩短;另一种索引是紧凑的数据结构,类似于M{“a}kinen的紧凑后缀数组,但使用的是固定大小的块。

用于字符串搜索的全文索引和关键字索引

提出了FM浮动索引,它是对著名的FM-index(压缩全文索引)的修改,该索引以空间换取速度,而所谓的拆分索引可以有效地解决k不匹配问题,尤其是对于1错误。

带扭曲的后缀数组

结果表明,作者如何搜索正确的区间边界对整体搜索速度有显著影响,并且可以使用压缩来改进众所周知的后缀前缀查找表的思想。

字符串的匹配与压缩与自动机和单词打包

本文考虑了具有默认转换的子序列自动机,即只有当所有规则转换都不匹配当前字符且不消耗currentCharacter时才进行特殊转换,并提出了一种新的独立兴趣的层次自动机结构。

后缀数组:一种新的在线字符串搜索方法

本文介绍了一种新的概念上简单的数据结构,称为后缀数组,用于在线字符串搜索,相信在许多应用中,后缀数组在实践中会比后缀更好。

简单线性工作后缀数组构造

介绍了在整数字母表上构造后缀数组的倾斜算法,该算法以整数排序作为唯一的非平凡子程序,可实现在线性时间内运行。

通过有序列表子集上的前置查询实现通用字母表的在线索引

其主要思想是将在线构建后缀树的问题简化为订单维护问题的有趣变体,这可能是一个独立的问题,并改进或简化了几个附加应用程序的边界,包括完整持久数组、单调列表标记问题、,以及订单维护问题。

面向实时后缀树构造

对实时后缀树构造算法的探索已有三十多年的历史,本文朝着这一方向迈出了一步,在每个输入符号的时间O(logn)内在线构造后缀树。

大字母的最优后缀树构造

这项工作使用Weiner算法在线性时间内为整数字母表构建后缀树,该算法基于排序匹配平凡的/spl-Omega/(nlog-n)-时间下限。

线性工作后缀数组构造

一种广义算法,DC,允许空间效率的实现,而且支持选择空间-时间折衷,并且比所有以前的后缀树或数组构造算法的速度都要快。

后缀树构造的排序复杂性

用递归技术构建后缀树,在不同的计算模型中产生与排序下限匹配的最优算法,对于由多项式范围内的整数组成的字母表,作者得到了第一个已知的线性时间算法。

后缀数组的线性时间构造

一种线性时间算法,用于为整数字母表构造后缀数组,该算法在构造过程中不使用后缀树作为中间数据结构,这意味着直接构造后缀数组的时间复杂性与构造后缀树的时间复杂性相匹配。