×

分类路径计数查询的数据结构。 (英语) Zbl 07696001号

Gawrychowski,Paweł(ed.)等人,第32届组合模式匹配年度研讨会,CPM 2021,Wrocಕaw,波兰,2021年7月5日至7日。Wadern:达格斯图尔宫(Schloss Dagstuhl)——莱布尼兹·泽特鲁姆(Leibniz-Zentrum für Informatik)。LIPIcs–莱布尼茨国际程序。通知。191,第15条,第17页(2021年)。
摘要:考虑(n)节点上的序数树(T),每个节点都从字母表([\sigma]={1,2,\dots,\sigma)中分配了一个类别。我们对树(T)进行预处理,以支持{分类路径计数查询},该查询要求在两个查询节点(x)和(y)之间的路径(T)中出现不同类别的数量。对于这个问题,我们提出了一种具有查询时间\(\mathcal{O}(\sqrt{n}(\lg\frac{\lg\sigma}{\lg w})\)的线性空间数据结构,其中\,除了多对数加速外,我们的结果是最优的。对于权衡参数(1),我们提出了一种(mathcal{O}(n+frac{n^2}{t^2})-字,(mathcal{O}(t\lg((lg\sigma)/(lgw))))查询时间数据结构。我们还考虑了近似类别路径计数查询,该查询必须返回查询路径上发生的不同类别数的近似值,方法是对每个类别至少计数一次,最多计数(c)次。我们描述了一种线性空间数据结构,它支持在(mathcal{O}((lgn))时间内的2近似分类路径计数查询。
接下来,我们将分类路径计数查询推广到加权树。这里,查询指定了两个节点(x)、(y)和一个正交范围(Q)。这样形成的分类路径范围计数查询的答案是,如果只考虑权重落在\(Q)内的节点,则在从\(x)到\(y)的路径上出现的不同类别的数量。我们提出了一种具有查询时间的(mathcal{O}(n\lg\lgn+(n/t)^4)字数据结构,或具有查询时间。对于权衡参数\(t)的适当选择,这意味着具有\(mathcal{O}(n^{3/4}\lg^\varepsilon)\)查询时间的线性空间数据结构。然后,我们将该方法推广到用来自\([n]^d \)的向量加权的树,其中\(d \)是一个大于或等于2的常数整数。我们提出了一种具有空间单词和查询时间的数据结构(mathcal{O}(n\lg^{d-1+varepsilon}n+(n/t)^{2d+2})。对于一个(mathcal{O}(n\cdot\text{polylog\,}n)-空间解,因此有(mathcal{O}(n^{2d+1}/{2d+2}}\cdot\text{polylog\,}n))查询时间。
我们证明的下限所揭示的固有困难促使我们考虑基于{草图}的数据结构。在未加权树中,我们提出了一种草图数据结构来解决近似类别路径计数问题,该问题要求给定路径上不同类别数量的近似值((1\pm\varepsilon),概率为(1-\delta),其中是常数。数据结构占用了\(mathcal{O}(n+\frac{n}{t}\lgn)\)个单词的空间,查询时间为\(mathcal{O{t}(t\lgn,)。对于以(d)维权重向量加权的树((d \geq 1)),我们提出了一种具有(mathcal{O}((n+(n/t)\lgn)\Ig^dn))空间词和(mathcal{O}(t\lg^{d+1}n))查询时间的数据结构。
所有这些问题都推广了欧氏空间(mathbb{R}^{d+1})中相应的范畴范围计数问题,对于各自的(d),用树拓扑替换其中一个维数。
关于整个系列,请参见[Zbl 1465.68019号].

MSC公司:

68瓦32 字符串上的算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部