×

GYM:一种多轮分布式连接算法。 (英语) Zbl 1402.68036号

Benedikt,Michael(编辑)等人,第20届数据库理论国际会议,2017年ICDT,意大利威尼斯,2017年3月21日至24日。诉讼程序。瓦登:达格斯图尔宫(Schloss Dagstuhl)——莱布尼茨天顶宫(Leibniz Zentrum für Informatik)(ISBN 978-3-95977-024-8)。LIPIcs–莱布尼茨国际信息学论文集68,第4条,第18页(2017年)。
摘要:多轮算法现在在分布式数据处理系统中普遍使用,但算法从多轮运行中受益的程度尚不清楚。本文针对(n)关系的等式连接计算问题,对这个问题进行了几轮回答。给定任何具有宽度(mathsf{w})、交集宽度(mathf{iw}
1.(Q)可以在\(O(n)\)轮中用\(O\左(n\frac{(\mathrm{in}^{\mathsf{w}}+\mathrm{OUT})^2}{M}\right)\)通信开销以高概率计算。
2.(Q)可以在\(O(\log(n)))轮中用\(O\左(n\ frac{(\mathrm{in}^{max(\mathsf{w},3\mathsf{iw})}+\mathrm{OUT})^2}{M}\right))通信开销以高概率计算。
交叉宽度是我们为查询和查询的广义超树分解(GHD)引入的一个新概念,它捕获了GHD的相邻组件之间的连接方式。
我们通过引入Yannakakis算法的分布式和广义版本(称为GYM)实现了我们的第一个结果。GYM将宽度为(mathsf w)、深度为(mathrf d)的任意(Q)GHD作为输入,并计算(O(mathsf d+log(n))中的(Q)和(O\左(n)frac{(mathrm{in}^{mathsf{w}}+mathrm{OUT})^2}{M}\right))通信成本。我们通过演示如何构造宽度为(max(mathsf{w},3mathsf}iw})、深度为(O(log(n))的GHD来获得第二个结果。我们描述了另一种构建宽度更长、深度更低的GHD的技术,演示了在通信和轮次数量之间可以进行的其他权衡。
关于整个系列,请参见[Zbl 1360.68007号].

MSC公司:

第68页,共15页 数据库理论
68宽15 分布式算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部