×

关于箱中幂律分布球及其在视图大小估计中的应用。 (英语) Zbl 1350.68087号

Asano,Takao(编辑)等人,《算法与计算》。2011年12月5日至8日在日本横滨举行的第22届国际研讨会,ISAAC 2011。诉讼程序。柏林:施普林格出版社(ISBN 978-3-642-25590-8/pbk)。计算机科学课堂讲稿7074,504-513(2011)。
摘要:视图大小估计在查询优化中起着重要作用。据观察,许多数据遵循幂律分布。在本文中,我们考虑了当箱子选择概率服从幂律分布时,将球放入箱中的问题。作为对优惠券收集器问题的概括,我们解决了确定需要抛出的球的预期数量的问题,以便每个(N)箱中至少有一个球。我们证明了要实现这一点,需要使用(Theta(\frac{N^\alpha\ln N}{c_N^{\alpha}})球,其中,(\alpha)是幂律分布的参数,(c_N^{alpha}=\frac}\alpha-1}{\ alpha-N^{\alpha-1}}}\)表示\(\alfa\neq 1\),而(c_N{alpha}=\frac{1}{\ln N}\)则表示\(alpha=1\)。接下来,当确定投掷到\(T)的球的数量时,我们提供了至少有一名乘客的预期箱子数量的闭合形式上限和下限。对于\(n)large和\(alpha>1),我们证明了我们的边界紧到\(left(\frac{\alpha}{\alfa-1}\right)^{1-\frac{1}{\alpha}}\leqe^{1/e}\simeq1.4\)的常数因子。
有关整个系列,请参见[兹比尔1228.68006].

MSC公司:

第68页,共15页 数据库理论
68第05页 数据结构
87年第68季度 计算机科学中的概率(算法分析、随机结构、相变等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接