×

在数据流中查找频繁项。 (英语) Zbl 1057.68600号

Widmayer,Peter(编辑)等人,自动机,语言和编程。第29届国际学术讨论会,ICALP 2002,西班牙马拉加,2002年7月8日至13日。诉讼程序。柏林:施普林格出版社(ISBN 3-540-43864-5)。莱克特。注释计算。科学。2380, 693-703 (2002).
摘要:我们提出了一种1-pass算法,用于使用非常有限的存储空间估计数据流中的最频繁项。我们的方法依赖于一种称为COUNT SKETCH的新型数据结构,它允许我们估计流中所有项目的频率。对于这个问题,对于项目频率上的许多自然分布,我们的算法实现了比以前最著名的算法更好的空间边界。此外,对于估计两个数据流之间频率变化最大(绝对)的项的问题,我们的算法直接引入了一种二通算法。据我们所知,这一问题以前在文献中没有研究过。
关于整个系列,请参见[Zbl 0993.00041号].

理学硕士:

68第05页 数据结构
第68页,共15页 数据库理论
PDF格式BibTeX公司 XML格式引用
全文: 链接