摩西·查里卡尔;陈凯文;马丁·法拉奇·科尔顿 在数据流中查找频繁项。 (英语) Zbl 1057.68600号 Widmayer,Peter(编辑)等人,自动机,语言和编程。第29届国际学术讨论会,ICALP 2002,西班牙马拉加,2002年7月8日至13日。诉讼程序。柏林:施普林格出版社(ISBN 3-540-43864-5)。莱克特。注释计算。科学。2380, 693-703 (2002). 摘要:我们提出了一种1-pass算法,用于使用非常有限的存储空间估计数据流中的最频繁项。我们的方法依赖于一种称为COUNT SKETCH的新型数据结构,它允许我们估计流中所有项目的频率。对于这个问题,对于项目频率上的许多自然分布,我们的算法实现了比以前最著名的算法更好的空间边界。此外,对于估计两个数据流之间频率变化最大(绝对)的项的问题,我们的算法直接引入了一种二通算法。据我们所知,这一问题以前在文献中没有研究过。关于整个系列,请参见[Zbl 0993.00041号]. 引用于2评论引用于41文件 理学硕士: 68第05页 数据结构 第68页,共15页 数据库理论 PDF格式BibTeX公司 XML格式引用 \textit{M.Charikar}等人,Lect。注释计算。科学。2380693--703(2002年;Zbl 1057.68600) 全文: 链接