跳到主要内容
10.1145/1401890.1401973acm会议文章/章节视图摘要出版物页面千迪拉姆会议记录会议集合
研究论文

Colibri:大型静态和动态图的快速挖掘

出版:2008年8月24日出版历史

摘要

图的邻接矩阵的低秩近似对于发现模式(例如社区)和检测异常至关重要。此外,随着图随时间、效率和有限存储空间的发展,需要跟踪低秩结构。真实图通常有数千或数百万个节点,但通常非常稀疏。然而,SVD等标准分解并不能保持稀疏性。这导致了CUR和CMD等方法的发展,它们通过对稀疏矩阵的列和/或行进行采样来寻求非正交基。

然而,这些方法通常会产生过于完整的基础,这会浪费空间和时间。在本文中,我们提出科利布里应对这些挑战的方法。我们的静态图形版本,大肠杆菌-S,迭代地找到了一个非冗余的基础,我们证明了与最好的竞争对手(CUR和CMD)相比,它没有损失准确性,同时在空间和时间上实现了显著的节约:在真实数据上,大肠杆菌-S需要更少的空间数量级更快(与非冗余列数的平方成比例)。此外,我们提出了一种有效的动态时间演化图更新算法,大肠杆菌-D。我们对大型真实网络流量数据集的评估表明大肠杆菌-D结束了100次比最佳发布竞争对手(CMD)更快。

工具书类

  1. D.Achlioptas和F.McSherry。低阶矩阵近似的快速计算。J.ACM,54(2),2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  2. R.Albert、H.Jeong和A.-L.Barabasi。万维网的直径。《自然》,(401):130-1311999。谷歌学者谷歌学者
  3. L.Backstrom、D.P.Huttenlocher、J.M.Kleinberg和X.Lan。大型社交网络中的群体形成:成员、成长和进化。在KDD中,第44-54页,2006年。谷歌学者谷歌学者数字图书馆数字图书馆
  4. A.Broder、R.Kumar、F.Maghoul1、P.Raghavan、S.Rajagopalan、R.Stata、A.Tomkins和J.Wiener。网络中的图形结构:实验和模型。WWW Conf.,2000年。谷歌学者谷歌学者数字图书馆数字图书馆
  5. Chi Y.、Song X.、Zhou D.、Hino K.和Tseng B.L。通过结合时间平滑度的进化光谱聚类。在KDD中,第153-162页,2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  6. S.Dorogovtsev和J.Mendes。网络的演变。物理学进展,51:1079-11872002。谷歌学者谷歌学者交叉引用交叉引用
  7. P.Drineas、R.Kannan和M.W.Mahoney。矩阵的快速蒙特卡罗算法i:近似矩阵乘法。SIAM计算机杂志,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  8. P.Drineas、R.Kannan和M.W.Mahoney。矩阵的快速蒙特卡罗算法iii:计算压缩近似矩阵分解。SIAM计算机杂志,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  9. P.Drineas、M.W.Mahoney和S.Muthukrishnan。相对误差cur矩阵分解。CoRR,abs/0708.36962007。谷歌学者谷歌学者
  10. M.Faloutsos、P.Falooutsos和C.Faloutos。论互联网拓扑的幂律关系。SIGCOMM,第251--262页,1999年8月至9月。谷歌学者谷歌学者数字图书馆数字图书馆
  11. G.Flake、S.Lawrence、C.L.Giles和F.Coetzee。自我组织和识别网络社区。IEEE计算机,35(3),2002年3月。谷歌学者谷歌学者数字图书馆数字图书馆
  12. D.Gibson、J.Kleinberg和P.Raghavan。从链接拓扑推断web社区。第九届ACM超文本和超媒体会议,第225-234页,纽约,1998年。谷歌学者谷歌学者数字图书馆数字图书馆
  13. M.Girvan和M.E.J.Newman。社区结构是社会和生物网络。谷歌学者谷歌学者
  14. G.H.Golub和C.F.Van-Loan。矩阵计算。约翰·霍普金斯大学出版社,巴尔的摩,第二版,1989年。谷歌学者谷歌学者
  15. S.Guha、D.Gunopulos和N.Koudas。关联同步和异步数据流。在KDD中,第529-5342003页。谷歌学者谷歌学者数字图书馆数字图书馆
  16. P.Indyk公司。稳定分布、伪随机生成器、嵌入和数据流计算。在FOCS中,第189-197页,2000年。谷歌学者谷歌学者数字图书馆数字图书馆
  17. K.V.R.Kanth、D.Agrawal和A.K.Singh。动态数据库中相似性搜索的降维方法。在SIGMOD会议上,第166-176页,1998年。谷歌学者谷歌学者数字图书馆数字图书馆
  18. D.Kempe、J.Kleinberg和E.Tardos。《通过社交网络最大限度地扩大影响力》,KDD,2003年。谷歌学者谷歌学者数字图书馆数字图书馆
  19. J.Leskovec、J.M.Kleinberg和C.Faloutsos。随时间变化的图表:致密化规律、收缩直径和可能的解释。在KDD中,第177-187页,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  20. M.E.J.纽曼。复杂网络的结构和功能。《SIAM评论》,45:167--2562003年。谷歌学者谷歌学者数字图书馆数字图书馆
  21. J.-Y.Pan、H.-J.Yang、C.Faloutsos和P.Duygulu。自动多媒体跨模式相关发现。在KDD中,第653-658页,2004年。谷歌学者谷歌学者数字图书馆数字图书馆
  22. J.-Y.Pan、H.-J.Yang、C.Faloutsos和P.Duygulu。自动多媒体跨模式相关发现。在KDD中,第653-658页,2004年。谷歌学者谷歌学者数字图书馆数字图书馆
  23. S.Papadimitriou、J.Sun和C.Faloutsos。多时间序列中的流模式发现。在VLDB中,第697-708页,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  24. W.Piegorsch和G.E.Casella。反转矩阵和。《SIAM评论》,第32卷,第470-470页,1990年。谷歌学者谷歌学者数字图书馆数字图书馆
  25. J.Sun、C.Faloutsos、S.Papadimitriou和P.S.Yu。Graphscope:大型时间演化图的无参数挖掘。在KDD中,第687-696页,2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  26. J.Sun、H.Qu、D.Chakrabarti和C.Faloutsos。二部图中的邻域形成和异常检测。在ICDM中,第418-425页,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  27. J.Sun、D.Tao和C.Faloutsos。超越流和图:动态张量分析。在KDD中,第374-3832006页。谷歌学者谷歌学者数字图书馆数字图书馆
  28. J.Sun、Y.Xie、H.Zhang和C.Faloutsos。少即是多:大型稀疏图的紧凑矩阵分解。在SDM,2007年。谷歌学者谷歌学者交叉引用交叉引用
  29. H.Tong、C.Faloutsos和J.-Y.Pan。重新启动随机漫游:快速解决方案和应用程序。《知识与信息系统:国际期刊》(KAIS),2008年。谷歌学者谷歌学者数字图书馆数字图书馆
  30. D.Xin、J.Han、X.Yan和H.Cheng。挖掘压缩的频率模式集。VLDB,第709-720页,2005谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. Colibri:大型静态和动态图的快速挖掘

    建议

    评论

    登录选项

    检查您是否可以通过登录凭据或您的机构访问本文。

    登录

    完全访问权限

    • 发布于

      封面图片ACM会议
      KDD’08:第14届ACM SIGKDD知识发现和数据挖掘国际会议记录
      2008年8月
      1116页
      国际标准图书编号:9781605581934
      内政部:2014年10月14日/1401890

      版权所有©2008 ACM

      如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

      出版商

      计算机协会

      美国纽约州纽约市

      出版历史

      • 出版:2008年8月24日

      权限

      请求有关此文章的权限。

      请求权限

      检查更新

      限定符

      • 研究论文

      接受率

      2008年KDD纸张接受率118属于593提交文件,20%总体验收率1,133属于8,635提交文件,13%

      即将召开的会议

      24日星期日
      第30届ACM SIGKDD知识发现和数据挖掘会议
      2024年8月25日至29日
      巴塞罗那,西班牙

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用eReader联机查看。

    电子阅读器