研究论文

Colibri：大型静态和动态图的快速挖掘

作者：
航航通

美国宾夕法尼亚州匹兹堡卡内基梅隆大学

美国宾夕法尼亚州匹兹堡卡内基梅隆大学
查看个人资料

,
Spiros Papadimitriou公司

IBM T.J.Watson，美国纽约州霍桑

IBM T.J.Watson，美国纽约州霍桑
查看个人资料

,
孙继萌

IBM T.J.Watson，美国纽约州霍桑

IBM T.J.Watson，美国纽约州霍桑
查看个人资料

,
菲利普·S·余

美国伊利诺伊州芝加哥伊利诺伊大学

美国伊利诺伊州芝加哥伊利诺伊大学
查看个人资料

,
克里斯托斯·法洛索斯

美国宾夕法尼亚州匹兹堡卡内基梅隆大学

美国宾夕法尼亚州匹兹堡卡内基梅隆大学
查看个人资料

作者信息和声明

KDD’08：第14届ACM SIGKDD知识发现和数据挖掘国际会议记录2008年8月第686–694页https://doi.org/10.1145/1401890.1401973

出版：2008年8月24日出版历史

KDD’08：第14届ACM SIGKDD知识发现和数据挖掘国际会议记录

第686–694页

摘要

图的邻接矩阵的低秩近似对于发现模式（例如社区）和检测异常至关重要。此外，随着图随时间、效率和有限存储空间的发展，需要跟踪低秩结构。真实图通常有数千或数百万个节点，但通常非常稀疏。然而，SVD等标准分解并不能保持稀疏性。这导致了CUR和CMD等方法的发展，它们通过对稀疏矩阵的列和/或行进行采样来寻求非正交基。

然而，这些方法通常会产生过于完整的基础，这会浪费空间和时间。在本文中，我们提出科利布里应对这些挑战的方法。我们的静态图形版本，大肠杆菌-S，迭代地找到了一个非冗余的基础，我们证明了与最好的竞争对手（CUR和CMD）相比，它没有损失准确性，同时在空间和时间上实现了显著的节约：在真实数据上，大肠杆菌-S需要更少的空间数量级更快（与非冗余列数的平方成比例）。此外，我们提出了一种有效的动态时间演化图更新算法，大肠杆菌-D。我们对大型真实网络流量数据集的评估表明大肠杆菌-D结束了100次比最佳发布竞争对手（CMD）更快。

工具书类

D.Achlioptas和F.McSherry。低阶矩阵近似的快速计算。J.ACM，54（2），2007年。谷歌学者数字图书馆
R.Albert、H.Jeong和A.-L.Barabasi。万维网的直径。《自然》，（401）：130-1311999。谷歌学者
L.Backstrom、D.P.Huttenlocher、J.M.Kleinberg和X.Lan。大型社交网络中的群体形成：成员、成长和进化。在KDD中，第44-54页，2006年。谷歌学者数字图书馆
A.Broder、R.Kumar、F.Maghoul1、P.Raghavan、S.Rajagopalan、R.Stata、A.Tomkins和J.Wiener。网络中的图形结构：实验和模型。WWW Conf.，2000年。谷歌学者数字图书馆
Chi Y.、Song X.、Zhou D.、Hino K.和Tseng B.L。通过结合时间平滑度的进化光谱聚类。在KDD中，第153-162页，2007年。谷歌学者数字图书馆
S.Dorogovtsev和J.Mendes。网络的演变。物理学进展，51:1079-11872002。谷歌学者交叉引用
P.Drineas、R.Kannan和M.W.Mahoney。矩阵的快速蒙特卡罗算法i：近似矩阵乘法。SIAM计算机杂志，2005年。谷歌学者数字图书馆
P.Drineas、R.Kannan和M.W.Mahoney。矩阵的快速蒙特卡罗算法iii：计算压缩近似矩阵分解。SIAM计算机杂志，2005年。谷歌学者数字图书馆
P.Drineas、M.W.Mahoney和S.Muthukrishnan。相对误差cur矩阵分解。CoRR，abs/0708.36962007。谷歌学者
M.Faloutsos、P.Falooutsos和C.Faloutos。论互联网拓扑的幂律关系。SIGCOMM，第251--262页，1999年8月至9月。谷歌学者数字图书馆
G.Flake、S.Lawrence、C.L.Giles和F.Coetzee。自我组织和识别网络社区。IEEE计算机，35（3），2002年3月。谷歌学者数字图书馆
D.Gibson、J.Kleinberg和P.Raghavan。从链接拓扑推断web社区。第九届ACM超文本和超媒体会议，第225-234页，纽约，1998年。谷歌学者数字图书馆
M.Girvan和M.E.J.Newman。社区结构是社会和生物网络。谷歌学者
G.H.Golub和C.F.Van-Loan。矩阵计算。约翰·霍普金斯大学出版社，巴尔的摩，第二版，1989年。谷歌学者
S.Guha、D.Gunopulos和N.Koudas。关联同步和异步数据流。在KDD中，第529-5342003页。谷歌学者数字图书馆
P.Indyk公司。稳定分布、伪随机生成器、嵌入和数据流计算。在FOCS中，第189-197页，2000年。谷歌学者数字图书馆
K.V.R.Kanth、D.Agrawal和A.K.Singh。动态数据库中相似性搜索的降维方法。在SIGMOD会议上，第166-176页，1998年。谷歌学者数字图书馆
D.Kempe、J.Kleinberg和E.Tardos。《通过社交网络最大限度地扩大影响力》，KDD，2003年。谷歌学者数字图书馆
J.Leskovec、J.M.Kleinberg和C.Faloutsos。随时间变化的图表：致密化规律、收缩直径和可能的解释。在KDD中，第177-187页，2005年。谷歌学者数字图书馆
M.E.J.纽曼。复杂网络的结构和功能。《SIAM评论》，45:167--2562003年。谷歌学者数字图书馆
J.-Y.Pan、H.-J.Yang、C.Faloutsos和P.Duygulu。自动多媒体跨模式相关发现。在KDD中，第653-658页，2004年。谷歌学者数字图书馆
J.-Y.Pan、H.-J.Yang、C.Faloutsos和P.Duygulu。自动多媒体跨模式相关发现。在KDD中，第653-658页，2004年。谷歌学者数字图书馆
S.Papadimitriou、J.Sun和C.Faloutsos。多时间序列中的流模式发现。在VLDB中，第697-708页，2005年。谷歌学者数字图书馆
W.Piegorsch和G.E.Casella。反转矩阵和。《SIAM评论》，第32卷，第470-470页，1990年。谷歌学者数字图书馆
J.Sun、C.Faloutsos、S.Papadimitriou和P.S.Yu。Graphscope：大型时间演化图的无参数挖掘。在KDD中，第687-696页，2007年。谷歌学者数字图书馆
J.Sun、H.Qu、D.Chakrabarti和C.Faloutsos。二部图中的邻域形成和异常检测。在ICDM中，第418-425页，2005年。谷歌学者数字图书馆
J.Sun、D.Tao和C.Faloutsos。超越流和图：动态张量分析。在KDD中，第374-3832006页。谷歌学者数字图书馆
J.Sun、Y.Xie、H.Zhang和C.Faloutsos。少即是多：大型稀疏图的紧凑矩阵分解。在SDM，2007年。谷歌学者交叉引用
H.Tong、C.Faloutsos和J.-Y.Pan。重新启动随机漫游：快速解决方案和应用程序。《知识与信息系统：国际期刊》（KAIS），2008年。谷歌学者数字图书馆
D.Xin、J.Han、X.Yan和H.Cheng。挖掘压缩的频率模式集。VLDB，第709-720页，2005谷歌学者数字图书馆

索引术语

Colibri：大型静态和动态图的快速挖掘
1. 信息系统
  1. 信息系统应用
    1. 数据挖掘

建议

代数域分解预条件的低秩校正方法

本文提出了一种并行预处理方法基于近似逆的分布式稀疏线性系统原始矩阵的通用框架分布式稀疏矩阵和利用域。。。
阅读更多信息
基于非凸低阶近似的图像压缩感知

在各种压缩感知（CS）研究中，非局部稀疏性和结构化稀疏性被证明可以改善图像细节的重建。非局部处理是通过将图像的相似块分组来实现的。收件人。。。
阅读更多信息
非负剩余矩阵分解：问题定义、快速解决方案和应用

矩阵分解是发现图形模式（例如社区、异常等）的一个非常强大的工具。最近的趋势是通过编码一些解释友好的属性（例如非负性）来提高发现的图形模式的可用性。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
KDD’08：第14届ACM SIGKDD知识发现和数据挖掘国际会议记录
2008年8月
1116页
国际标准图书编号：9781605581934
内政部：2014年10月14日/1401890
总主席：
李颖
Microsoft adCenter实验室
,
课程主席：
刘冰（Bing Liu）
伊利诺大学芝加哥分校
,
苏尼塔·萨拉瓦吉
印度理工学院，孟买
版权所有©2008 ACM
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2008年8月24日
权限
请求有关此文章的权限。
请求权限

检查更新
作者标记
图挖掘
低阶近似
可扩展性
限定符
- 研究论文
会议

接受率
2008年KDD纸张接受率118属于593提交文件，20%总体验收率1,133属于8,635提交文件，13%
更多
即将召开的会议
24日星期日

赞助商：

sigkdd公司

西格克德

第30届ACM SIGKDD知识发现和数据挖掘会议

2024年8月25日至29日

巴塞罗那，西班牙
资金来源
其他指标
查看文章指标

文章指标
- 75
  引文总数
  查看引文
- 981
  总下载次数
- 下载次数（过去12个月）40
- 下载次数（最近6周）三
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

Colibri：大型静态和动态图的快速挖掘

KDD’08：第14届ACM SIGKDD知识发现和数据挖掘国际会议记录

摘要

工具书类

引用人

索引术语

建议

代数域分解预条件的低秩校正方法

基于非凸低阶近似的图像压缩感知

非负剩余矩阵分解：问题定义、快速解决方案和应用

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

权限

检查更新

作者标记

限定符

会议

接受率

即将召开的会议

资金来源

其他指标

文章指标

其他指标

引用人

PDF格式

电子阅读器

数字版

解说词

Colibri：大型静态和动态图的快速挖掘

KDD’08：第14届ACM SIGKDD知识发现和数据挖掘国际会议记录

摘要

工具书类

引用人

索引术语

建议

代数域分解预条件的低秩校正方法

基于非凸低阶近似的图像压缩感知

非负剩余矩阵分解：问题定义、快速解决方案和应用

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

权限

检查更新

作者标记

限定符

会议

接受率

即将召开的会议

资金来源

文章指标

其他指标

PDF格式

电子阅读器

数字版

共享此出版物链接

在社交媒体上分享