×

重新启动随机漫游:快速解决方案和应用程序。 (英语) Zbl 1161.68701号

知识。信息系统。14,第3期,327-346(2008)。
摘要:图中的两个节点的关系有多密切?如何在巨大的、磁盘驻留的真实图形上快速计算此分数?带重新启动的随机行走(RWR)在加权图中的两个节点之间提供了良好的相关性得分,它已成功地用于许多设置,如图像的自动字幕、“连接子图”的泛化、个性化PageRank等。然而,RWR的直接实现不适用于大型图,需要二次空间和三次预计算时间,或者查询响应时间较慢。我们建议快速解决这个问题。我们方法的核心是利用许多真实图共享的两个重要属性:(a)线性相关性和(b)区块式社区结构。我们通过使用低秩矩阵近似来利用线性,通过图划分来利用群落结构,然后使用Sherman-Morrison引理来进行矩阵反演。在Corel图像和DBLP数据库上的实验结果表明,与直接实现相比,我们提出的方法实现了显著的节省:它们可以在预计算和存储成本方面节省几个数量级,并且在保持质量的前提下实现了高达150倍的速度。

MSC公司:

68兰特 计算机科学中的图论(包括图形绘制)
68瓦05 非数值算法

软件:

SimRank公司

参考文献:

[1] Achlioptas D,McSherry F(2001)低秩矩阵近似的快速计算。收件人:STOC·Zbl 1311.94032号
[2] Aditya B、Bhalotia G、Chakrabarti S、Hulgeri A、Nakhe C、Parag SS(2002)《银行:关系数据库中的浏览和关键字搜索》。包含:VLDB,第1083–1086页
[3] Balmin A,Hristidis V,Papakonstantinou Y(2004)Objectrank:数据库中基于权限的关键字搜索。输入:VLDB,564564–575
[4] http://www.informatik.uni-trier.de/\(\ sim\)ley/db/
[5] Deerwester S、Dumais S、Landauer T、Furnas G和Harshman R(1990年)。通过潜在语义分析进行索引。《美国社会科学杂志》41(6):391–407·doi:10.1002/(SICI)1097-4571(199009)41:6<391::AID-ASI1>3.0.CO;2-9
[6] Dhillon IS,Mallela S,Modha DS(2003)信息论联合聚类。摘自:第九届ACM SIGKDD知识发现和数据挖掘国际会议(KDD 03),华盛顿特区,8月24-27日
[7] Faloutsos C,McCurley KS,Tomkins A(2004)连接子图的快速发现。收录:KDD,第118-127页
[8] Flake G,Lawrence S,Giles C(2000)网络社区的有效识别。收录:KDD,第150–160页
[9] Fogaras D,Racz B(2004)《迈向扩展完全个性化的页面排名》。In:程序。WAW,第105–117页·Zbl 1109.68334号
[10] Geerts F,Mannila H,Terzi E(2004)基于关系链接的排名。包含:VLDB,第552-563页
[11] Girvan M,Newman MEJ(2002)社区结构是社会和生物网络。国家科学院程序7821–7826·Zbl 1032.91716号
[12] Golub G,Loan C(1996),矩阵计算。约翰·霍普金斯·Zbl 0865.65009号
[13] Haveliwala TH(2002)主题敏感页面排名。WWW,第517–526页
[14] 何杰,李明,张华,童华,张C(2004)基于流形库的图像检索。收录:ACM Multimedia,第9-16页
[15] Jeh G,Widom J(2002)Simrank:结构-控制相似性的度量。收录:KDD,第538–543页
[16] Jeh G,Widom J(2003)《缩放个性化网络搜索》。位于:WWW
[17] Jolliffe I(2002)。主成分分析。海德堡施普林格·Zbl 1011.62064号
[18] Kamvar S,Haveliwala T,Manning C,Golub G(2003)利用web的块结构计算页面等级。斯坦福大学技术报告
[19] Karypis G和Kumar V(1999年)。不规则图的并行多级k路划分。SIAM版本41(2):278–300·Zbl 0918.68073号 ·doi:10.1137/S0036144598334138
[20] Liben-Nowell D,Kleinberg J(2003)社交网络的链接预测问题。In:程序。CIKM公司·Zbl 1137.92356号
[21] Lu W、Janssen JCM、Milios EE、Japkowicz N和Zhang Y(2007)。引用图中的节点相似性。知识信息系统杂志11(1):105–129·doi:10.1007/s10115-006-0023-9
[22] Ng A、Jordan M、Weiss Y(2001)《关于谱聚类:分析和算法》。In:NIPS,第849–856页
[23] Page L,Brin S,Motwani R,Winograd T(1998)PageRank引文排名:给网络带来秩序。斯坦福数字图书馆技术项目技术报告。SIDL-WP-1999-0120号文件(1999年11月11日版本)
[24] Palopoli L、Rosaci D、Terracina G和Ursino D(2005年)。一种基于图形的方法,用于从具有异构格式的信息源中提取术语属性。知识信息系统杂志8(4):462–497·doi:10.1007/s10115-004-0185-2
[25] 潘J-Y,杨H-J,Faloutsos C,Duygulu P(2004)自动多媒体跨模式相关发现。收录:KDD,第653-658页
[26] Piegorsch W和Casella GE(1990年)。反转矩阵和。SIAM版本32:470·Zbl 0706.65027号 ·数字对象标识代码:10.1137/1032080
[27] Rasmusen CE,Williams C(2006)机器学习的高斯过程。麻省理工学院出版社
[28] Sun J,Qu H,Chakrabarti D,Faloutsos C(2005)二部图中的邻域形成和异常检测。In:ICDM,第418-425页
[29] Tong H,Faloutsos C(2006)中心子图:问题定义和快速解决方案。输入:KDD
[30] Zhou D、Bousquet O、Lal TN、Weston J、Scholkopf B(2003)《学习与地方和全球一致性》。输入:NIPS
[31] Zhu X,Ghahramani Z,Lafferty JD(2003)使用高斯场和调和函数的半监督学习。In:ICML,第912-919页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。