文件Zbl 1161.68701-zbMATH Open

重新启动随机漫游：快速解决方案和应用程序。（英语） Zbl 1161.68701号

知识。信息系统。14，第3期，327-346（2008）。

摘要：图中的两个节点的关系有多密切？如何在巨大的、磁盘驻留的真实图形上快速计算此分数？带重新启动的随机行走（RWR）在加权图中的两个节点之间提供了良好的相关性得分，它已成功地用于许多设置，如图像的自动字幕、“连接子图”的泛化、个性化PageRank等。然而，RWR的直接实现不适用于大型图，需要二次空间和三次预计算时间，或者查询响应时间较慢。我们建议快速解决这个问题。我们方法的核心是利用许多真实图共享的两个重要属性：（a）线性相关性和（b）区块式社区结构。我们通过使用低秩矩阵近似来利用线性，通过图划分来利用群落结构，然后使用Sherman-Morrison引理来进行矩阵反演。在Corel图像和DBLP数据库上的实验结果表明，与直接实现相比，我们提出的方法实现了显著的节省：它们可以在预计算和存储成本方面节省几个数量级，并且在保持质量的前提下实现了高达150倍的速度。

引用于21文件

MSC公司：

68兰特	计算机科学中的图论（包括图形绘制）
68瓦05	非数值算法

关键词：

相关性得分;带重启的随机行走;图形挖掘

软件：

SimRank公司

PDF格式 BibTeX公司 XML格式

全文：内政部

参考文献：

[1]	Achlioptas D，McSherry F（2001）低秩矩阵近似的快速计算。收件人：STOC·Zbl 1311.94032号
[2]	Aditya B、Bhalotia G、Chakrabarti S、Hulgeri A、Nakhe C、Parag SS（2002）《银行：关系数据库中的浏览和关键字搜索》。包含：VLDB，第1083–1086页
[3]	Balmin A，Hristidis V，Papakonstantinou Y（2004）Objectrank：数据库中基于权限的关键字搜索。输入：VLDB，564564–575
[4]	http://www.informatik.uni-trier.de/\（\ sim\）ley/db/
[5]	Deerwester S、Dumais S、Landauer T、Furnas G和Harshman R（1990年）。通过潜在语义分析进行索引。《美国社会科学杂志》41（6）：391–407·doi:10.1002/（SICI）1097-4571（199009）41:6<391:：AID-ASI1>3.0.CO；2-9
[6]	Dhillon IS，Mallela S，Modha DS（2003）信息论联合聚类。摘自：第九届ACM SIGKDD知识发现和数据挖掘国际会议（KDD 03），华盛顿特区，8月24-27日
[7]	Faloutsos C，McCurley KS，Tomkins A（2004）连接子图的快速发现。收录：KDD，第118-127页
[8]	Flake G，Lawrence S，Giles C（2000）网络社区的有效识别。收录：KDD，第150–160页
[9]	Fogaras D，Racz B（2004）《迈向扩展完全个性化的页面排名》。In：程序。WAW，第105–117页·Zbl 1109.68334号
[10]	Geerts F，Mannila H，Terzi E（2004）基于关系链接的排名。包含：VLDB，第552-563页
[11]	Girvan M，Newman MEJ（2002）社区结构是社会和生物网络。国家科学院程序7821–7826·Zbl 1032.91716号
[12]	Golub G，Loan C（1996），矩阵计算。约翰·霍普金斯·Zbl 0865.65009号
[13]	Haveliwala TH（2002）主题敏感页面排名。WWW，第517–526页
[14]	何杰，李明，张华，童华，张C（2004）基于流形库的图像检索。收录：ACM Multimedia，第9-16页
[15]	Jeh G，Widom J（2002）Simrank：结构-控制相似性的度量。收录：KDD，第538–543页
[16]	Jeh G，Widom J（2003）《缩放个性化网络搜索》。位于：WWW
[17]	Jolliffe I（2002）。主成分分析。海德堡施普林格·Zbl 1011.62064号
[18]	Kamvar S，Haveliwala T，Manning C，Golub G（2003）利用web的块结构计算页面等级。斯坦福大学技术报告
[19]	Karypis G和Kumar V（1999年）。不规则图的并行多级k路划分。SIAM版本41（2）：278–300·Zbl 0918.68073号 ·doi:10.1137/S0036144598334138
[20]	Liben-Nowell D，Kleinberg J（2003）社交网络的链接预测问题。In：程序。CIKM公司·Zbl 1137.92356号
[21]	Lu W、Janssen JCM、Milios EE、Japkowicz N和Zhang Y（2007）。引用图中的节点相似性。知识信息系统杂志11（1）：105–129·doi:10.1007/s10115-006-0023-9
[22]	Ng A、Jordan M、Weiss Y（2001）《关于谱聚类：分析和算法》。In:NIPS，第849–856页
[23]	Page L，Brin S，Motwani R，Winograd T（1998）PageRank引文排名：给网络带来秩序。斯坦福数字图书馆技术项目技术报告。SIDL-WP-1999-0120号文件（1999年11月11日版本）
[24]	Palopoli L、Rosaci D、Terracina G和Ursino D（2005年）。一种基于图形的方法，用于从具有异构格式的信息源中提取术语属性。知识信息系统杂志8（4）：462–497·doi:10.1007/s10115-004-0185-2
[25]	潘J-Y，杨H-J，Faloutsos C，Duygulu P（2004）自动多媒体跨模式相关发现。收录：KDD，第653-658页
[26]	Piegorsch W和Casella GE（1990年）。反转矩阵和。SIAM版本32:470·Zbl 0706.65027号 ·数字对象标识代码：10.1137/1032080
[27]	Rasmusen CE，Williams C（2006）机器学习的高斯过程。麻省理工学院出版社
[28]	Sun J，Qu H，Chakrabarti D，Faloutsos C（2005）二部图中的邻域形成和异常检测。In:ICDM，第418-425页
[29]	Tong H，Faloutsos C（2006）中心子图：问题定义和快速解决方案。输入：KDD
[30]	Zhou D、Bousquet O、Lal TN、Weston J、Scholkopf B（2003）《学习与地方和全球一致性》。输入：NIPS
[31]	Zhu X，Ghahramani Z，Lafferty JD（2003）使用高斯场和调和函数的半监督学习。In:ICML，第912-919页

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	综述，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b：book；一：图书文章）

一&b	逻辑和
一\|b	逻辑或
!ab公司	逻辑不
作业成本法*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

重新启动随机漫游：快速解决方案和应用程序。（英语） Zbl 1161.68701号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

重新启动随机漫游：快速解决方案和应用程序。 （英语） Zbl 1161.68701号

MSC公司：

关键词：

软件：

参考文献：

重新启动随机漫游：快速解决方案和应用程序。（英语） Zbl 1161.68701号