×

计算热核PageRank和局部聚类算法。 (英语) Zbl 1373.05188号

摘要:热核pagerank是指数公式中给出的个性化pagerank的变体。在这项工作中,我们提出了一个次线性时间算法来近似图的热核pagerank。该算法通过模拟有界长度的随机游走,并在时间上运行(O\left(\frac{log(\epsilon^{-1})\logn}{\varepsilon ^3\log\log(\ varepsilen^{-1{)}\right)),假设执行随机游走步骤,并从有界支持的分布中采样需要恒定的时间。
用热核pagerank获得的顶点的定量排序可以用于局部聚类算法。我们提出了一种高效的局部聚类算法,该算法通过在热内核pagerank向量上执行扫描来查找切割,并将热内核pagerank近似算法用作子例程。特别地,我们证明了对于Cheeger比率的子集(S)\(φ),(S)中的许多顶点可以作为热核pagerank向量的种子,该向量将找到电导的一个截(O(sqrt{φ}))。

MSC公司:

05C82号 小世界图形、复杂网络(图形理论方面)
05C85号 图形算法(图形理论方面)
68周25 近似算法
87年第68季度 计算机科学中的概率(算法分析、随机结构、相变等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 诺加·阿龙;Milman,Vitali D.,(lambda_1),图的等周不等式和超导体,J.Combin。B、 38、1、73-88(1985)·Zbl 0549.05051号
[2] Andersen,Reid;Chung,Fan,检测pagerank中的急剧下降和简化的局部划分算法,(计算模型理论与应用论文集(2007),Springer),1-12·Zbl 1198.68091号
[3] Andersen,Reid;钟,范;Lang,Kevin,使用pagerank向量进行局部图划分,(IEEE第47届计算机科学基础年会(2006),IEEE),475-486
[4] Andersen,Reid;Peres,Yuval,《使用进化集发现局部稀疏割集》,(第41届计算理论年会论文集(2009),ACM),235-244·Zbl 1304.05128号
[5] 阿尔伯特·拉兹洛·巴拉巴西;Albert,Réka,随机网络中缩放的出现,科学,286,5439,509-512(1999)·Zbl 1226.05223号
[6] 米歇尔·本齐;Klymko,Christine,《作为中心性度量的全面可沟通性》,复杂网络杂志。,124-149年1月2日(2013年)
[7] 克里斯蒂安·博格斯(Christian Borgs);Michael Brautbar;詹妮弗·查耶斯(Jennifer T.Chayes)。;滕尚华,用于pagerank计算的次线性时间算法,(WAW(2012)),41-53·Zbl 1342.05181号
[8] Pak K.Chan。;马丁·施拉格(Martine D.F.Schlag)。;Jason Y.Zien,Spectral k-way ratio-cut partitioning and clustering,IEEE Trans。计算-辅助设计。集成。电路系统。,13, 9, 1088-1096 (1994)
[9] Chung,Fan,作为图的pagerank的热核,Proc。国家。阿卡德。科学。,104, 50, 19735-19740 (2007)
[10] Chung,Fan,使用热内核pagerank的局部图划分算法,互联网数学。,6, 3, 315-330 (2009) ·Zbl 1238.05208号
[11] Fan Chung,Olivia Simpson,使用热核pagerank求解具有边界条件的线性系统,见:网络图的算法和模型研讨会,2013年,第203-219页。;Fan Chung,Olivia Simpson,使用热核pagerank求解具有边界条件的线性系统,见:网络图的算法和模型研讨会,2013年,第203-219页·Zbl 1342.05057号
[12] 钟,范;Simpson,Olivia,《计算热核pagerank和局部聚类算法》(Computing heat kernel pagerank and a local clustering algorithm),(组合算法:第25届国际研讨会,IWOCA 2014,美国明尼苏达州德卢斯,2014年10月15-17日,修订论文集(2014),斯普林格出版社),110-121·Zbl 1401.05273号
[13] 钟,范;Simpson,Olivia,使用热核pagrank求解具有边界条件的局部线性系统,互联网数学。,11, 4-5, 449-471 (2015) ·Zbl 1461.68025号
[14] 威廉·多纳(William E.Donath)。;Hoffman,Alan J.,《基于连接矩阵特征向量的图和计算机逻辑分区算法》,IBM技术光盘。公牛。,15, 3, 938-944 (1972)
[15] 罗纳德·费金;拉维·库马尔;Sivakumar,D.,比较顶级列表,SIAM J.离散数学。,17, 1, 134-160 (2003) ·Zbl 1057.68075号
[16] Gharan、Shayan Oveis;Luca Trevisan,《近似展开轮廓和几乎最优局部图聚类》(IEEE第53届计算机科学基础年会(2012),IEEE),187-196
[17] 丹尼尔·阿里克·哈格伯格。Schult,PieterJ.Swart,《使用networkx探索网络结构、synamics和函数》,摘自:《第七届Python科学会议论文集》,2008年,美国加利福尼亚州帕萨迪纳,2008,第11-15页。;Aric A.Hagberg,DanielA。Schult,PieterJ.Swart,使用networkx探索网络结构、突触和功能,载于:第七届Python科学会议论文集,SciPy2008,美国加利福尼亚州帕萨迪纳,2008年,第11-15页。
[18] Haveliwala,Taher H.,主题敏感页面排名,(第11届万维网国际会议论文集(2002年),ACM),517-526
[19] 彼得·霍尔姆(Petter Holme);Kim,Beom Jun,《使用可调集群发展无标度网络》,Phys。版本E,65,2,026107(2002)
[20] 拉维·坎南;桑托什·万帕拉;阿德里安·维塔(Adrian Vetta),《关于聚类:好、坏和光谱》(On clusterings:Good,bad and spectrical),J.ACM,51、3、497-515(2004)·Zbl 1192.05160号
[21] 布莱恩·克里姆特;杨一鸣,《安然语料库介绍》(CEAS(2004))·Zbl 1132.68562号
[22] Kloster,Kyle;Gleich,David F.,一种近似大型稀疏网络矩阵指数列的近公共方法,(网络图的算法和模型(2013)),68-79·Zbl 1342.05165号
[23] Valdis Krebs,《新政治模式》,2008年。http://www.orgnet.com/divided; Valdis Krebs,《新政治模式》,2008年。http://www.orgnet.com/divided
[24] Jure Leskovec、Andrej Krevl,《SNAP数据集:斯坦福大学大型网络数据集收集》,2014年。http://snap.stanford.edu/data; Jure Leskovec、Andrej Krevl,《SNAP数据集:斯坦福大学大型网络数据集收集》,2014年。http://snap.stanford.edu/data
[25] Leskovec,Jure;Kevin J.Lang。;达斯古普塔,阿尼尔班;迈克尔·马奥尼(Michael W.Mahoney),《大型社会和信息网络中社区结构的统计特性》(第17届国际万维网会议论文集(2008),ACM),695-704
[26] Leskovec,Jure;朱利安·麦考利(Julian J.Mcauley),《学习发现自我网络中的社交圈》(Learning to discover social circuils in ego networks),(神经信息处理系统进展(2012),539-547
[27] 廖忠寿;陆康浩;Michael Baym;罗希特·辛格;Berger,Bonnie,IsoRankN:多蛋白质网络全球比对的光谱方法,生物信息学,25,12,i253-i258(2009)
[28] Frank Lin,William W.Cohen,Power迭代聚类,摘自:《第27届机器学习国际会议论文集》,ICML10,2010年,第655-662页。;Frank Lin,William W.Cohen,Power迭代聚类,摘自:第27届机器学习国际会议论文集,ICML10,2010年,第655-662页。
[29] Frank Lin,William W.Cohen,《大文本数据集快速聚类方法》,载于:《第19届欧洲人工智能会议论文集》,2010年,第303-308页。;Frank Lin,William W.Cohen,《大文本数据集快速聚类方法》,载于:《第19届欧洲人工智能会议论文集》,2010年,第303-308页。
[30] Lovász,László;Simonovits,Miklós,《马尔可夫链的混合率,等周不等式和体积计算》(第31届计算机科学基础年会论文集(1990),IEEE),346-354
[31] 洛瓦兹,László;Simonovits,Miklós,《凸体中的随机行走》和一种改进的体积算法——随机结构。算法,4,4359-412(1993)·Zbl 0788.60087号
[32] 卢梭,D。;施耐德,K。;O.J.博伊索。;哈斯,P。;斯洛滕,E。;Dawson,S.M.,宽吻海豚群落的可疑声音特征是有很大比例的长期联系,Behav。经济。Sociobiol.公司。,54, 396-405 (2003)
[33] Mark Newman,《网络数据》,2013年。http://www-personal.umich.edu/mejn/netdata/;Mark Newman,《网络数据》,2013年。http://www-personal.umich.edu/mejn/netdata/
[34] Ng,Andrew Y。;乔丹,迈克尔一世。;Weiss,Yair,《关于光谱聚类:分析和算法》,高级神经信息处理。系统。,2, 849-856 (2002)
[35] 洛伦佐·奥雷奇亚;苏珊·萨奇德娃(Sushant Sachdeva);Vishnoi,Nisheeth K.,近似指数,lanczos方法和平衡分离器的(widetilde{O})(m)-时间谱算法,(第44届计算理论研讨会论文集(2012),ACM),1141-1160·Zbl 1286.05099号
[36] Sushant Sachdeva,Nisheet K.Vishnoi,《矩阵反演与求幂一样简单》,2013年。ArXiv预印ArXiv:1305.0526;Sushant Sachdeva,Nisheet K.Vishnoi,《矩阵反演与求幂一样简单》,2013年。ArXiv预打印ArXiv:1305.0526
[37] 石建波;Malik,Jitendra,标准化切割和图像分割,IEEE Trans。模式分析。机器。智力。,22, 8, 888-905 (2000)
[38] 丹尼尔·斯皮尔曼(Daniel A.Spielman)。;滕尚华,用于图划分、图稀疏化和求解线性系统的近线性时间算法,(第三十六届ACM计算理论年会论文集(2004),ACM),81-90·Zbl 1192.65048号
[39] Daniel A.Spielman,Shang-Hua Teng,大规模图的局部聚类算法及其在近线性时间图划分中的应用,2008,CoRRhttp://arxiv.org/abs/0809.3232; Daniel A.Spielman,Shang-Hua Teng,大规模图的局部聚类算法及其在近线性时间图划分中的应用,2008,CoRRhttp://arxiv.org/abs/0809.3232 ·Zbl 1286.68244号
[40] Watts,Duncan J。;Steven H.Strogatz,《小世界网络的集体动态》,《自然》,393,6684,440-442(1998)·Zbl 1368.05139号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。