×

个性化PageRank聚类:一种基于随机行走的图聚类算法。 (英语) Zbl 1395.05154号

摘要:图聚类在许多方法中都是必不可少的一部分,因此其准确性对许多应用都有重要影响。此外,社交网络、生物网络和电路等真实世界图形的指数增长需要具有近线性时间和空间复杂性的聚类算法。在本文中,我们提出了个性化PageRank聚类(PPC),它利用随机游动固有的聚类探索特性来揭示给定图的聚类。我们将随机游动和模块化结合起来,以精确有效地揭示图的簇。PPC是一种自顶向下的算法,因此它可以比其他主要是自下而上的近线性方法更准确地揭示图的固有簇。它还提供了在许多应用程序中有用的集群层次结构。PPC具有线性的时间和空间复杂性,在许多数据集上优于大多数可用的聚类算法。此外,其自顶向下的方法使其成为具有不同需求的集群问题的灵活解决方案。

MSC公司:

05C81号 图上的随机游动
05C85号 图形算法(图形理论方面)
60克50 独立随机变量之和;随机游走
68英里11 互联网主题
82磅41 平衡统计力学中的随机行走、随机表面、晶格动物等
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 布隆德尔医学博士。;纪尧姆,J.-L。;兰比奥特,R。;Lefebvre,E.,《大型网络中社区的快速发展》,《统计力学杂志:理论与实验》,10,P10008,(2008)·Zbl 1459.91130号
[2] 罗斯瓦尔,M。;Bergstrom,C.T.,《复杂网络上随机行走的地图揭示了社区结构》,《美国国家科学院学报》,105,4,1118-1123,(2008)
[3] 罗斯瓦尔,M。;Bergstrom,C.T.,《网络上随机漫步的多级压缩揭示了大型集成系统中的分层组织》,《公共科学图书馆·综合》,6,4,e18209,(2011)
[4] Fortunato,S.,《图形中的社区检测》,《物理报告》,486,3-5,75-174,(2010)
[5] Hagen,L。;Kahng,A.B.,有效电路聚类的新方法,(IEEE/ACM计算机辅助设计国际会议论文集,(1992),422-427
[6] Harel,D。;Koren,Y.,《关于使用随机漫步进行聚类》,(《第21届软件技术和理论计算机科学基础会议论文集》,(2001年),18-41·Zbl 1052.68120号
[7] Yen,L。;Vanvyve,D。;沃特斯,F。;福斯,F。;Verleysen,M。;Saerens,M.,使用基于随机行走的距离测量进行聚类,(第13届欧洲人工神经网络研讨会,(2005)),317-324
[8] Avrachenkov,K。;多勃雷宁,V。;涅米罗夫斯基博士。;Pham,S.K。;Smirnova,E.,基于Pagerank的超文本文档集聚类,(第31届国际ACM SIGIR信息检索研究与开发会议论文集,(2008)),873-874
[9] 阿兹兰,A。;Ghahramani,Z.,《数据驱动聚类的新方法》(第23届机器学习国际会议论文集,(2006)),57-64
[10] 安德森·R。;Chung,F。;Lang,K.,使用pagerank向量的局部图划分,(第47届IEEE计算机科学基础年度研讨会论文集,(2006)),475-486
[11] 安德森·R。;Chung,F。;Lang,K.,使用pagerank局部划分图形,互联网数学,4,1,35-64,(2007)·Zbl 1170.68302号
[12] 安德森·R。;Chung,F.,检测pagerank中的急剧下降和简化的局部划分算法,(第四届计算模型理论和应用国际会议论文集,(2007)),1-12·Zbl 1198.68091号
[13] Alamgir,M。;von Luxburg,U.,图上局部聚类的多代理随机行走,(IEEE数据挖掘国际会议论文集,(2010)),18-27
[14] Kale,S。;Seshadhri,C.,使用随机游走的maxcut组合近似算法,(数据结构与算法,(2011)),367-388
[15] Girvan,M。;Newman,M.E.J.,《社会和生物网络中的社区结构》,《国家科学院学报》,99,12,7821-7826,(2002)·Zbl 1032.91716号
[16] Sun,P.G.公司。;Yang,Y.,基于边缘中心性的社区发现方法,物理A:统计力学及其应用,392,9,1977-1988,(2013)
[17] Karp,R.M.,组合问题中的可约性,(计算机计算复杂性,(1972),Springer),85-103·Zbl 1467.68065号
[18] 李凯。;龚,X。;关,S。;Lai,C.-H.,基于邻域重叠的复杂网络社区识别高效算法,物理A:统计力学及其应用,391,41788-1796,(2012)
[19] Csermely,P.,《弱链接:从蛋白质到社交网络的复杂系统的稳定剂》(2006),施普林格
[20] 达农,L。;Daz-Guilera,A。;杜赫,J。;Arenas,A.,《比较群落结构识别》,《统计力学杂志:理论与实验》,09,P09008,(2005)
[21] 谢军。;Szymanski,B.K。;Liu,X.,SLPA:通过说话人-听众互动动态过程揭示社交网络中重叠的社区,(IEEE第十一届数据挖掘研讨会论文集,(2011)),344-349
[22] Fu,X。;刘,L。;Wang,C.,根据信念传播和冲突检测社区重叠,《物理学A:统计力学及其应用》,392,4,941-952,(2013)
[23] 埃文斯,T.S。;Lambiotte,R.,《线形图、链接分区和重叠社区》,《物理评论》E,80,1,016105,(2009)
[24] R.Lambiotte,J.C.Delvenne,M.Barahona,拉普拉斯动力学和网络中的多尺度模块结构,2009年。http://arxiv.org/abs/0812.1770。
[25] 德尔文,J.-C。;Yaliraki,S.N。;Barahona,M.,《跨时间尺度的图形社区稳定性》,《国家科学院学报》,107,29,12755-12760,(2010)
[26] L.Page,S.Brin,R.Motwani,T.Winograd,《PageRank引文排名:给网络带来秩序》,载于:技术代表,斯坦福大学数字图书馆技术项目,1998年。
[27] Haveliwala,T.H.,《主题敏感页面排名:一种用于网络搜索的上下文敏感排名算法》,IEEE知识与数据工程学报,15,4,784-796,(2003)
[28] Anderson,H.L.,Metropolis,Monte Carlo和MANIAC,洛斯阿拉莫斯科学,第14期,96-108页,(1986年)
[29] Fogaras,D。;Rcz,B。;Csalogny,K。;Sarls,T.,《朝向缩放完全个性化的页面排名:算法、下限和实验》,《互联网数学》,2,3,333-358,(2005)·Zbl 1095.68579号
[30] Henzinger,M.R。;Motwani,R。;Silverstein,C.,网络搜索引擎的挑战,SIGIR论坛,36,2,11-22,(2002)
[31] Simmel,G。;沃尔夫,K.H.,《乔治·西梅尔的社会学》,自由出版社,(1950年)
[32] Newman,M.E.J.,《网络中的模块化和社区结构》,《国家科学院学报》,103,23,8577-8582,(2006)
[33] 弗雷德曼,M.L。;Tarjan,R.E.,Fibonacci堆及其在改进网络优化算法中的应用,ACM杂志,34,3,596-615,(1987)·兹比尔1412.68048
[34] Lancichinetti,A。;福图纳托,S。;Radicchi,F.,《测试社区检测算法的基准图》,《物理评论》E,78,4,046110,(2008)
[35] Bastian,M。;海曼,S。;Jacomy,M.,Gephi:一个用于探索和操作网络浏览器的开源软件,(第三届网络日志和社交媒体国际会议论文集,(2009)),361-362
[36] Zachary,W.,小群体冲突和分裂的信息流模型,人类学研究杂志,33,4245-473,(1977)
[37] 卢梭,D。;施耐德,K。;O.J.博伊索。;Haase,P。;斯洛滕,E。;Dawson,S.M.,声音可疑的宽吻海豚群落具有很大比例的长期关联,行为生态学和社会生物学,54,4,396-405,(2003)
[38] Knuth,D.E.,《斯坦福图形库:组合计算平台》,(1993年),艾迪森·韦斯利·Zbl 0806.68121号
[39] V.Krebs,《美国政治书籍》,1988年。网址:http://www.orgnet.com(在线;2012年4月22日访问)。
[40] Newman,M.E.J.,使用矩阵的特征向量发现网络中的社区结构,《物理评论》E,74,3,036104,(2006)
[41] Adamic,洛杉矶。;Glance,N.,《政治博客圈与2004年美国大选:分裂博客》(第三届发现链接国际研讨会论文集,2005年),第36-43页
[42] 塞纳里奥斯,I。;Salwnski,L。;段晓杰。;Higney,P。;Kim,S.-M。;Eisenberg,D.,DIP,相互作用蛋白质数据库:研究蛋白质相互作用细胞网络的研究工具,核酸研究,30,1,303-305,(2002)
[43] 康奈尔KDD杯,2003年。http://www.cs.cornell.edu/projects/kddcup/(在线;2012年4月22日访问)。
[44] 哈帕尔,A。;Yang,Y。;Gopal,S。;He,D。;Yue,Z.,Citedata:一种新的用于评估个性化搜索性能的多面数据集,(第19届ACM信息与知识管理国际会议论文集,(2010)),549-558
[45] 阿尔伯特·R。;Jeong,H。;Barabasi,A.L.,《万维网的直径》,《自然》,401,130-131,(1999)
[46] Leskovec,J。;朗·K·J。;Dasgupta,A。;Mahoney,M.W.,《大型网络中的社区结构:自然集群规模和缺乏定义明确的大型集群》,互联网数学,6,1,29-123,(2009)·Zbl 1205.91144号
[47] 克劳塞特,A。;纽曼,M.E.J。;Moore,C.,《发现超大型网络中的社区结构》,《物理评论》E,70,6,066111,(2004)
[48] Pons,P。;Latapy,M.,《使用随机漫步的大型网络中的计算社区》,《图形算法与应用杂志》,10,2,191-218,(2006)·Zbl 1161.68694号
[49] Wakita,K。;Tsurumi,T.,《在大型社交网络服务中发现社区结构》(IADIS WWW/Internet国际会议论文集,(2007)),153-162
[50] Lancichinetti,A。;Fortunato,S.,《社区检测算法:比较分析》,Physical Review E,80,5,056117,(2009)
[51] Radichi,F。;卡斯特拉诺,C。;塞科尼,F。;洛雷托,V。;Parisi,D.,《定义和识别网络中的社区》,《国家科学院学报》,101,9,2658-2663,(2004)
[52] Wang,Y。;DeWitt,D.J.,分布式互联网搜索系统中的计算页面排名,(第三十届超大数据库国际会议论文集,(2004)),420-431
[53] Zhu,Y。;Ye,S。;Li,X.,基于迭代聚合-聚合方法的分布式pagerank计算,(第14届ACM信息与知识管理国际会议论文集,(2005)),578-585
[54] 石井,H。;Tempo,R.,用于pagerank计算的分布式随机算法,IEEE自动控制汇刊,55,1987-2002,(2010)·Zbl 1368.68045号
[55] Malewicz,G。;奥斯汀,M.H。;Bik,A.J。;Dehnert,J.C。;喇叭,I。;Leiser,N。;Czajkowski,G.,Pregel:大规模图形处理系统,(ACM SIGMOD国际数据管理会议论文集,(2010)),135-146
[56] 王,M。;Lim,S。;丛,J。;Sarrafzadeh,M.,《使用双分区启发式的多路径划分》,(亚洲和南太平洋设计自动化会议论文集,(2000)),667-672
[57] 赖,D。;卢,H。;Nardini,C.,《通过随机行走网络预处理增强模块化社区检测》,《物理评论》E,81,6,066118,(2010)
[58] 福图纳托,S。;Barthlemy,M.,社区检测中的分辨率极限,《美国国家科学院院刊》,104,1,36-41,(2007)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。