×

链路预测和伪链路消除的网络相似性的综合比较。 (英语) Zbl 1514.62126号

摘要:识别复杂网络中缺失的交互,即链路预测,是通过根据观察到的链路和节点属性估计两个节点之间存在链路的可能性来实现的。类似的方法也被用于识别和删除网络中的虚假链接,这对于提高网络数据的可靠性至关重要。在网络科学中,两个节点具有连接的可能性很大程度上取决于它们的结构相似性。因此,解决这两个问题的关键是如何客观地度量网络中节点之间的相似性。在文献中,提出了许多网络相似性度量,并且在以前的工作中独立讨论了它们的准确性。在本文中,我们系统地比较了当观测到的网络非常稀疏或包含不准确的链接信息时,18个相似性度量在链接预测和伪链接消除方面的准确性。有趣的是,一些方法具有较高的预测精度,它们在识别虚假交互时往往表现出较低的精度。我们进一步发现,可以根据方法的行为将其分为几个簇。这项工作有助于指导将来将这些相似性度量用于不同目的。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
05C82号 小世界图形、复杂网络(图形理论方面)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Dorogovtsev,S.N。;Mendes,J.F.,《网络进化》,高级物理学。,51, 4, 1079-1187 (2002)
[2] 博卡莱蒂,S。;拉托拉,V。;莫雷诺,Y。;查韦斯,M。;Hwang,D.U.,《复杂网络:结构与动力学》,Phys。众议员,424,4,175-308(2006)·Zbl 1371.82002号
[3] 科斯塔,L.D.F。;罗德里格斯,F.A。;Travieso,G。;Villas Boas,P.R.,《复杂网络的表征:测量调查》,高级物理学。,56, 1, 167-242 (2007)
[4] Getoor,L.公司。;Diehl,C.P.,《链接挖掘:调查》,ACM Sigkdd Explor。新闻。,7, 2, 3-12 (2005)
[5] Barabási,A.L.,《网络收购》,Nat.Phys。,8, 1, 14-16 (2012)
[6] M.Kitsak、L.K.Gallos、S.Havlin、F.Liljeros、L.Muchnik、H.E.Stanley、H.A.Makse,《复杂网络中有影响力传播者的识别》,2010年,arXiv预印本arXiv:1001.5285。
[7] Gualdi,S。;梅多,M。;Zhang,Y.C.,有向非循环图中的影响、独创性和相似性,Europhys。莱特。,96, 1, 18004 (2011)
[8] 托马斯·S·M。;Beierkuhnlein,C.,《从多学科方法和方向预测外热病媒介传播途径》,Naturwissenschaften,100,5,395-405(2013)
[9] 五十、 法律。;Zhou,T.,《复杂网络中的链接预测:一项调查》,Physica A,390,6,1150-1170(2011)
[10] D.Lin,“相似性的信息理论定义”,载于《第15届机器学习国际会议论文集》,1998年第98卷,第296-304页。
[11] 林登,G。;B.史密斯。;York,J.,Amazon.com推荐:项对项协作过滤,IEEE互联网计算。,7, 1, 76-80 (2003)
[12] Herrgrd,M.J。;北斯温斯顿。;Dobson,P.,《从系统生物学社区方法获得的共识酵母代谢网络重建》,《自然生物技术》。,26, 10, 1155 (2008)
[13] Radichi,F。;卡斯特拉诺,C。;塞科尼,F。;洛雷托,V。;Parisi,D.,《定义和识别网络中的社区》,Proc。国家。阿卡德。科学。美国,101,9,2658-2663(2004)
[14] 五十、 法律。;Jin,C.H。;Zhou,T.,基于局部路径的复杂网络链路预测相似性指数,Phys。修订版E,80,4046122(2009)
[15] 刘,Z。;张庆明。;五十、 法律。;Zhou,T.,《复杂网络中的链接预测:局部朴素贝叶斯模型》,Europhys。莱特。,96, 4, 48007 (2011)
[16] 张,P。;曾,A。;Fan,Y.,通过二部网络上的双向扩散识别缺失和虚假连接,Phys。莱特。A、 378、32、2350-2354(2014)·兹比尔1303.60072
[17] 吉米拉,R。;Sales-Pardo,M.,《缺失和虚假交互以及复杂网络的重建》,Proc。国家。阿卡德。科学。,106, 52, 22073-22078 (2009)
[18] 曾,A。;Cimini,G.,《消除复杂网络中的虚假交互》,Phys。E版,85、3、036101(2012)
[19] 王毅、朱骏,《第20届ACM超文本和超媒体会议论文集》,2009年。
[20] Kim博士。;Noh,J.D。;Jeong,H.,《无标度树:复杂网络的骨架》,Phys。版本E,70,4,046126(2004)
[21] Hanley,J.A。;McNeil,B.J.,接收器工作特性(ROC)曲线下面积的含义和使用,放射学,143,1,29-36(1982)
[22] S.Gerard,J.M.Michael,《现代信息检索导论》,1983年·Zbl 0523.68084号
[23] Jaccard,P.,《公牛阿尔卑斯山和侏罗纪植物区系分布比较》。Vaudoise科学社。《Nat.》,第37卷,第547-579页(1901年)
[24] Sørensen,T.,植物社会学中基于物种含量相似性建立等幅群的方法及其在丹麦公地植被分析中的应用,生物学。Skr.,5,1(1948)
[25] Ravasz,E。;Somera,A.L。;Mongru,D.A。;Oltvai,Z.N。;Barabási,A.L.,代谢网络中模块性的层次组织,科学。,297, 1551-1555 (2002)
[26] Leicht,E.A。;霍尔姆,P。;Newman,M.E.J.,网络中的顶点相似性,物理学。版本E,73,026120(2006)
[27] Adamic,洛杉矶。;Adar,E.,《网络上的朋友和邻居》,Soc.Netw。,25, 3, 211-230 (2003)
[28] 周,T。;五十、 法律。;Zhang,Y.C.,《通过本地信息预测缺失链接》,《欧洲物理杂志》。J.B,71,4,623-630(2009)·Zbl 1188.05143号
[29] 欧,Q。;Jin,Y.D.博士。;周,T。;Wang,B.H。;Yin,B.Q.,加权网络上资源分配动态的幂律强度-度相关性,Phys。版本E,75,2,021102(2007)
[30] Katz,L.,《社会计量分析得出的新地位指数》,《心理测量学》,第18、1、39-43页(1953年)·Zbl 0053.27606号
[31] Chebotarev,P。;沙米斯,E.V.,《矩阵森林定理和小社会群体中的测量关系》,Autom。遥控,581505(1997)·Zbl 0920.92042号
[32] 福斯,F。;Yen,L。;Pilotte,A。;Saerens,M.,《协作推荐任务中图核的实验研究》,(第六届数据挖掘国际会议论文集(2006),IEEE出版社:IEEE出版社,华盛顿特区,美国),863-868
[33] 刘伟。;五十、 L.,基于局部随机游走的链路预测,Europhys。莱特。,89, 5, 58007 (2010)
[34] L.A.Adamic,N.Glance,《政治博客圈与2004年美国大选:分裂他们的博客》,载于:第三届链接发现国际研讨会论文集,美国纽约州纽约市,2005年,第3643页。
[35] Jeong,H。;Tombor,B。;阿尔伯特·R。;Oltvai,Z.N。;Barabási,A.L.,《代谢网络的大规模组织》,《自然》,407651654(2000)
[36] Newman,M.E.,《使用矩阵特征向量发现网络中的社区结构》,Phys。版本E,74,3,036104(2006)
[37] Watts,D.J。;Strogatz,S.H.,《小世界网络的集体动力学》,《自然》,393440(1998)·Zbl 1368.05139号
[38] 吉梅拉,R。;达农,L。;Diaz-Guilera,A。;Giralt,F。;Arenas,A.,《人类互动网络中的自相似社区结构》,Phys。修订版E,68,6065103(2003)
[39] 加文,A.C。;博什,M。;克劳斯,R。;格兰迪,P。;Marzioch,M。;Bauer,A.,《通过蛋白质复合物的系统分析实现酵母蛋白质组的功能组织》,《自然》,4156868141-147(2002)
[40] 纽曼,M.E。;Girvan,M.,《发现和评估网络中的社区结构》,Phys。E版,69,026113(2004)
[41] 格雷瑟,P.M。;Danon,L.,《爵士乐中的社区结构》,高级复杂系统。,6, 04, 565-573 (2003)
[42] Kendall,M.G.,《等级相关方法》,第2卷(1955年),查尔斯·格里芬和公司:查尔斯·格林和伦敦公司·Zbl 0066.38203号
[43] 张,P。;王,X。;Wang,F。;曾,A。;肖,J.,测量噪声环境下链接预测算法的鲁棒性,科学。代表,6(2016)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。