×

基于集合的无损图形摘要近似方法。 (英语) Zbl 1347.68370号

摘要:图形摘要是分析各种现实生活现象的有价值的方法,如社区、有影响力的节点和大图形中的信息流。为了总结图形,将具有相似邻居的节点合并为超级节点,并将其相应的边压缩为超级边。现有的方法要么通过节点排序找到相似节点,要么进行两两相似性计算。逐节点压缩排序方法具有可伸缩性,但由于其对应项的详尽相似性计算,因此提供的压缩量较小。在本文中,我们提出了一种新的基于集合的摘要方法,该方法可以直接摘要图中自然出现的相似节点集。我们的方法是可扩展的,因为我们避免了在每次迭代中使用非相似节点和合并节点集进行显式相似性计算。类似地,我们提供了良好的压缩比,因为每个集合都由高度相似的节点组成。为了定位相似节点集,我们使用局部敏感散列来寻找相似节点的候选集。然而,每个候选集的成员节点之间具有不同的相似性。因此,我们提出了一种基于候选节点之间相似度的启发式算法,以及一种无参数剪枝技术,以有效地从候选节点中识别高度相似的节点子集。通过对真实世界图的实验,我们的方法比成对图摘要需要更少的执行时间,在包含具有高度多样性邻域的节点的图中具有一个数量级的裕度,并且以类似的精度生成摘要。类似地,我们观察到与逐节点压缩排序方法相比具有可比性,同时提供了更好的压缩比。

MSC公司:

68周25 近似算法
05C07号机组 顶点度数
05C85号 图形算法(图形理论方面)
68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Boldi P,Vigna S(2004)网络图框架i:压缩技术。摘自:第13届万维网国际会议记录,ACM,第595-602页
[2] Broder AZ(1997)关于文件的相似性和包容性。1997年:《序列压缩与复杂性学报》。IEEE,第21-29页
[3] Butter D(2004)文档结构相似性算法的简短调查。In:互联网计算国际会议,第3-9页
[4] Chen C,Yan X,Zhu F,Han J,Yu PS(2008)图形olap:走向图形的在线分析处理。2008年第八届IEEE数据挖掘国际会议。ICDM’08,IEEE,第103-112页
[5] Chierichetti F、Kumar R、Lattanzi S、Mitzenmacher M、Panconesi A、Raghavan P(2009)《压缩社交网络》。摘自:第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集,ACM,第219-228页
[6] Chum O,Philbin J,Isard M,Zisserman A(2007),可缩放近相同图像和镜头检测。摘自:第六届ACM图像和视频检索国际会议论文集,ACM,第549-556页
[7] Ghazizadeh S,Chawathe SS(2002)Seus:使用摘要提取结构。在:发现科学。柏林施普林格,第71-85页·Zbl 1024.68555号
[8] Gorisse D,Cord M,Precioso F(2012),chi2距离的局部敏感散列。IEEE Trans-Pattern Ana Mach Intell 34(2):402-409·doi:10.1109/TPAMI.2011.193
[9] Hernández C,Navarro G(2013)网络和社交图的压缩表示。内容:知识和信息系统,第1-35页
[10] Hjaltason GR,Samet H(2003)度量空间中的索引驱动相似性搜索(调查文章)。ACM Trans数据库系统(TODS)28(4):517-580·数字对象标识代码:10.1145/958942.958948
[11] Indyk P,Motwani R(1998)《近似最近邻:消除维度诅咒》。摘自:第三十届ACM计算理论年会论文集,ACM,第604-613页·Zbl 1029.68541号
[12] Kang U,Faloutsos C(2011)《超越“穴居人社区”:图形压缩和挖掘的中心和辐条》。2011年IEEE第11届数据挖掘国际会议(ICDM),IEEE,第300-309页
[13] Ketkar NS、Holder LB、Cook DJ(2005)《征服:图形数据中基于压缩的频繁模式发现》。在:第一届开源数据挖掘国际研讨会论文集:频繁模式挖掘实现,ACM,第71-76页
[14] Koutra D,Kang U,Vreeken J,Faloutsos C(2014)VOG:总结和理解大图形。2014年4月24日至26日,美国宾夕法尼亚州费城,2014年SIAM数据挖掘国际会议记录,第91-99页。doi:10.1137/1.9781611973440.11·Zbl 07260433号
[15] LeFevre,K。;Terzi,E.,Grass:图形结构摘要,454-465(2010),俄亥俄州
[16] 刘S,陈立,倪林,樊J(2011)Cim:范畴影响最大化。摘自:第五届普适信息管理和通信国际会议记录,ACM,第124页
[17] Liu S,Wang S,Zhu F,Zhang J,Krishnan R(2014)Hydra:通过异质行为建模的大规模社会身份联系。摘自:2014年ACM SIGMOD国际数据管理会议记录,ACM,第51-62页
[18] Macropol K,Singh A(2010)大型图上最佳簇的可缩放发现。程序VLDB捐赠3(1-2):693-702·数字对象标识代码:10.14778/1920841.1920930
[19] Mu Y,Yan S(2010)非度量位置敏感散列。输入:AAAI
[20] Nanopoulos A,Manolopoulos Y(2002)《市场篮子数据的有效相似性搜索》。VLDB J 11(2):138-152·doi:10.1007/s00778-002-0068-7
[21] Navlakha S、Rastogi R、Shrivastava N(2008)《有界误差的图形摘要》。摘自:2008年ACM SIGMOD国际数据管理会议记录,ACM,第419-432页
[22] 瞿Q,朱峰,闫X,韩J,菲利普SY,李H(2011)信息网络上的高效拓扑olap。In:高级应用程序的数据库系统。柏林施普林格,第389-403页
[23] Qu Q,Liu S,Jensen CS,Zhu F,Faloutsos C(2014)动态网络中有趣驱动的扩散过程概述。领域:数据库中的机器学习和知识发现。柏林施普林格,第597-613页
[24] Rajaraman A,Ullman JD(2011)《海量数据集的挖掘》。剑桥大学出版社
[25] Rissanen J(1978)《最短数据描述建模》。自动化14(5):465-471·Zbl 0418.93079号 ·doi:10.1016/0005-1098(78)90005-5
[26] Song J,Yang Y,Yang Y,Huang Z,Shen HT(2013)《异构数据源大规模检索的中间层哈希法》。摘自:2013年ACM SIGMOD数据管理国际会议记录,ACM,第785-796页
[27] Tian Y,Hankins RA,Patel JM(2008)《图形摘要的高效聚合》。摘自:2008年ACM SIGMOD国际数据管理会议记录,ACM,第567-580页
[28] Toivonen H,Zhou F,Hartikainen A,Hinkka A(2011)加权图的压缩。在:第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集,ACM,第965-973页
[29] Tomar VS,Rose RC(2013)使用局部敏感散列进行语音识别的高效流形学习。2013年:IEEE声学、语音和信号处理国际会议(ICASSP),IEEE,第6995-6999页
[30] 王杰,沈浩特,宋杰,纪杰(2014)相似性搜索哈希:一项调查。arXiv:1408.2927
[31] Xiong Y,Zhu Y,Yu P(2014)异构信息网络中的Top-k相似性加入。收录:IEEE Trans Knowledge Data Eng,PP(99),1。doi:10.1109/TKDE.2014.2373385
[32] 严X,韩J(2002)gspan:基于图的子结构模式挖掘。2002年IEEE数据挖掘国际会议,2002年。ICDM 2003。IEEE会议记录,第721-724页
[33] 闫X,朱凤,于PS,韩J(2006)图结构中基于特征的相似性搜索。ACM事务数据库系统(TODS)31(4):1418-1453·doi:10.1145/1189769.1189777
[34] Yin M,Wu B,Zeng Z(2012)Hmgraph olap:多维异构网络分析的新框架。摘自:第十五届数据仓库和OLAP国际研讨会论文集,ACM,第137-144页
[35] 赵鹏,李旭,辛德,韩杰(2011)《图形立方体:关于仓储和olap多维网络的研究》。摘自:2011年ACM SIGMOD国际数据管理会议记录,ACM,第853-864页
[36] Zhu F,Zhang Z,Qu Q(2013)高效约束图模式发现的直接挖掘方法。摘自:2013年ACM SIGMOD国际数据管理会议记录,ACM,第821-832页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。