×

子图模式的主观趣味性。 (英语) Zbl 1392.68376号

摘要:稠密子图在更好地理解图方面的作用已经以多种方式进行了形式化,每种方式都在近似实际兴趣和计算效率之间取得了不同的平衡。进行这种权衡的一个困难是,虽然算法的计算成本相对明确,但模式的趣味性基本上是主观的。这意味着后一个方面通常只被非正式地处理或忽略,而使用某种形式的密度作为代理。我们通过将稠密子图模式对给定用户感兴趣的因素形式化来解决这一困难。不出所料,结果度量依赖于用户对图形的先前信念。为了具体起见,在本文中,我们考虑了两种情况:一种情况是用户只相信图的总体密度,另一种情况则是用户对顶点的度数有先验信念。此外,我们还说明了结果如何兴趣度测量不同于以往的建议。我们还根据提出的度量提出了有效的精确和近似算法来挖掘最感兴趣的稠密子图。有用的是,所提出的兴趣度度量和方法非常适合于迭代稠密子图发现。与大多数现有方法相反,我们的方法自然允许随后发现的模式重叠。实证评估强调了给定不同先验信念集的新兴趣度度量的特性,以及我们的方法找到其他方法无法找到的感兴趣子图的能力。

MSC公司:

68T05型 人工智能中的学习和自适应系统
05C75号 图族的结构特征
60E05型 概率分布:一般理论
62B10型 信息理论主题的统计方面
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abello,J.、Resende,M.G.C.和Sudarsky,S.(2002)。大规模准液检测。在S.Rajsbaum(编辑),拉丁语2002:理论信息学。计算机科学课堂讲稿(第2286卷,第598-612页)。柏林,海德堡:施普林格。doi:10.1007/3-540-45995-2_51·Zbl 1059.68597号
[2] Bhuiyan,M.、Mukhopadhyay,S.和Hasan,M.A.(2012年)。基于隐藏数据的交互式模式挖掘:一种基于采样的解决方案。《CIKM’12会议录》(第95-104页)。
[3] Boley,M.、Lucchese,C.、Paurat,D.和Gärtner,T.(2011年)。通过有效的两步随机过程直接进行局部模式采样。2011年8月21日至24日,第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集,第582-590页,加利福尼亚州圣地亚哥。
[4] Boley,M.、Mampaey,M.,Kang,B.、Tokmakov,P.和Wrobel,S.(2013年)。一键式挖掘:通过内隐偏好和性能学习进行交互式局部模式发现。《IDEA’13会议录》,ACM,纽约州纽约市,第27-35页。doi:10.1145/2501511.2501517。
[5] Boyd,S.和Vandenberghe,L.(2004)。凸优化。剑桥:剑桥大学出版社·Zbl 1058.90049号 ·doi:10.1017/CBO9780511804441
[6] Chernoff,H.(1952年)。基于观测值总和的假设检验的渐近效率度量。《数理统计年鉴》,23493-507·Zbl 0048.11804号 ·doi:10.1214/网址/117729330
[7] Cover,T.M.和Thomas,J.A.(2012年)。信息论要素。纽约:Wiley·Zbl 1140.94001号
[8] De Bie,T.(2011年a)。数据挖掘的信息理论框架。第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集(KDD’11)(第564-572页)。
[9] De Bie,T.(2011年b)。最大熵模型和主观兴趣:二进制数据库中瓷砖的应用程序。数据挖掘和知识发现,23(3),407-446·Zbl 1235.68065号 ·doi:10.1007/s10618-010-0209-3
[10] Dzyuba,V.和van Leeuwen,M.(2013)。交互式发现感兴趣的子组集。智能数据分析进展第十二届国际研讨会,2013年10月17日至19日,IDA。会议记录,第150-161页。英国伦敦。
[11] Dzyuba,V.、van Leeuwen,M.、Nijssen,S.和Raedt,L.D.(2014)。模式排名的交互式学习。国际人工智能工具杂志,23(6),1460026。doi:10.1142/S021821301460264·Zbl 0127.10602号
[12] Fortunato,S.和Barthelemy,M.(2007)。社区检测中的分辨率限制。《美国国家科学院院刊》,104(1),36-41·doi:10.1073/pnas.0605965104
[13] Geng,L.和Hamilton,H.J.(2006)。数据挖掘的有趣度量:一项调查。ACM计算调查,38(3),9·数字对象标识代码:10.1145/1132960.1132963
[14] Gionis,A.、Mannila,H.、Mielikäinen,T.和Tsapars,P.(2007年)。通过交换随机化评估数据挖掘结果。ACM数据知识发现事务,1(3),14·数字对象标识代码:10.1145/1297332.1297338
[15] Goethals,B.、Moens,S.和Vreeken,J.(2011年)。MIME:交互式视觉模式挖掘框架。KDD’11会议记录(第757-760页)。
[16] Goldberg,A.V.(1984)。求最大密度子图。加州伯克利:加利福尼亚大学。
[17] Hanhijarvi,S.、Ojala,M.、Vuokko,N.、Puolamäki,K.、Tatti,N.和Mannila,H.(2009年)。告诉我一些我不知道的事情:迭代数据挖掘的随机化策略。第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集(KDD’09)(第379-388页)·Zbl 1235.68065号
[18] Hasan,M.A.和Zaki,M.J.(2009年)。图形模式的输出空间采样。PVLDB,2(1),730-741。
[19] 霍夫丁(1963)。有界随机变量和的概率不等式。《美国统计协会杂志》,58(301),13-30·Zbl 0127.10602号 ·doi:10.1080/01621459.1963.10500830
[20] Kontonasios,K.N.、Spyropoulou,E.和De Bie,T.(2012年)。基于意外的知识发现兴趣度度量。Wiley跨学科评论:数据挖掘和知识发现,2(5),386-399。
[21] McGarry,K.(2005)。知识发现兴趣度的调查。《知识工程评论》,20(1),39-61·doi:10.1017/S0269888905000408
[22] Newman,M.E.和Girvan,M.(2004)。发现和评估网络中的社区结构。《物理评论》E,69(2),026113·doi:10.1103/PhysRevE.69.026113
[23] 塞德曼,S.B.(1983)。网络结构和最低程度。社交网络,5(3),269-287·doi:10.1016/0378-8733(83)90028-X
[24] Seidman,S.B.和Foster,B.L.(1978年)。集团概念的图形理论概括。《数学社会学杂志》,6(1),139-154·Zbl 0386.92015号 ·doi:10.1080/0022250X.1978.9989883
[25] Spyropoulou,E.、De Bie,T.和Boley,M.(2014)。挖掘多关系数据中有趣的模式。数据挖掘与知识发现,28(3),808-849·Zbl 1294.68073号
[26] Tsourakakis,C.E.、Bonchi,F.、Gionis,A.、Gullo,F.和Tsiarli,M.A.(2013年)。比最稠密子图更稠密:在质量保证的情况下提取最佳准流体。第19届ACM SIGKDD知识发现和数据挖掘国际会议论文集(KDD’13)(第104-112页)。
[27] Uno,T.(2010)。一种求解伪团枚举问题的有效算法。《算法》,56(1),3-16·Zbl 1187.68354号 ·doi:10.1007/s00453-008-9238-3
[28] van Leeuwen,M.(2014)。使用模式挖掘进行交互式数据探索。《生物医学信息学中的交互式知识发现和数据挖掘——现状和未来挑战》,LNCS,(第8401卷)。第169-182页)。纽约:施普林格。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。