×

异常上下文子图挖掘。 (英语) Zbl 1458.05246号

摘要:许多关系数据是由一些特征描述的几个单独行为聚合而成的。例如,自行车共享系统可以建模为一个图,其中顶点代表自行车共享站,连接代表用户从一个站到另一个站的自行车旅行。车站和出行通过其他信息进行描述,例如车站地理环境的描述(商业与居住区、与景点的距离、海拔、城市化密度等),或自行车出行的属性(时间戳、用户简介、天气、事件和其他与出行有关的特殊条件)。在该图中识别高度关联的成分(如社区或准液化物)可以提供对全球使用的有趣见解,但不能捕捉到表征子种群的流动性特征。为了解决这个问题,我们提出了一种基于异常模型挖掘的方法来发现异常上下文子图,即生成的子图从上下文或单个行为的描述来看,与整个扩展图相比,这些行为是异常的(行为方式不同)。上下文和边之间的依赖性通过(chi^2)检验进行评估,并且加权相对准确度度量仅用于保留强特征连通子图的上下文。我们提出了一种原始算法,该算法使用复杂的修剪技术来限制要考虑的顶点、上下文细化和边的搜索空间。通过对合成数据和两个真实数据集的实验评估,证明了所提出的修剪机制的有效性,以及发现的模式的相关性。

MSC公司:

05C90年 图论的应用
68T05型 人工智能中的学习和自适应系统

软件:

科利布里
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Ahmed,R.和Karypis,G.(2011年)。George算法用于挖掘动态网络中保守关系状态的演化。IEEE ICDM(第1-10页)。
[2] Atzmueller、Martin、Doerfel、Stephan和Mitzlaff,Folke。(2016年)。使用穷举子群发现的面向描述的社区检测。信息科学,329,965-984·doi:10.1016/j.ins.2015.05.008
[3] Atzmüller,M.和Puppe,F.(2006年)。Sd-map—穷举子组发现的快速算法。在PKDD中,LNCS第4213卷(第6-17页),Springer。
[4] Berlingerio,M.、Bonchi,F.、Bringmann,B.和Gionis,A.(2009年)。挖掘图形演化规则。ECML/PKDD(第115-130页)。
[5] 贝林格里奥、米歇尔、科西娅、米歇尔、吉安诺蒂、福斯卡、蒙雷亚尔、安娜和佩德雷希·迪诺。(2013). 多维网络:结构分析基础。万维网,16(5-6),567-593·doi:10.1007/s11280-012-0190-4
[6] Besson,J.、Robardet,C.和Boulicaut,J.(2006)挖掘一种新的容错模式类型,作为正式概念发现的替代。在Schärfe,H.,Hitzler,P.&Øhrström,P.(eds.),概念结构:灵感与应用,第14届概念结构国际会议论文集,2006年7月16日至21日,丹麦奥尔堡,2006年,计算机科学讲义4068卷,(第144-157页),斯普林格·Zbl 1194.68219号
[7] Boden,B.、Günnemann,S.、Hoffmann,H.和Seidl,T.(2012)。在带有边缘标签的多层图中挖掘相干子图。KDD(第1258-1266页)。
[8] Bonchi,F.、Gionis,A.、Gullo,F.和Ukkonen,A.(2012年)。色彩相关聚类。KDD(第1321-1329页)。
[9] Borgwardt,K.M.、Kriegel,H.P.和Wackersreuther,P.(2006)《频繁动态子图中的模式挖掘》。IEEE ICDM(第818-822页)。
[10] 布林曼(Bringmann)、比约恩(Björn)、贝林格里奥(Berlingerio)、米歇尔(Michele)、邦奇(Bonchi)、弗朗西斯科(Francesco)和乔尼斯(Gionis)、阿里斯蒂德斯(Aristides)。(2010). 学习和预测社交网络的演变。IEEE智能系统,25(4),26-35·doi:10.1109/MIS.2010.91
[11] Das、Mahashweta、Amer Yahia、Sihem、Das、Gautam和Cong、Yu。(2011). MRI:合作评级的有意义解释。VLDB捐赠会议记录,4(11),1063-1074。
[12] Das、Mahashweta、Thirumuruganathan、Saravanan、Amer-Yahia、Sihem、Das、Gautam和Cong,Yu。(2014). 用于分析协作标记的表达框架和高效算法。VLDB杂志,23(2),201-226·doi:10.1007/s00778-013-0341-y
[13] de Melo,P.O.S.V.、Faloutsos,C.和Loureiro,A.A.F.(2011)。大型通信网络中的人体动力学。在SDM(第968-879页)中,SIAM。
[14] Desmier,E.、Plantevit,M.、Robardet,C.和Boulicaut,J.F.(2013)。动态属性图中的趋势挖掘。ECML/PKDD(第654-669页)。
[15] Duivesteijn,W.(2014)。异常模型挖掘的简短调查:探索多个目标之间的异常交互。2014年多目标预测国际研讨会。
[16] Duivesteijn,Wouter,Feelders,Ad,&Knobbe,Arno J.(2016)。异常模型挖掘-具有复杂目标概念的受监督描述性局部模式挖掘。数据挖掘和知识发现,30(1),47-98·Zbl 1411.68096号 ·文件编号:10.1007/s10618-015-0403-4
[17] Duivesteijn,W.、Knobbe,A.、Feelders,A.和van Leeuwen,M.(2010年)。子组发现符合贝叶斯网络——一种特殊的模型挖掘方法。在Geoffrey I.W.、Bing L.、Chengqi Z.、Dimitrios G.和Xidong W.(编辑),ICDM 2010,第十届IEEE国际数据挖掘会议,澳大利亚悉尼,2010年12月14日至17日(第158-167页),IEEE计算机学会。
[18] Michelle Girvan和Mark E.J.Newman(2002年)。社会和生物网络中的社区结构。《美国国家科学院院刊》,99(12),7821-7826·Zbl 1032.91716号 ·doi:10.1073/pnas.122653799
[19] Goyal、Amit、Bonchi、Francesco、Lakshmanan、Laks V。S.和Venkatasubramanian,Suresh。(2013). 最小化在社交网络上传播影响力的预算和时间。社会网络分析与挖掘,3(2),179-192·doi:10.1007/s13278-012-0062-z
[20] Günnemann,S.、Färber,I.、Boden,B.和Seidl,T.(2010年)。子空间聚类满足稠密子图挖掘。在ICDM中(第845-850页)。
[21] Hamon,R.(2015)。使用信号处理方法分析时间网络:应用于里昂的自行车共享系统。里昂-恩州-里昂正常高等教育:论文。
[22] Inokuchi,A.和Washio,T.(2010年)。挖掘由顶点诱导的频繁图序列模式。在SDM(第466-477页)中,SIAM。
[23] Jiang,M.,Cui,P.,Liu,R.,Yang,Q.,Wang,F.,Zhu,W.,&Yang,S.(2012)。社会背景建议。在CIKM中,(第45-54页)。
[24] Kaytoue,M.、Pitarch,Y.、Plantevit,M.和Robardet,C.(2014)。动态图中拓扑变化的触发模式。2014年IEEE/ACM社会网络分析和挖掘进展国际会议,2014年ASONAM,中国北京,2014年8月17日至20日,第(158-165)页。
[25] Kaytoue,M.、Silva,A.、Cerf,L.、Meira Jr.,W.和Raïssi,C.(2012年)。看我打球,我是职业球员。在WWW(Comp.Vol.)第(1181-1188)页,ACM。
[26] Khan,A.、Yan,X.和Wu,K.L.(2010年)。面向大型图中的邻近模式挖掘。在SIGMOD第(867-878)页,ACM。
[27] Lahiri,M.和Berger-Wolf,T.Y.(2008)。挖掘动态社交网络中的周期性行为。IEEE ICDM第(373-382)页。
[28] Lavrac、Nada、Kavsek、Branko、Flach、Peter A.和Todorovski、Ljupco。(2004). CN2-SD的子组发现。机器学习研究杂志,5,153-188。
[29] Leman,D.、Feelders,A.和Knobbe,A.J.(2008年)。异常的模型挖掘。ECML/PKDD(第1-16页)·Zbl 1231.68206号
[30] Lemmerich,F.、Becker,M.和Atzmueller,M.(2012)。用于穷举异常模型挖掘的通用模式树。In Flach,P.A.,De Bie,T,&Cristianini,N.(编辑),《数据库中的机器学习和知识发现——欧洲会议》,ECML PKDD 2012,英国布里斯托尔,2012年9月24-28日。《计算机科学讲稿》(第277-292页)第7524卷第二部分会议记录,斯普林格出版社。
[31] Madeira,S.C.和Oliveira,A.L.(2004)。生物数据分析的双聚类算法:综述。IEEE/ACM计算生物学和生物信息学汇刊,1(1),24-45·doi:10.1109/TCBB.2004.2
[32] Morishita,S.和Sese,J.(2000)。使用统计度量修剪遍历项集格。PODS中。
[33] Moser,F.、Colak,R.、Rafiey,A.和Ester,M.(2009年)。利用特征向量从图中挖掘内聚模式。在SDM(第593-604页)中,SIAM。
[34] Mougel,P.N.、Rigotti,C.、Plantevit,M.和Gandrillon,O.(2013)。寻找最大齐次团集。知识和信息系统,第1-30页。
[35] Novak、Petra Kralj、Lavrać、Nada和Webb,Geoffrey I.(2009年)。监督描述性规则发现:对比集、新兴模式和子组挖掘的统一调查。机器学习研究杂志,10377-403·Zbl 1235.68178号
[36] Ontanón,S.、Synnaeve,G.、Uriarte,A.、Richoux,F.、Churchill,D.和Preuss,M.(2013)。《星际争霸》实时战略游戏AI研究与竞争调查。IEEE游戏中的计算智能和人工智能汇刊,5(4),293-311·doi:10.1109/TCIAIG.2013.286295
[37] 卡尔·皮尔逊。(1900). 基于这样一个准则,即在相关变量系统的情况下,给定的偏离概率系统可以合理地假设是由随机抽样引起的。伦敦、爱丁堡和都柏林哲学杂志和科学杂志,50(302),157-175·网址:10.1080/14786440009463897
[38] 普拉多(Prado)、阿德里亚娜(Adriana)、朱迪(Jeudy)、巴普蒂斯特(Baptiste)、弗罗蒙特(Fromont)、埃莉莎(Ellisa)和迪奥特(Diot)、法比恩(Fabien)。(2013). 在动态平面图中挖掘时空模式。智能数据分析,17(1),71-92。
[39] 普拉多(Prado)、阿德里亚纳(Adriana)、普兰提维特(Plantevit)、马克(Marc)、罗伯德(Robardet)、塞琳(Celine)和布利卡特(Boulicaut)、珍妮·弗兰索瓦(Jean-François)。(2013). 挖掘图形拓扑模式:发现顶点描述符之间的共同变化。IEEE知识与数据工程汇刊,99,1。
[40] 齐、郭军、阿加瓦尔、查鲁·C、田、齐、吉、恒和黄、托马斯·S(2012)。探索社交媒体中的上下文和内容链接:一种潜在空间方法。IEEE模式分析和机器智能汇刊,34(5),850-862·doi:10.1109/TPAMI.2011.191
[41] Robardet,C.(2009)。动态图中基于约束的模式挖掘。IEEE ICDM(第950-955页)。
[42] Schubert,M.和Drachen,A.(2016年)。通过遭遇检测进行Esports分析。麻省理工学院斯隆体育分析会议论文集,2016年。
[43] Sese,J.、Seki,M.和Fukuzaki,M..(2010年)。使用共享项挖掘网络。在CIKM(第1681-1684页)中,ACM。
[44] Silva、Arlei、Meira、Wagner和Zaki,Mohammed J.(2012)。挖掘大型属性图中的属性-结构相关模式。VLDB捐赠会议记录,5(5),466-477·doi:10.14778/2140436.2140443
[45] Soulet,A.、Raíssi,C.、Plantevit,M.和Crémilleux,B.(2011年)。挖掘天空中的主要图案。2011年12月11日至14日,加拿大不列颠哥伦比亚省温哥华市,第11届IEEE国际数据挖掘会议,ICDM 2011(第655-664页)。
[46] 孙一舟、韩嘉伟。(2012). 挖掘异构信息网络:原理和方法。圣拉斐尔:摩根&克莱普尔出版社。
[47] T·泰勒。L.(2012)。提高赌注:电子竞技和计算机游戏的职业化。剑桥:麻省理工学院出版社。
[48] Tong,H.、Papadimitriou,S.、Sun,J.、Yu,P.S.和Faloutsos,C.(2008)。Colibri:快速挖掘大型静态和动态图形。KDD(第686-694页)。
[49] 马蒂杰斯·范·列文。(2010). 最大异常,最少描述。数据挖掘和知识发现,21(2),259-276·doi:10.1007/s10618-010-0187-5
[50] van Leeuwen,Matthijs,&Knobbe,Arno J.(2012)。不同的子组集发现。数据挖掘和知识发现,25(2),208-242·doi:10.1007/s10618-012-0273-y
[51] Von Eschen,A.(2014)。职责召唤中的机器学习和数据挖掘(受邀演讲)。在ECML/PKDD中。
[52] Yang,Y.、Yu,J.X.、Gao,H.、Pei,J.和Li,J.(2013)。挖掘演化图中变化最频繁的组件。万维网,第1-26页。
[53] You,Chang Hun,Holder,Lawrence B&Cook,Diane J.(2009)《生物网络动力学中的学习模式》。在KDD中,第977-986页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。