×

具有记忆效应的核谱聚类。 (英语) Zbl 1395.62160号

摘要:进化图描述了许多随时间变化的自然现象,如社会关系、贸易市场、代谢网络等。在此框架中,执行社区检测和分析集群进化是一项关键任务。为此,我们提出了一个新的模型,其中随着时间的推移,聚类结果的平滑度可以被视为有效的先验知识。它基于最小二乘支持向量机(LS-SVM)典型的约束优化公式,其中目标函数设计为显式包含时间平滑。后者允许模型很好地聚类当前数据,并与最近的历史保持一致。我们还提出了新的模型选择准则,以便仔细选择模型的超参数,这是实现良好性能的关键问题。我们在四个玩具问题和一个真实世界的网络上成功地测试了该模型。我们还将我们的模型与进化谱聚类进行了比较,进化谱聚类是一种最先进的进化网络社区检测算法,表明具有记忆效应的核谱聚类可以获得更好或同等的性能。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 穆查,P.J。;理查德森,T。;梅肯,K。;波特,医学硕士。;Onnela,J.-P.,《时间相关、多尺度和多重网络中的社区结构》,《科学》,328,5980,876-878,(2010)·Zbl 1226.91056号
[2] 林,Y.-R。;Chi,Y。;朱,S。;Sundaram,H。;Tseng,B.L.,《分析动态社交网络中的社区及其演变》,ACM数据知识发现汇刊,3,2,(2009)
[3] Bóta,A。;Krész,M。;Pluhár,A.,《动态社区及其检测》,《控制论学报》,第20卷,第1期,第35-52页,(2011年)·Zbl 1240.91130号
[4] Asur,S。;Parthasarathy,S。;Ucar,D.,《描述交互图进化行为的基于事件的框架》,《ACM从数据中发现知识的事务》,3,4,16:1-6:36,(2009)
[5] 帕拉,G。;lszl Barabsi,A。;Vicsek,T。;匈牙利,B.,《量化社会群体进化》,《自然》,44664-667,(2007)
[6] Chi Y.Chi,X.Song,D.Zhou,K.Hino,B.L.Tseng,结合时间平滑度的进化谱聚类,收录于:KDD,2007年,第153-162页。
[7] 查克拉巴蒂,D。;库马尔,R。;Tomkins,A.,进化聚类,(第十二届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’06,(2006),美国纽约州纽约市ACM),554-560
[8] 阿尔扎特,C。;Suykens,J.A.K.,《通过加权核PCA进行样本外扩展的多路谱聚类》,IEEE模式分析和机器智能汇刊,32,2,335-347,(2010)
[9] 迪尔隆,I。;关,Y。;Kulis,B.,《无特征向量加权图切割——多级方法》,IEEE模式分析与机器智能学报,29,111944-1957,(2007)
[10] Chung,F.R.K.,谱图理论,(1997),美国数学学会·Zbl 0867.05046号
[11] von Luxburg,U.,《光谱聚类、统计和计算教程》,17,4,395-416,(2007)
[12] Ng,A.Y。;M.I.乔丹。;Weiss,Y.,《关于谱聚类:分析和算法》,(Dietterich,T.G.;Becker,S.;Ghahramani,Z.,《神经信息处理系统的进展》14,(2002),麻省理工学院出版社,马萨诸塞州坎布里奇),849-856
[13] 哈尔基迪,M。;巴蒂斯塔基斯,Y。;Vazirgiannis,M.,《集群验证技术》,《智能信息系统杂志》,第17期,第107-145页,(2001年)·Zbl 0998.68154号
[14] Newman,M.E.J.,《网络中的模块性和社区结构》,《美国国家科学院院刊》
[15] 吉梅拉,R。;Sales-Pardo,M。;Amaral,L.,《随机图和复杂网络波动的模块性》,《物理评论》E,70,2,025101,(2004)
[16] 休伯特,L。;Arabie,P.,比较分区,分类杂志,1,2,193-218,(1985)
[17] 斯特雷尔,A。;Ghosh,J.,《集群集成——用于组合多个分区的知识重用框架》,《机器学习研究杂志》,3583-617,(2002)·Zbl 1084.68759号
[18] R.Langone,C.Alzate,J.A.K.Suykens,《基于模块的核谱聚类模型选择》,摘自:Proc。国际神经网络联合会议,IJCNN 2011年,2011年,第1849-1856页。
[19] C.Alzate,J.A.K.Suykens,核谱聚类中的样本外特征向量,in:Proc。国际神经网络联合会议,IJCNN 2011年,2011年,第2349-2356页。
[20] Greene,D。;Doyle,D。;坎宁安,P.,《追踪动态社会网络中社区的演变》,(2010年社会网络分析和挖掘进展国际会议论文集,ASONAM’10,(2010),IEEE计算机学会,美国华盛顿特区),176-183
[21] Eagle,N。;宾夕法尼亚州彭特兰。;Lazer,D.,《利用手机数据推断社交网络结构》,《美国国家科学院院刊》,106,115274-15278,(2009)
[22] Y.Kang,S.Choi,《社区检测的核心PCA》,载于:2009年商业智能会议。
[23] Sun,J。;Faloutsos,C。;Papadimitriou,S。;Yu,P.S.,Graphscope:大型时间演化图的无参数挖掘,(第13届ACM SIGKDD国际知识发现和数据挖掘会议论文集,KDD’07,(2007),美国纽约州纽约市ACM),687-696
[24] 很好,B。;蒙乔伊,Y.D。;Clauset,A.,《模块化最大化在实际环境中的表现》,《物理评论》E,81,4,046106,(2010)
[25] 福图纳托,S。;Barthlemy,M.,《社区检测中的分辨率限制》,《美国国家科学院院刊》,104,1,36-41,(2007)
[26] 布隆德尔,V.D。;纪尧姆,J.-L。;兰比奥特,R。;Lefebvre,E.,《大型网络中社区的快速发展》,《统计力学杂志:理论与实验》,2008,10,P10008,(2008)·Zbl 1459.91130号
[27] 克劳塞特,A。;纽曼,M.E.J。;Moore,C.,《发现超大型网络中的社区结构》,《物理评论》E,1-6,(2004)
[28] 阿里纳斯,A。;Fernndez,A。;Gmez,S.,《不同分辨率下复杂网络结构的分析》,《新物理杂志》,10,5,053039,(2008)
[29] Lancichinetti,A。;Fortunato,S.,社区检测中模块化最大化的极限,物理评论E,84066122,(2011)
[30] R.Kannan、S.Vempala、A.Vetta,《集群:好、坏和光谱》,2000年·Zbl 1192.05160号
[31] Leskovec,J。;朗·K·J。;Mahoney,M.,网络社区检测算法的实证比较,(第19届万维网国际会议论文集,WWW’10,(2010),美国纽约州纽约市ACM),631-640
[32] Higham,N.J.,《数值算法的准确性和稳定性》(1996),美国宾夕法尼亚州费城工业和应用数学学会·Zbl 0847.65010号
[33] 苏肯斯,J.A.K。;Van Gestel,T。;De Brabanter,J。;De Moor,B。;Vandewalle,J.,最小二乘支持向量机,(2002),新加坡世界科学出版社·Zbl 1017.93004号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。