×

所有参数状态下的图形聚类。 (英语) Zbl 07559410号

Esparza,Javier(ed.)等人,第45届计算机科学数学基础国际研讨会,MFCS 2020,2020年8月25日至26日,捷克共和国布拉格。诉讼程序。Wadern:达格斯图尔宫——莱布尼茨Zentrum für Informatik。LIPIcs–莱布尼茨国际程序。通知。170,第39条,第15页(2020年)。
摘要:图聚类中的分辨率参数控制通过求解参数目标函数而形成的簇的大小和结构。通常有多种有意义的方法来对图形进行聚类,并且针对不同的分辨率参数求解相同的目标函数会产生不同粒度级别的聚类,每种聚类都可能有意义,具体取决于应用程序。在本文中,我们解决了有效求解分辨率参数的所有值的参数化图聚类目标的任务。具体来说,我们考虑一个新的分析友好型目标,我们称之为LambdaPrime,它涉及一个参数\(lambda\ in(0,1)\)。LambdaPrime是LambdaCC的改编版,它是相关聚类(最小化)问题的重要实例家族。事实上,LambdaPrime和LambdaCC与其他参数化集群问题密切相关,例如模块化的参数化推广。它们捕获了一些特定的集群问题作为特殊情况,包括稀疏切割和集群删除。虽然先前的工作提供了分辨率参数的单个值的近似结果,但我们在多项式时间内为\(\lambda\)的所有值寻求一组近似最优的聚类。
更具体地说,我们证明了当一个图有(m)条边和(n)个节点时,存在一组最多(m)个聚类,这样,对于(0,1)中的每一个λ,族都包含LambdaPrime目标的最优解。这个界限在星形图上很紧。通过求解LambdaPrime在(O(log n))(lambda)值处的参数线性规划(LP)松弛,并使用现有近似算法对每个LP解进行四舍五入,我们得到了一类(O(log n)聚类。我们证明了这是渐近紧的:对于一类环图,对于(lambda)的所有值,(Omega(logn))的可行解都需要为LambdaPrime LP松弛提供一个常数近似。为了最小化聚类族的大小,我们进一步提出了一种算法,该算法可以生成一系列大小不超过最小LP-近似族两倍的解。
关于整个系列,请参见[Zbl 1445.68013号].

MSC公司:

68季度xx 计算理论
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] A Arenas、A Fernández和S Gomez。分析不同分辨率下复杂网络的结构。《新物理杂志》,10(5):0530392008年5月。doi:10.1088/1367-2630/10/5/053039·doi:10.1088/1367-2630/10/5/053039
[2] Nikhil Bansal、Avrim Blum和Shuchi Shawla。相关聚类。机器学习,56:89-1132004·Zbl 1089.68085号
[3] 帕特里夏·J·卡斯滕森。一些参数整数和网络规划问题的复杂性。数学。程序。,26(1):64-751983年5月。doi:10.1007/BF02591893·Zbl 0585.90065号 ·doi:10.1007/BF02591893
[4] Moses Charikar、Venkatesan Guruswami和Anthony Wirth。使用定性信息进行聚类。计算机与系统科学杂志,71(3):360-3832005。doi:10.1016/j.jcss.2004.10.012·Zbl 1094.68075号 ·doi:10.1016/j.jcss.2004.10.012
[5] J.-C.Delvenne、S.N.Yaliraki和M.Barahona。图社区在时间尺度上的稳定性。《美国国家科学院院刊》,107(29):12755-127602010。doi:10.1073/pnas.0903215107·doi:10.1073/pnas.0903215107
[6] 埃里克·D·德曼(Erik D.Demaine)、多坦·伊曼纽尔(Dotan Emanuel)、阿莫斯·菲亚特(Amos Fiat)和妮可·伊莫利卡(Nicole Immorlica)。一般加权图中的相关聚类。理论计算机科学,361(2):172-1872006。近似和在线算法。doi:10.1016/j.tcs.2006.05.008·Zbl 1099.68074号 ·doi:10.1016/j.tcs.2006.05.008
[7] Thang N.Dinh、Xiang Li和My T.Thai。通过最大化模块化进行网络聚类:近似算法和理论限制。在ICDM中,第101-110页,2015年。doi:10.1109/ICDM.2015.139·doi:10.1109/ICDM.2015.139
[8] David F.Gleich、Nate Veldt和Anthony Wirth。广义相关聚类。ISAAC,第44:1-44:13页,2018年。doi:10.4230/LIPIcs。ISAAC2018.44·Zbl 07561398号 ·doi:10.4230/LIPIcs。国际会计准则委员会2018.44
[9] Lucas G.S.Jeub、Marya Bazzi、Inderjit S.Jutla和Peter J.Mucha。2011-2019年在MATLAB中实现的社区检测的通用Louvain方法。高温-tps://github.com/GenLouvain/GenLouvain。
[10] 汤姆·雷顿和萨蒂什·拉奥。多公共最大流最小割定理及其在设计近似算法中的应用。美国医学会杂志(JACM),46(6):787-8321999年11月·Zbl 1065.68666号
[11] 托马斯·马格南蒂(Thomas L.Magnanti)和丹·斯特拉提拉(Dan Stratila)。可分离凹优化近似等于分段线性优化。IPCO,第234-243页,2004年·Zbl 1092.90533号
[12] 托马斯·马格南蒂(Thomas L Magnanti)和丹·斯特拉蒂拉(Dan Stratila)。可分离凹优化近似等于分段线性优化。arXiv预印arXiv:12011.3148,2012·Zbl 1092.90533号
[13] 卡塔·穆蒂(Katta G.Murty)。参数线性规划的计算复杂性。数学规划,19(1):213-2191980年12月。doi:10.1007/BF01581642·Zbl 0443.90102号 ·doi:10.1007/BF01581642
[14] Mark EJ Newman和Michelle Girvan。发现和评估网络中的社区结构。《物理评论》E,69(026113),2004年。
[15] 塞巴斯蒂安·诺沃辛和斯蒂芬妮·杰格尔卡。线性规划松弛解的稳定性:图分割和无监督学习。在ICML中,第769-776页。ACM,2009年。
[16] Jörg Reichardt和Stefan Bornholdt。用potts模型检测复杂网络中的模糊社区结构。《物理评论快报》,93:2187012004年11月。doi:10.1103/PhysRevLett.93.218701·doi:10.1103/PhysRevLett.93.218701
[17] Jörg Reichardt和Stefan Bornholdt。社区检测的统计机制。《物理评论》E,74(016110),2006年。
[18] J.Gan、D.F.Gleich、N.Veldt、A.Wirth和X.Zhang 39:15
[19] 罗恩·沙米尔(Ron Shamir)、罗德·沙兰(Roded Sharan)和德克尔·特苏尔(Dekel Tsur)。聚类图修改问题。离散应用数学,144:173-1822004·兹比尔1068.68107
[20] V.A.Traag、P.Van Dooren和Y.Nesterov。分辨率范围窄-无限制社区检测。《物理评论》E,84:016114,2011年7月。doi:10.1103/PhysRevE.84.016114·doi:10.1103/PhysRevE.84.016114
[21] V.A.Traag、L.Waltman和N.J.van Eck。从鲁汶到莱顿:瓜拉纳人与社区紧密相连。《科学报告》,9(1):52332019年。doi:10.1038/s41598-019-41695-z·doi:10.1038/s41598-019-41695-z
[22] Nate Veldt、David Gleich、Anthony Wirth和James Saunderson。图聚类算法的度量约束优化。SIAM数据科学数学杂志,1(2):333-3552019年·Zbl 1499.05598号
[23] Nate Veldt、David F.Gleich和Anthony Wirth。用于社区检测的相关聚类框架。在WWW中,第439-4482018页。doi:10.1145/3178876.3186110·数字对象标识代码:10.1145/3178876.3186110
[24] 安东尼·沃思。聚类的近似算法。普林斯顿大学博士论文,2004年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。