×

用于基于图的聚类的学习双随机和近幂等亲和矩阵。 (英语) Zbl 1495.62048号

摘要:在基于图形的聚类中,相关的亲和矩阵对于良好的结果至关重要。亲和矩阵的双重随机性已被证明是理论和实践中的一个重要条件。在本文中,我们强调幂等性是另一个关键条件。事实上[R.凹陷,美国数学。周一。75, 632–634 (1968;兹伯利0162.04205)]允许我们一方面展示\(n\)阶(行和列的模置换)的双随机和幂等矩阵集与\(n\)对象集的可能分区集之间的双射关系。因此,这两个属性都是使用矩阵正确建模聚类或图划分任务的必要和充分条件。然而,这导致了一个NP-hard离散优化问题。在这种情况下,我们的主要贡献是引入了一种新的松弛模型,该模型可以有效地学习基于图形的聚类的双随机和几乎幂等的亲和矩阵。我们的方法一方面利用了双随机和幂等矩阵之间的现有特性,另一方面,与之相关的拉普拉斯矩阵。由此产生的优化问题是双凸的,可以通过交替方向乘法器方案来解决。此外,与大多数最近的工作相比,我们的模型需要较少的参数设置。我们使用几个真实世界的基准测试获得的实验结果表明了我们方法的兴趣以及在基于图的聚类中考虑幂等性的重要性。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
90C22型 半定规划
90 C90 数学规划的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] 艾哈迈迪·R·H。;Tang,C.S.,自动化装配系统设计的操作划分问题,运筹学,39,5,824-835(1991)·Zbl 0729.91005号
[2] 阿洛伊斯,D。;Deshpande,A。;Hansen,P。;Popat,P.,欧氏平方和聚类的NP-harrdness,机器学习,75,2,245-248(2009)·Zbl 1378.68047号
[3] Bauschke,H.H。;Borwein,J.M.,《关于解决凸可行性问题的投影算法》,SIAM Review,38,3,367-426(1996)·Zbl 0865.47039号
[4] 博伊德,S。;北卡罗来纳州帕里赫。;Chu,E.,《通过交替方向乘数法进行分布式优化和统计学习》(2011年),Now Publishers Inc
[5] Caraballo,L.E。;Díaz-Báñez,J.-M。;Kroher,N.,通过图分割实现平衡聚类的多项式算法,《欧洲运筹学杂志》,289,2,456-469(2021)·Zbl 1487.62067号
[6] Chang,C.-C。;Lin,C.-J.,LIBSVM:支持向量机库,ACM智能系统与技术事务(TIST),2,3,1-27(2011)
[7] 组合,P.L。;Pesquet,J.-C.,《信号处理中的近距离分裂方法》,《科学与工程中反问题的定点算法》,185-212(2011),施普林格出版社·Zbl 1242.90160号
[8] De Amorim,S.G。;Barthélemy,J.-P。;Ribeiro,C.C.,《聚类和团划分:模拟退火和禁忌搜索方法》,《分类杂志》,9,1,17-41(1992)
[9] 德尔戈沙伊,A。;Ali,A.,《设计单元制造系统中集群技术的演变:最新综述》,《国际工业工程计算杂志》,2019年第10期,第2期,第177-198页
[10] 迪伦,I.S。;关,Y。;Kulis,B.,Kernel k-means:Spectral clustering and normalized cuts,第十届ACM SIGKDD知识发现和数据挖掘国际会议论文集,551-556(2004)
[11] 迪伦,I.S。;关,Y。;Kulis,B.,《核k均值、谱聚类和图切割的统一视图》(2004),Citeser
[12] 丁,C。;何,X。;Simon,H.D.,关于非负矩阵分解和谱聚类的等价性,2005年SIAM国际数据挖掘会议论文集,606-610(2005),SIAM
[13] 丁,C.H.Q。;何,X。;查,H。;顾,M。;Simon,H.D.,图分割和数据聚类的最小最大切割算法,2001年IEEE数据挖掘国际会议论文集,107-114(2001),IEEE
[14] 美国多恩多夫。;Pesch,E.,快速聚类算法,ORSA计算杂志,6,2,141-153(1994)·Zbl 0820.90114号
[15] Everitt,B.S。;兰道,S。;Leese,M。;Stahl,D.,聚类分析(2011),John Wiley·Zbl 1274.62003年
[16] Fan,K.,关于线性变换特征值的Weyl定理I,美国国家科学院学报,35,11,652(1949)·Zbl 0041.00602号
[17] 甘,G。;马,C。;Wu,J.,《数据聚类:理论、算法和应用》(2020年),SIAM
[18] M.Grötschel。;Wakabayashi,Y.,聚类问题的切割平面算法,数学规划,45,1,59-96(1989)·Zbl 0675.90072号
[19] Hansen,P。;Jaumard,B.,聚类分析和数学规划,数学规划,79,1,191-215(1997)·Zbl 0887.90182号
[20] Hartigan,J.A.,《聚类算法》(1975),John Wiley&Sons,Inc·Zbl 0372.62040号
[21] 霍夫曼,T。;Schölkopf,B。;Smola,A.J.,机器学习中的内核方法,《统计年鉴》,36,3,1171-1220(2008)·兹比尔1151.3007
[22] 洪,M。;Luo,Z.-Q。;Razaviyayn,M.,一类非凸问题的交替方向乘子法的收敛性分析,SIAM优化杂志,26,1,337-364(2016)·Zbl 1356.49061号
[23] 马可托奇诺,F。;Michaud,P.,《自动分类中的相似性判别》,《应用统计评论》,30,2,21-44(1982)·Zbl 0537.62006号
[24] Nascimento,M.C.V。;De Carvalho,A.C.,《图形聚类的谱方法——一项调查》,《欧洲运筹学杂志》,211,2,221-231(2011)·Zbl 1250.68228号
[25] Neumann,J.V.,函数运算符(AM-22),第2卷:正交空间的几何。(AM-22)(1950),普林斯顿大学出版社·Zbl 0039.11701号
[26] Ngai,E.W.T。;秀,L。;Chau,D.C.K.,《数据挖掘技术在客户关系管理中的应用:文献综述和分类》,《应用专家系统》,36,2,2592-2602(2009)
[27] 聂,F。;王,X。;乔丹,M。;Huang,H.,基于图形聚类的约束拉普拉斯秩算法,AAAI人工智能会议论文集,第30卷(2016)
[28] Park,J。;Kim,T.,通过Davis-Kahan定理学习双随机亲和矩阵,2017年IEEE数据挖掘国际会议(ICDM),377-384(2017),IEEE
[29] 佩德雷戈萨,F。;瓦罗佐,G。;Gramfort,A。;米歇尔,V。;蒂里昂,B。;O.格栅。;Duchesnay,E.,Scikit-learn:Python中的机器学习,《机器学习研究杂志》,第12期,第2825-2830页(2011年)·Zbl 1280.68189号
[30] 彭杰。;Wei,Y.,通过半定规划逼近k均值型聚类,SIAM优化杂志,18,1,186-205(2007)·Zbl 1146.90046号
[31] 彭杰。;Xia,Y.,k-means型聚类的新理论框架,数据挖掘的基础和进展,79-96(2005),施普林格·Zbl 1085.68132号
[32] Saxena,A.公司。;Prasad,M。;古普塔,A。;巴里尔,N。;帕特尔,O.P。;Tiwari,A。;Lin,C.-T.,《聚类技术和发展综述》,神经计算,267664-681(2017)
[33] Sinkhorn,R.,关于双随机矩阵的两个结果,《美国数学月刊》,75,6,632-634(1968)·Zbl 0162.04205号
[34] R.Sinkhorn。;Knopp,P.,关于非负矩阵和双随机矩阵,《太平洋数学杂志》,21,2434-348(1967)·兹伯利0152.01403
[35] Von Luxburg,U.,《光谱聚类、统计和计算教程》,17,4,395-416(2007)
[36] Wang,F。;李,P。;Konig,A.C.,《学习双随机数据相似矩阵》,2010年IEEE数据挖掘国际会议,551-560(2010),IEEE
[37] 王,X。;聂,F。;Huang,H.,基于图聚类的结构化双随机矩阵,第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集,1245-1254(2016)
[38] Yanai,H。;Takeuchi,K。;Takane,Y.,投影矩阵、投影矩阵、广义逆矩阵和奇异值分解,25-54(2011),Springer·Zbl 1279.15003号
[39] 扎斯·R。;Shashua,A.,《硬聚类和概率聚类的统一方法》,第十届IEEE计算机视觉国际会议(ICCV'05),第1卷,294-301(2005),IEEE
[40] 扎斯·R。;Shashua,A.,谱聚类的双随机归一化,神经信息处理系统的进展,1569-1576(2007)
[41] 查,H。;何,X。;丁,C。;顾,M。;Simon,H.D.,k均值聚类的谱松弛,神经信息处理系统的进展,1057-1064(2002)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。