×

物以类聚的鸟什么时候聚在一起\(k)-表示、接近度和二次曲线编程。 (英语) Zbl 1434.90123号

摘要:给定一组数据,一个中心目标是根据单个对象之间的相似性概念将它们分组。最流行和广泛使用的方法之一是\(k\)-均值,尽管要找到其全局最小值的计算难度很大。我们通过将不同凸松弛的性质与相应的邻近条件联系起来,来研究和比较它们的性质,最初由A.库马尔R.坎南,[“带谱范数和k-means算法的聚类”,载于:2010年IEEE第51届计算机科学基础年会(FOCS)。299-308(2010)]。利用二次曲线对偶理论,我们提出了一个改进的邻近条件,在该条件下,(k)-均值的Peng-Wei松弛[J.彭Y.Wei先生,SIAM J.优化。18,第1期,186-205(2007年;Zbl 1146.90046号)]准确恢复基础集群。我们的邻近条件优于库马尔和坎南,与[P.阿瓦西O.谢菲特,莱克特。注释计算。科学。7408, 37–49 (2012;Zbl 1358.68220号)],其中为射影(k)均值建立了接近条件。此外,我们还为Peng-Wei松弛的精确性提供了一个必要的邻近条件。对于簇大小相等的特殊情况,我们建立了一个完全局部化的不同邻近条件,在该条件下Amini-Levina松弛产生精确的簇,从而解决了Awasthi和Sheffet在平衡情况下的一个开放问题。我们的框架不仅具有确定性和无模型性,而且具有明确的几何意义,便于进一步分析和概括。此外,它还可以方便地应用于分析各种数据生成模型,如随机球模型和高斯混合模型。利用该方法,我们改进了随机球模型的当前最小分离界,并获得了最新的高斯混合模型学习结果。

MSC公司:

90立方厘米22 半定规划
62H30型 分类和区分;聚类分析(统计方面)
90C20个 二次规划

软件:

SDPNAL公司+
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Achlioptas,Dimitris;Frank Mcsherry,《关于混合分布的谱学习》,学习理论,458-469(2005),柏林,海德堡:施普林格-柏林-海德堡·Zbl 1137.68512号
[2] 阿洛伊斯,D。;Deshpande,A。;Hansen,P。;Popat,P.,《欧几里德平方和聚类的NP-harderness》,马赫。学习。,75, 2, 245-248 (2009) ·Zbl 1378.68047号 ·doi:10.1007/s10994-009-5103-0
[3] 阿米尼,Aa;Levina,E.,关于块体模型的半定松弛,Ann.Stat.,46,1149-179(2018)·Zbl 1393.62021号 ·doi:10.1214/17-AOS1545
[4] 亚瑟·D·。;Manthey,B。;Röglin,H.,k-means方法的平滑分析,J.ACM(JACM),58,5,19(2011)·兹比尔1281.68224 ·doi:10.1145/2027216.2027217
[5] Awasthi,P.,Bandeira,A.S.,Charikar,M.,Krishnaswamy,R.,Villar,S.,Ward,R.:放松,无需四舍五入:聚类公式的完整性。摘自:《2015年理论计算机科学创新会议论文集》,第191-200页。ACM(2015)·Zbl 1364.62144号
[6] Awasthi,Pranjal;Sheffet,Or,《聚类、近似、随机化和组合优化的改进谱范数界限》。算法与技术,37-49(2012),柏林,海德堡:施普林格-柏林-海德堡,柏林·Zbl 1358.68220号
[7] Ben-Tal,A.,Nemirovski,A.:现代凸优化讲座:分析、算法和工程应用。SIAM(2001)·Zbl 0986.90032号
[8] 博伊德,S。;Vandenberghe,L.,凸优化(2004),剑桥:剑桥大学出版社,剑桥·Zbl 1058.90049号
[9] Dasgupta,S.:学习高斯人的混合物。摘自:第40届计算机科学基础年会,第634-644页。IEEE(1999)
[10] 杜琪。;费伯,V。;Gunzburger,M.,《形心Voronoi细分:应用和算法》,SIAM Rev.,41,4,637-676(1999)·Zbl 0983.65021号 ·doi:10.1137/S0036144599352836
[11] 戈卢布,Gh;Van Loan,Cf,矩阵计算(1996),巴尔的摩:约翰霍普金斯大学出版社,巴尔的摩尔·Zbl 0865.65009号
[12] Iguchi,T.、Mixon,D.G.、Peterson,J.、Villar,S.:关于SDP放松k-means的紧密性(2015)。arXiv预打印arXiv:1505.04778
[13] 井口,T。;混合物,Dg;彼得森,J。;Villar,S.,可能证明k-means聚类是正确的,数学。程序。,165, 2, 605-642 (2017) ·Zbl 1377.65012号 ·doi:10.1007/s10107-016-1097-0
[14] Kannan,R。;Vempala,S.,光谱算法,Found。趋势理论。计算。科学。,4, 3-4, 157-288 (2009) ·Zbl 1191.68852号 ·doi:10.1561/040000025
[15] Kumar,A.,Kannan,R.:使用谱范数和k-means算法进行聚类。2010年IEEE第51届计算机科学基础年会(FOCS),第299-308页。IEEE(2010)
[16] Ling,S.,Strohmer,T.:通过半定松弛证明图割的全局最优性:谱聚类的性能保证(2018)。arXiv预印arXiv:1806.11429·Zbl 1445.90109号
[17] Lloyd,S.,PCM中的最小二乘量化,IEEE Trans。Inf.理论,28,2,129-137(1982)·Zbl 0504.94015号 ·doi:10.1109/TIT.1982.1056489
[18] Lu,Y.,Zhou,H.H.:劳埃德算法及其变体的统计和计算保证(2016)。arXiv预打印arXiv:1612.02099
[19] Meena Mahajan;Nimbhorkar、Prajakta;Varadarajan,Kasturi,平面k-Means问题是NP-Hard,WALCOM:算法和计算,274-285(2009),柏林,海德堡:施普林格-柏林-海德堡,柏林·Zbl 1211.68212号
[20] 混合物,Dg;维拉尔,S。;Ward,R.,通过半定规划对亚高斯混合进行聚类,Inf.推断:J.IMA,6,4,389-415(2017)·Zbl 1381.62189号 ·doi:10.1093/imaiai/iax001
[21] 彭杰。;Wei,Y.,通过半定规划逼近k均值型聚类,SIAM J.Opt。,18, 1, 186-205 (2007) ·兹比尔1146.90046 ·doi:10.1137/050641983年
[22] 塞利姆,Sz;Ismail,Ma,k-Means型算法:广义收敛定理和局部最优性的表征,IEEE Trans。模式分析。机器。智力。,6, 1, 81-87 (1984) ·Zbl 0546.62037号 ·doi:10.1109/TPAMI.1984.4767478
[23] Tropp,Ja,随机矩阵和的用户友好型尾界,Found。计算。数学。,12, 4, 389-434 (2012) ·Zbl 1259.60008号 ·doi:10.1007/s10208-011-9099-z
[24] Vattani,A.,k-Means即使在平面离散计算中也需要多次指数迭代。地理。,45, 4, 596-616 (2011) ·Zbl 1218.68088号 ·doi:10.1007/s00454-011-9340-1
[25] Vempala,S。;Wang,G.,用于学习混合模型的谱算法,J.Compute。系统。科学。,68, 4, 841-860 (2004) ·Zbl 1074.68028号 ·doi:10.1016/j.jcss.2003.11.008
[26] Vershynin,R。;Eldar,Yc;Kutyniok,G.,《随机矩阵非渐近分析导论》,《压缩传感:理论与应用》,第5章(2012年),剑桥:剑桥大学出版社,剑桥
[27] Wright,S.J.:原始-双重内点方法。SIAM(1997)·Zbl 0863.65031号
[28] Yang,L。;Sun,D。;Toh,K-C,SDPNAL+:非负约束半定规划的一种优化半光滑Newton-CG增广拉格朗日方法,数学。程序。,7, 3, 331-366 (2015) ·Zbl 1321.90085号 ·doi:10.1007/s12532-015-0082-6
[29] Zhao,X-Y;Sun,D。;Toh,K-C,半定规划的Newton-CG增广拉格朗日方法,SIAM J.Opt。,20, 4, 1737-1765 (2010) ·Zbl 1213.90175号 ·数字对象标识代码:10.1137/080718206
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。