×

通过原对偶算法更好地保证了(k)均值和欧氏(k)中值。 (英语) 1450.90005兹罗提

总结:聚类是使用\(k\)进行优化的一个经典主题,意味着它是此类最基本的问题之一。在输入没有任何限制的情况下,欧几里德空间中最著名的具有可证明保证的“(k)-均值”算法是一种简单的局部搜索启发式算法,其近似保证为“(9+epsilon”,这是已知的与此类方法相关的严格比率。我们通过提出一种新的原始-对偶方法来克服这个障碍,该方法允许我们(1)利用(k)-均值的几何结构,(2)满足硬约束,即最多选择(k)个簇,而不会降低近似保证。我们的主要结果是关于标准线性规划(LP)松弛的6.357近似算法。我们的技术非常通用,并且我们还显示了对欧几里德度量中的“(k)中值”和泛化“(k”均值”的改进保证,其中基础度量不需要是欧几里得的。

MSC公司:

90C05(二氧化碳) 线性规划
90 C59 数学规划中的近似方法和启发式
49平方米25 最优控制中的离散逼近
68周25 近似算法
05C69号 具有特殊属性的顶点子集(支配集、独立集、团等)

软件:

k平均值++
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] A.Archer、R.Rajagopalan和D.B.Shmoys,《k中值问题的拉格朗日松弛:新见解和连续性属性》,载于《第十一届欧洲账户体系会议记录》,纽约斯普林格,2003年,第31-42页·Zbl 1266.90117号
[2] D.Arthur和S.Vassilvitskii,k-means方法的速度有多慢?,第22届SoCG会议记录,ACM,纽约,2006年,第144-153页·Zbl 1153.68385号
[3] D.Arthur和S.Vassilvitskii,《K-means++:细心播种的优势》,载于《第18届SODA会议录》,ACM,纽约,SIAM,费城,2007年,第1027-1035页·Zbl 1302.68273号
[4] V.Arya、N.Garg、R.Khandekar、A.Meyerson、K.Munagala和V.Pandit,《中值和设施位置问题的局部搜索启发法》,SIAM J.Compute。,33(2004),第544-562页,https://doi.org/10.1137/S097539704216402。 ·Zbl 1105.68118号
[5] P.Awasthi、A.Blum和O.Sheffet,《稳定性得出k中值和k均值聚类的PTAS》,载于《第51届FOCS会议记录》,IEEE,华盛顿特区,2010年,第309-318页。
[6] P.Awasthi、M.Charikar、R.Krishnaswamy和A.K.Sinop,《欧几里德K-means近似的硬度》,载于《第31届SoCG会议记录》,ACM,纽约,2015年,第754-767页·Zbl 1378.68048号
[7] M.-F.Balcan、A.Blum和A.Gupta,《没有近似的近似聚类》,载于《第20届SODA会议论文集》,ACM,纽约,SIAM,费城,2009年,第1068-1077页,https://doi.org/10.1137/1.9781611973068.116。 ·Zbl 1422.68287号
[8] J.Byrka和K.Aardal,度量无容量设施位置问题的最优双因子近似算法,SIAM J.Comput。,39(2010),第2212-2231页,https://doi.org/10.1137/070708901。 ·Zbl 1205.90173号
[9] J.Byrka、T.Pensyl、B.Rybicki、A.Srinivasan和K.Trinh,《预算优化中(K)中值和正相关性的改进近似值》,载于《第26届SODA会议录》,ACM,纽约,SIAM,费城,2015年,第737-756页,https://doi.org/10.1137/1.9781611973730.50。 ·Zbl 1371.90073号
[10] M.Charikar和S.Guha,设施选址问题的改进组合算法,SIAM J.Compute。,34(2005),第803-824页,https://doi.org/10.1137/S0097539701398594。 ·Zbl 1075.68100号
[11] F.A.Chudak和D.B.Shmoys,无容量设施选址问题的改进近似算法,SIAM J.Compute。,33(2003),第1-25页,https://doi.org/10.1137/S0097539703405754。 ·邮编:1044.90056
[12] V.Cohen-Addad、P.N.Klein和C.Mathieu,《局部搜索聚类的力量》,预印本,https://arxiv.org/abs/1603.09535v1, 2016.
[13] D.Feldman、M.Monemizadeh和C.Sohler,《基于弱核心集的k-means聚类的PTAS》,载于《第23届SoCG会议录》,J.Erickson,ed.,ACM,纽约,2007年,第11-18页·Zbl 1209.68639号
[14] Z.Friggstad、M.Rezapour和M.R.Salavatipour,局部搜索生成加倍度量中k均值的PTAS,预印本,https://arxiv.org/abs/1603.08976, 2016. ·Zbl 1422.68296号
[15] A.Gupta和K.Tangwongsan,《设施位置局部搜索算法的更简单分析》,预印本,https://arxiv.org/abs/0809.2554, 2008.
[16] K.Jain、M.Mahdian、E.Markakis、A.Saberi和V.V.Vazirani,利用双重拟合和因子释放LP分析贪婪设施定位算法,J.ACM,50(2003),第795-824页·兹比尔1325.90060
[17] K.Jain、M.Mahdian和A.Saberi,《设施选址问题的一种新贪婪方法》,载于《第34届STOC会议记录》,ACM,纽约,2002年,第731-740页·Zbl 1192.90106号
[18] K.Jain和V.V.Vazirani,使用原始-对偶模式和拉格朗日松弛的度量设施位置和(K)-中值问题的近似算法,J.ACM,48(2001),第274-296页·兹伯利1138.90417
[19] T.Kanungo、D.M.Mount、N.S.Netanyahu、C.D.Piatko、R.Silverman和A.Y.Wu,k均值聚类的局部搜索近似算法,计算。地理。,28(2004),第89-112页·Zbl 1077.68109号
[20] E.Lee、M.Schmidt和J.Wright,改进和简化k-Means的不近似性,预印本,https://arxiv.org/abs/1509.00916, 2015. ·Zbl 1400.68250号
[21] S.Li,无容量设施选址问题的A\textup1.488近似算法,Inform。和计算。,222(2013),第45-58页·兹比尔1281.68236
[22] S.Li和O.Svensson,通过伪逼近逼近k中值,SIAM J.Compute。,45(2016),第530-547页,https://doi.org/10.1137/10938645。 ·Zbl 1338.90346号
[23] J.Lin和J.S.Vitter,几何中值问题的近似算法,Inform。过程。莱特。,44(1992年),第245-249页·Zbl 0764.68079号
[24] S.Lloyd,PCM中的最小二乘量化,IEEE Trans。通知。《理论》,28(2006),第129-137页·Zbl 0504.94015号
[25] J.Matoušek,关于近似几何k-聚类,离散计算。地理。,24(2000),第61-84页·Zbl 0959.68126号
[26] R.Ostrovsky、Y.Rabani、L.J.Schulman和C.Swamy,《k均值问题的劳埃德型方法的有效性》,J.ACM,59(2013),28·Zbl 1281.68229号
[27] D.B.Shmoys、E.Tardos和K.Aardal,设施选址问题的近似算法(扩展摘要),《第29届STOC会议论文集》,ACM,纽约,1997年,第265-274页·Zbl 0962.68008号
[28] A.Vattani,k-means即使在平面离散计算中也需要多次指数迭代。地理。,45(2011年),第596-616页·Zbl 1218.68088号
[29] V.V.Vazirani,近似算法,Springer-Verlag,纽约,2001年·Zbl 0999.68546号
[30] D.P.Williamson和D.B.Shmoys,《近似算法的设计》,剑桥大学出版社,纽约,2011年·Zbl 1219.90004号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。