×

通过最小体积椭球进行聚类。 (英语) Zbl 1180.90230号

小结:我们提出最小体积椭球(MVE)聚类作为椭球形状数据聚类的替代聚类技术,并探讨其价值和实用性。MVE集群以最小化每个集群覆盖椭球体体积的几何平均值的方式将数据点分配到集群中。这种方法的动机包括它的尺度方差,它处理非对称和不相等簇的能力,以及我们将其表述为可以求解到全局最优的混合整数半定规划问题的能力。我们给出了一些初步的经验结果,说明MVE聚类是一种从“椭球”分布混合数据中聚类数据的合适方法,并将其性能与(k)均值聚类算法以及MCLUST算法(基于最大似然EM算法)进行了比较在统计包R中提供。

MSC公司:

90C22型 半定规划
90立方厘米 混合整数编程
90摄氏51度 内部点方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Barnes,E.:通过椭球分离模式的算法。IBM J.Res.Dev.26,759–764(1982)·Zbl 0504.68058号 ·数字对象标识代码:10.1147/rd.266.0759
[2] Burkardt,J.:随机数据。http://www.csit.fsu.edu/\(\sim\)burkardt/m_src/random_data/random_data.html
[3] Dunagan,J.,Vempala,S.:高维空间中的最佳离群值去除。摘自:ACM计算理论研讨会,第627-636页。ACM,纽约(2001)·Zbl 1323.68566号
[4] Fraley,C.,Raftery,A.E.:Mclust:基于模型的聚类、判别分析和密度估计软件。华盛顿大学统计系第415R号技术报告(2002年)·Zbl 1073.62545号
[5] John,F.:以不等式为辅助条件的极值问题。载:《Courant周年纪念研究与随笔》,第187–204页。Interscience,纽约(1948年)
[6] Khachiyan,L.:实数计算模型中的四舍五入多边形。数学。操作。第21307-320号决议(1996年)·Zbl 0856.68066号 ·doi:10.1287/门21.2.307
[7] Khachiyan,L.,Todd,M.J.:关于多面体的最大内切椭圆体近似的复杂性。数学。程序。61, 137–159 (1993) ·Zbl 0792.90088号 ·doi:10.1007/BF01582144
[8] Kumar,M.,Orlin,J.:使用最小体积椭球体的尺度不变聚类(2007年,编制中)·Zbl 1142.62042号
[9] Kumar,P.,Yildirim,E.A.:包裹椭球体和岩芯组的最小体积。J.优化。理论应用。126 1–21 (2005) ·Zbl 1093.90039号 ·doi:10.1007/s10957-005-2653-6
[10] Löwner,K.:《单调矩阵》。数学。Z.38、177–216(1934)·兹比尔0008.11301 ·doi:10.1007/BF01170633
[11] MathWorks Inc.:MATLAB 6.5参考指南(2003)
[12] Nesterov,Y.,Nemirovskii,A.S.:凸规划中的内点多项式算法。SIAM,费城(1994)·Zbl 0824.90112号
[13] Rosen,J.B.:通过凸规划进行模式分离。数学杂志。分析。申请。10, 123–134 (1965) ·Zbl 0134.37503号 ·doi:10.1016/0022-247X(65)90150-2
[14] Rousseeuw,P.J.,Leroy,A.M.:稳健回归和异常检测。威利,纽约(1987)·Zbl 0711.62030号
[15] Sun,P.,Freund,R.M.:最小体积覆盖椭球体的计算。操作。第52号决议,690-706(2004年)·Zbl 1165.90571号 ·doi:10.1287/opre.1040.0115
[16] Symons,M.J.:聚类标准和多元正态混合物。生物统计学37,35–43(1981)·Zbl 0473.62048号 ·doi:10.2307/2530520
[17] Toh,K.:线性矩阵不等式行列式最大化问题的原始-对偶路径允许算法。计算。最佳方案。申请。14, 309–330 (1999) ·Zbl 0961.90129号 ·doi:10.1023/A:1026400522929
[18] 张毅,高立:关于最大体积椭球问题的数值解。SIAM J.Optim公司。14, 53–76 (2004) ·Zbl 1043.90069 ·doi:10.137/S1052623401397230
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。