×

基于一维中心的l1-聚类方法。 (英语) 兹比尔1283.90034

摘要:受基于中心的最小二乘聚类问题求解方法的启发,请参阅([J.科根《大数据和高维数据聚类简介》,剑桥:剑桥大学出版社(2007;Zbl 1183.62106号)]; [J.特布尔,J.马赫。学习。第8号决议,65–102(2007年;Zbl 1222.68318号)]),我们构造了一个非常有效的迭代过程来解决一维基于中心的l1聚类问题,在此基础上可以确定最优划分。我们分析了迭代过程的基本性质和收敛性,对于每个初始近似选择,迭代过程收敛到相应目标函数的一个稳定点。也给出了相应的算法,它只需几个步骤就可以给出驻点和相应的分区。该方法以寻找具有两个簇的最优划分为例进行了说明和可视化,其中我们检查了相应极小化泛函的所有驻点。此外,该方法在大量数据点和簇的基础上进行了测试,并与Kogan[loc.cit.]和Teboule[loc.cit.]中描述的基于中心的最小二乘聚类问题的解决方法进行了比较。

MSC公司:

90C27型 组合优化
91C20个 社会和行为科学中的集群
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Banerjee A.、Merugu S.、Dhillon I.S.、Ghosh J.:Bregman分歧的聚类。J.马赫。学习。1705-1749号决议(2005年)·Zbl 1190.62117号
[2] Ben-Israel,A.,Iyigun,C.:概率D聚类。25 (2007). doi:10.1007/s00357-007-0021-y·Zbl 1260.62039号
[3] Boley D.L.:主方向除法分割。数据最小知识。发现。2, 325–344 (1998) ·doi:10.1023/A:1009740529316
[4] Boyd D.L.,Vandenberghe L.:凸优化。剑桥大学出版社,剑桥(2004)·Zbl 1058.90049号
[5] Chaovaltwongse,W.A.,Butenko,S.,Pardalos,P.M.:生物网络中的聚类挑战。《世界科学》(2009)
[6] Clarke F.H.:广义梯度的应用。事务处理。美国数学。Soc.205、247–262(1975年)·Zbl 0307.26012号 ·doi:10.1090/S0002-9947-1975-0367131-6
[7] Clarke F.H.:优化和非光滑分析。SIAM,费城(1990)·兹伯利0696.49002
[8] Cupec R.,GrbićR.,Sabo K.,Scitovski R.:搜索最佳最小绝对偏差平面的三点法。申请。数学。计算。215, 983–994 (2009) ·Zbl 1176.65017号 ·doi:10.1016/j.amc.2009.06.023
[9] Demidenko E.:无约束全局优化的准则。J.优化。理论应用。136, 375–395 (2008) ·Zbl 1145.90053号 ·doi:10.1007/s10957-007-9298-6
[10] Dhillon I.S.、Mallela S.、Kumar R.:一种用于文本分类的分裂信息理论特征聚类算法。J.马赫。学习。第3号决议,1265–1287(2003)·Zbl 1102.68545号
[11] Dhillon,I.S.,Guan,Y.,Kulis,B.:核k-means,谱聚类和归一化切割。摘自:第十届ACM SIGKDD知识发现和数据挖掘国际会议(KDD)会议记录,2004年8月22日至25日,美国华盛顿州西雅图,pp.551–556(2004)
[12] Domínguez,E.,Muñoz,J.:将生物激励技术应用于p-median问题。IWANN 2005;计算智能仿生系统。,第八届国际研讨会人工神经网络。计算机科学课堂讲稿,第67-74页。柏林施普林格出版社(2005)
[13] Finkel D.E.,Kelley C.T.:加性缩放和$${\(\backslash\)tt-DIRECT}$$算法。J.全球。最佳方案。36, 597–608 (2006) ·Zbl 1142.90488号 ·doi:10.1007/s10898-006-9029-9
[14] Floudas C.A.,Gounaris C.E.:全球优化最新进展综述。J.全球。最佳方案。45, 3–38 (2009) ·Zbl 1180.90245号 ·doi:10.1007/s10898-008-9332-8
[15] Gaviano M.,Lera D.:Lipschitz函数的全局最小化算法。最佳方案。莱特。2, 1–13 (2008) ·Zbl 1147.90032号 ·doi:10.1007/s11590-006-0036-z
[16] Gan G.,Ma C.,Wu J.:数据聚类:理论、算法和应用。SIAM,费城(2007)·Zbl 1185.68274号
[17] Hansen E.R.,Walster G.W.:使用区间分析的全局优化,第2版,修订和扩展。马塞尔·德克尔(Marcel Dekker),纽约(2004)·Zbl 1103.90092号
[18] Iyigun,C.:概率距离聚类。罗格斯大学新不伦瑞克研究生院论文(2007)
[19] Iyigun C.,Ben-Israel A.:多设施选址问题的广义Weiszfeld方法。操作。Res.Lett公司。38207–214(2010年)·Zbl 1188.90148号 ·doi:10.1016/j.orl.2009.11.005
[20] Jones D.R.、Perttunen C.D.、Stuckman B.E.:不含Lipschitz常数的Lipschitsian优化。JOTA 79、157–181(1993)·Zbl 0796.49032号 ·doi:10.1007/BF00941892
[21] Kogan J.:大型高维数据聚类介绍。剑桥大学出版社,剑桥(2007)·Zbl 1183.62106号
[22] Kogan,J.,Nicholas,C.,Wiacek,M.:大型高维数据的混合聚类。收录:Castellanos,M.,Berry,M.W.(编辑)文本挖掘研讨会论文集。SIAM(2007)
[23] Kogan,J.,Teboulle,M.:使用Bregman距离缩放聚类算法。收录:Berry,M.W.,Castellanos,M.(编辑)第六届SIAM国际数据挖掘会议文本挖掘研讨会论文集(2006年)
[24] Kogan J.、Nicholas C.、Wiacek M.:具有分歧的混合聚类。收录:Berry,M.W.,Castellanos,M.(编辑)《文本挖掘调查:聚类、分类和检索》,第二版,柏林斯普林格出版社(2007)
[25] Lesch F.:K-质心聚类分析工具箱。计算。统计数据分析。51, 526–544 (2006) ·Zbl 1157.62439号 ·doi:10.1016/j.csda.2005.10.006
[26] Littau D.,Boley D.L.:使用PDDP对非常大的数据集进行聚类。收录于:Kogan,J.,Nicholas,C.,Teboulle,M.(编辑)《多维数据分组:聚类的最新进展》,第99-126页。施普林格,纽约(2006)
[27] Pan S.,Chen J.S.:欧氏k-中心位置问题的两种无约束优化方法。申请。数学。计算。189, 1368–1383 (2007) ·Zbl 1126.65055号 ·doi:10.1016/j.amc.2006.12.014
[28] Pardalos P.M.,Hansen P.:数据挖掘与数学编程。美国数学学会,普罗维登斯(2008)·Zbl 1137.68011号
[29] PetrićJ.,Zlobec S.:非线性规划(克罗地亚语)。诺奇纳·克尼吉加,贝尔格莱德(1989)
[30] Piyavskij,S.A.:求函数绝对极值的算法。J.计算。数学。数学。物理学。12、888–896(1972年,俄语)·Zbl 0249.65046号
[31] Reese,J.:p-Median问题的解决方法:注释书目。威利(2006)·Zbl 1133.90357号
[32] Rodrígues Chia A.M.,Espejo I.,Drezner Z.:关于用欧几里得距离求解平面k-中心问题。欧洲药典。第207、1169–1186号决议(2010年)·Zbl 1206.90076号 ·doi:10.1016/j.ejor.2010.06.004
[33] Sabo K.,Scitovski R.,Vazler I.:基于给定数据搜索最佳LAD超平面来搜索超定线性方程组的最佳LAD解。J.优化。理论应用。149, 293–314 (2011) ·Zbl 1219.90125号 ·doi:10.1007/s10957-010-9791-1
[34] Sabo K.、Scitovski R.、Vazler I.、Zekić-Sušac M.:天然气消耗的数学模型。能量转换。管理。52, 1721–1727 (2011) ·doi:10.1016/j.enconman.2010.10.037
[35] Sabo K.,Scitovski R.:最佳最小绝对偏差线——特性和两种有效方法。《ANZIAM J.50,185-198》(2008年)·Zbl 1182.65023号 ·doi:10.1017/S1446181108000345
[36] Schöbel A.,Scholz D.:多维设施选址问题的大立方体-小立方体解方法。计算。操作。第37、115–122号决议(2010年)·Zbl 1171.90451号 ·doi:10.1016/j.cor.2009.03.031
[37] Späth,H.:聚类形成与分析。R.Oldenburg Verlag,慕尼黑(1983)·Zbl 0536.62048号
[38] Su,Z.,Kogan,J.,Nicholas,C.:使用k-means类型算法的约束聚类。摘自:Berry,M.W.,Kogan,J.(编辑)《文本挖掘应用与理论》,第81-103页。奇切斯特·威利(2010)
[39] Teboulle M.:基于中心的聚类方法的统一连续优化框架。J.马赫。学习。第8号决议,65–102(2007年)·兹比尔1222.68318
[40] Vazler,I.,Sabo,K.,Scitovski,R.:解决最小绝对偏差问题的数据加权中值。公社。统计理论方法,艺术ID 539750(LSTA-2010-0354)(2011年出版)·兹比尔1319.62141
[41] Vivek E.P.,Sudha N.:人脸识别的稳健Hausdorff距离测量。模式识别。40, 431–442 (2007) ·Zbl 1118.68146号 ·doi:10.1016/j.patcog.2006.04.019
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。