×

兹马思-数学第一资源

一种用于接头尺寸和样品缩减的公正修整方法。(英语) Zbl 07300772
摘要:基于裁剪的思想,提出了一种稳健的降阶因式k均值算法。降维和因式k-means是一种非常适合通过PCA和聚类同时进行维数和样本约简的数据简化技术。数据不足的发生会使标准分析失效。实际上,手头数据中的污染可以隐藏数据的底层聚集结构。通过不偏不倚的裁剪,给出了一种发展因式分解和约化k均值的健壮对等体的方法。这个想法是放弃一小部分被选为离质心最远的观测值。通过一些数值研究和实际数据实例,研究了该方法的有限样本行为。
理学硕士:
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Atkinson,A.,《用于检测多个异常值的快速非常稳健的方法》,美国统计协会杂志,894281329-1339(1994)·Zbl 0825.62429
[2] 塞里奥利,A。;Farcomeni,A.,多元离群点检测的错误率,计算统计与数据分析,55,1544-553(2011)·兹布1247.62192
[3] 克劳斯,C。;菲尔兹莫瑟。;Fritz,H.,稳健稀疏主成分分析,技术计量学,55,2202-214(2013)
[4] 阿尔贝斯塔,库斯托斯。;戈尔达利扎,A。;Matrán,C.,《修剪的k-均值:试图使量化器更加稳健》,《统计年鉴》,25,2553-576(1997)·Zbl 0878.62045
[5] De Soete,G.和Carroll,J.D.(1994年)。低维欧氏空间中的K-均值聚类。In:分类和数据分析的新方法(第212-219页)。斯普林格。
[6] 多托,F。;法科梅尼,A。;加西亚-埃斯库德罗,洛杉矶;Mayo Iscar,A.,稳健回归聚类的模糊方法,数据分析与分类进展,11,4,691-710(2017)·Zbl 1414.62240
[7] 多托,F。;科梅尼,法拉。;加西亚-埃斯库德罗,洛杉矶;Mayo Iscar,A.,《稳健聚类、统计和计算的重新加权方法》,28,2477-493(2018年)·Zbl 1384.62193
[8] Farcomeni,A.,鲁棒双聚类:基于交替集中步骤的方法,分类杂志,26,1,77-101(2009)·Zbl 1276.62040
[9] Farcomeni,A.和Greco,L.(2015年)。稳健的数据缩减方法。CRC出版社·Zbl 1311.62006
[10] Frank,A.和Asuncion,A.(2010年)。UCI机器学习资源库加州大学信息与计算机科学学院。加利福尼亚州欧文市。
[11] Gallegos,M.和Ritter,G.(2005年)。一种稳健的聚类分析方法。统计年鉴,347-380·Zbl 1064.62074
[12] 加西亚·埃斯库德罗,洛杉矶;Gordaliza,A.,k均值和修剪k均值的稳健性,美国统计协会杂志,94447956-969(1999)·Zbl 1072.62547
[13] 加西亚-埃斯库德罗,洛杉矶;戈尔达利扎,A。;Matrán,C.,探索性数据分析中的微调工具,计算与图形统计杂志,12,2434-449(2003)
[14] 加西亚-埃斯库德罗,洛杉矶;戈尔达利扎,A。;马特兰,C。;Mayo Iscar A.,探索基于稳健模型的聚类、统计和计算中的群体数量,21,4585-599(2011)·Zbl 1221.62093号
[15] Gebeyaw M.(2017年)。网页抓取与应用聚类全球幸福与社会进步指数。datasciencepluscom。
[16] Gordaliza,A.,基于微调程序的随机变量的最佳逼近,近似理论杂志,64,2162-180(1991)·Zbl 0745.41030
[17] 格雷科,L。;Farcomeni,A.,稀疏和稳健主成分分析的插件方法,测试,25,3,449-481(2016)·Zbl 06833258
[18] Helliwell,J.,Layard,R.,Sachs,J.(2017年)。2017年世界幸福报告。
[19] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2,1193-218(1985)·Zbl 0587.62128
[20] 考夫曼,L。;Rousseeuw,P.,《在数据中寻找群体:聚类分析导论》,第344卷(2009年),纽约:威利,纽约
[21] Markos,A.,Iodice D'Enza,A.,van de Velden,M.(2017年)。clustrd:联合降维与聚类方法。https://CRAN.R-project.org/package=clustrd,r包版本1.2.0。
[22] 罗奇,R。;南卡罗来纳州盖顿市;Vichi,M.,一种新的降维方法:因子判别k-均值,分类杂志,28,2,210-226(2011)·Zbl 1226.62062
[23] 洛克,DM;伍德拉夫,DL,多元数据中离群值的识别,美国统计协会杂志,91,435,1047-1061(1996)·Zbl 0882.62049
[24] 罗素,P。;《最小协方差行列式估计的快速算法》,技术计量学,41,3,212-223(1999)
[25] 蒂默曼,M。;塞勒曼斯,E。;基尔,哈;简化后的统计数据,1878年,第54页,计算统计·Zbl 1284.62396
[26] 维希,M。;Kiers,H.,双向数据的因子k-均值分析,计算统计与数据分析,37,1,49-64(2001)·Zbl 1051.62056
[27] 维希,M。;罗奇,R。;Kiers,HA,三向数据的同时成分和聚类模型:方法内和方法间,分类杂志,24,1,71-98(2007)·Zbl 1144.62045
[28] 邹,H。;黑斯蒂,T。;Tibshirani,R.,稀疏主成分分析,计算与图形统计杂志,15,2265-286(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。