×

兹马思-数学第一资源

一种稳健的聚类分析方法。(英语) Zbl 1064.62074
摘要:假设有一个来自不同的,正态分布的,具有共同协方差矩阵的\(n\)(\mathbb{R}^d\)值观测值的污染列表。我们计算了一类具有离群值的统计模型的最大似然估计;它检测异常值并同时将其补码划分为\(g\)个簇。结果表明,该估计器结合了最小协方差行列式拒绝方法和聚类分析中著名的混合行列式准则。我们还提出了一个有效的算法来逼近这个估计量,并研究了它的平均值的崩溃点,以及在组内的平方和和和积矩阵。

理学硕士:
62小时30分 分类和区分;聚类分析(统计方面)
62F35层 鲁棒性和自适应程序(参数推理)
65立方英尺 统计计算问题(MSC2010)
PDF格式 BibTeX公司 XML 引用
参考文献:
[1] Barnett,V.和Lewis,T.(1994年)。统计数据中的异常值,第3版,威利,奇切斯特·Zbl 0801.62001
[2] Bezdek,J.C.,Keller,J.,Krisnapuram,R.和Pal,N.R.(1999年)。模式识别和图像处理的模糊模型和算法。克鲁瓦,多德雷赫特·Zbl 0998.68138
[3] 科尔曼,D.A.和伍德拉夫,D.L.(2000年)。大数据集的聚类分析:混合似然最大化的有效算法。J、 计算机。图表。统计学家。9672-688年。
[4] Cuesta Albertos,J.A.,Gordaliza,A.和Matrán,C.(1997年)。Trimmed \(k\)—意思是:试图使量化器更加健壮。安。统计学家。25553–576·Zbl 0878.62045
[5] Donoho,D.L.和Huber,P.J.(1983年)。崩溃点的概念。在为埃里希·L·莱曼写的一个节日里(P.J.Bickel,K.A.Doksum和J.L.Hodges,Jr.,编辑)157-184。沃兹沃思,贝尔蒙特,加利福尼亚州·Zbl 0523.62032
[6] 弗雷利,C.和拉夫特里,A.E.(2002年)。基于模型的聚类、判别分析和密度估计。J、 阿默尔。统计学家。协会97 611–631·Zbl 1073.62545
[7] Friedman,H.和Rubin,J.(1967年)。关于分组数据的一些不变准则。J、 阿默尔。统计学家。Assoc.1178–1159年。
[8] 加西亚-埃斯库德罗,洛杉矶和戈尔达利扎,A.(1999年)。(k)均值和修剪均值的鲁棒性。J、 阿默尔。统计学家。协会94 956–969·Zbl 1072.62547
[9] 加西亚-埃斯库德罗,洛杉矶,戈尔达利扎,A.和马特兰,C.(2003年)。探索性数据分析中的微调工具。J、 计算机。图表。统计学家。12434–449年。
[10] 盖特,英国和甘蓝,英国(1988年)。存在异常值时的最大似然估计。通信统计员。理论方法17 3767–3784·Zbl 0696.62119
[11] 汉佩尔,F.R.(1968年)。对稳健估计理论的贡献。加州大学伯克利分校博士论文。
[12] 汉佩尔,F.R.(1971年)。稳健性的一般定性定义。安。数学。统计学家。42 1887年至1896年·中银0229.62041
[13] Hartigan,J.A.(1975年)。聚类算法。威利,纽约·Zbl 0372.62040
[14] 霍奇斯,J.L.,Jr.(1967年)。正态样本的有效性和某些位置估计的极值容忍度。程序。第五届伯克利研讨会。数学。统计学家。可能吧。1163-186年。加州大学出版社,伯克利·Zbl 0211.50205
[15] Lopuhaä,H.P.和Rousseeuw,P.J.(1991年)。多元位置和协方差矩阵的仿射等变估计的崩溃点。安。统计学家。19229-248。JSTOR公司:·Zbl 0733.62058
[16] Mardia,K.V.,Kent,J.T.和Bibby,J.M.(1979年)。多元分析。伦敦学术出版社·Zbl 0432.62029
[17] Mathar,R.(1981年)。尺寸和尺寸。博士学位论文,数学硕士学位论文-自然科学与技术学院·Zbl 0511.62033
[18] Pesch,C.(2000年)。这是一个很好的解决方案。帕绍大学,法库塔夫法马蒂克与信息学博士论文。
[19] Ritter,G.和Gallegos,M.T.(1997年)。统计模式识别中的异常值及其在染色体自动分类中的应用。模式识别字母18525–539。
[20] Ritter,G.和Gallegos,M.T.(2002年)。贝叶斯对象识别:变体。J、 多变量肛门。81 301–334·Zbl 1011.62011
[21] Rousseeuw,P.J.(1985年)。具有高崩溃点的多元估计。《数理统计与应用》(W.Grossmann、G.C.Pflug、I.Vincze和W.Wertz编辑)283-297。里德尔,多德雷赫特·浙宝0609.62054
[22] Rousseeuw,P.J.和Van Driessen,K.(1999年)。最小协方差行列式估计的快速算法。技术指标41 212–223。
[23] 施罗德,A.(1976年)。分析méme型概率分布的非语言性。版次。统计学家。申请。24 39–62岁。
[24] 斯科特,A.J.和西蒙斯,M.J.(1971年)。基于似然比准则的聚类方法。生物特征27 387–397。
[25] Späth,H.(1985年)。聚类分析。理论,FORTRAN程序,例子。埃利斯·霍伍德,奇切斯特·Zbl 0584.62094
[26] 西蒙斯(1981)。聚类准则与多元正态混合。生物特征37 35–43·Zbl 0473.62048
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。