×

概率距离聚类的参数版本。 (英语) Zbl 1436.62281号

Greselin,Francesca(编辑)等人,《复杂数据的统计学习》。意大利统计学会分类和数据分析小组第11次科学会议论文选集(CLADAG 2017),2017年9月13-15日,意大利米兰。查姆:斯普林格。研究分类数据分析。知识。器官。,33-43 (2019).
概要:概率距离(PD)聚类方法基于一个基本假设,即对于每个统计单元,单元属于簇的概率与单元与簇中心之间的距离的乘积是恒定的。这个常数是点的可分类性的度量,单位上的常数之和称为联合距离函数(JDF)。最小化JDF的参数最大化了单元的可分类性。本文的目的是介绍一种基于概率密度函数的新距离测度,具体来说,我们使用多元高斯分布和Student-(t)分布。我们使用两个模拟数据集表明,使用基于这两个密度函数的距离可以提高PD聚类的性能。
关于整个系列,请参见[Zbl 1427.62004年].

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62F03型 参数假设检验
62H10型 统计的多元分布
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Andrews,J.L.,Wickins,J.R.,Boers,N.M.,McNicholas,P.D.:teigen:通过多元t分布进行基于模型的聚类和分类的R包。J.统计软件。83,1-32(2017)
[2] Ben-Israel,A.,Iyigun,C.:概率d-聚类。25, 5-26 (2008) ·Zbl 1260.62039号 ·doi:10.1007/s00357-008-9002-z
[3] Bezdek,J.C.,Ehrlich,R.,Full,W.:FCM:模糊C均值聚类算法。计算。地质科学。10, 191-203 (1984) ·doi:10.1016/0098-3004(84)90020-7
[4] Browne,R.P.,ElSherbiny,A.,McNicholas,P.D.:FCM:混合物:聚类和分类的混合物模型。R包版本1.4(2015)。https://cran.r-project.org/web/packages/mixture/index.html
[5] Dempster,A.P.,Laird,N.M.,Rubin,D.B.:通过EM算法获得不完整数据的最大似然。J.R.Stat.Soc.B满足Ser。B 39,1-38(1977)·Zbl 0364.62022号
[6] Everitt,B.S.、Landau,S.、Leese,M.、Stahl,D.:聚类分析。概率统计威利级数。威利,纽约(2011)·Zbl 1274.62003年 ·doi:10.1002/9780470977811
[7] Genz,A.、Bretz,F.、Miwa,T.、Mi,X.、Leisch,F.,Scheipl,F.和Hothorn,T.:mvtnorm:多元正态分布和T分布。R软件包版本1.0-7(2009)。https://cran.r-project.org/web/packages/mvtnorm/index.html
[8] Gordon,A.D.:分类,第二版。查普曼和霍尔/CRC,博卡拉顿(1999)·Zbl 0929.62068号
[9] Hubert,L.,Arabie,P.:比较分区。J.分类。2, 193-218 (1985) ·Zbl 0587.62128号 ·doi:10.1007/BF01908075
[10] Iyigun,C.:概率距离聚类。新泽西州立大学博士论文(2007)
[11] Iyigun,C.,Ben-Israel,A.:根据簇大小调整的概率距离聚类。普罗巴伯。工程师通知。科学。22, 68-125 (2008) ·Zbl 1152.68500号 ·doi:10.1017/S0269964808000351
[12] MacQueen,J.:多元观测分类和分析的一些方法。摘自:《第五届伯克利研讨会论文集》,第1卷,第281-297页(1967年)·Zbl 0214.46201号
[13] McLachlan,G.J.,Peel,D.:有限混合模型。Wiley Interscience,纽约(2000年)·Zbl 0963.62061号 ·doi:10.1002/0471721182
[14] R核心团队:R:统计计算的语言和环境。R统计计算基金会,维也纳(2016年)
[15] Rand,W.M.:评价聚类方法的客观标准。《美国统计协会期刊》66,846-850(1971)·doi:10.1080/01621459.1971.10482356
[16] Theodoridis,S.,Koutroumbas,K.:模式识别,第2版。学术出版社,纽约(2003)·Zbl 1093.68103号
[17] Tortora,C.,McNicholas,P.D.:FPD聚类:PD-聚类和因子PD-聚类。R包版本1.1(2016)。https://cran.r-project.org/web/packages/FPDclustering/index.html
[18] 托托拉,C·Zbl 1414.62279号 ·doi:10.1007/s11634-015-0219-5
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。