×

对分组数据进行聚类的分层标准化完全随机度量。 (英语) Zbl 1437.62224号

摘要:在本文中,我们提出了一个用于聚类分组数据的贝叶斯非参数模型。我们采用分层方法:在最高级别上,每组数据根据一个混合模型进行建模,其中混合分布是以相同的基本度量为中心的条件独立的标准化完全随机度量(NormCRM),它本身就是一个NormCRM。共享基度量的离散性意味着数据级的进程共享相同的原子。此所需功能允许将不同组的观察结果聚集在一起。我们通过对无限维NormCRM进行边缘化来获得分层聚类模型的表示。我们研究了所提出的模型引起的聚类结构的性质,并提供了关于聚类数量在组内和组间分布的理论结果。此外,我们还对广义中餐厅特许经营过程进行了解释,允许在共轭和非共轭模型下进行后验推理。我们开发了用于完全贝叶斯推理的算法,并通过仿真研究和实际数据说明评估性能。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62G05型 非参数估计
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 链接

参考文献:

[1] Argiento,R。;比安奇尼,I。;Guglielmi,A.,“规范化完全随机测量混合物的ε-近似后验抽样”,《统计学电子期刊》,10,3516-3547(2016)·Zbl 1358.62034号 ·doi:10.1214/16-EJS1168
[2] Argiento,R。;Cremaschi,A。;Guglielmi,A.,“使用物种抽样高斯混合模型进行聚类分析的基于密度的算法”,《计算与图形统计杂志》,23,1126-1142(2014)·doi:10.1080/10618600.2013.856796
[3] 巴塞蒂,F。;卡沙林,R。;Rossini,L.,“等级物种抽样模型”,arXiv no.1803.05793(2018)
[4] Blei,D.M.,“概率主题模型”,ACM通讯,55,77-84(2012)·doi:10.1145/2133806.2133826
[5] Camerlenghi,F。;A·李高。;奥班兹,P。;普伦斯特,I.,“层次过程的分布理论”,《统计年鉴》,47,67-92(2019)·Zbl 1478.60151号 ·doi:10.1214/17-AOS1678
[6] Camerlenghi,F。;A·李高。;普伦斯特,I.,“多样本信息的贝叶斯预测”,《多元分析杂志》,156,18-28(2017)·Zbl 1369.62116号 ·doi:10.1016/j.jmva.2017.01.010
[7] Durrett,R.,《概率:理论与实例》(1991),加利福尼亚州太平洋格罗夫:沃兹沃思和布鲁克斯/科尔,加利福尼亚州Pacific Grove·Zbl 0709.60002号
[8] Favaro,S。;Teh,Y.,“归一化随机测量混合模型的MCMC”,《统计科学》,28335-359(2013)·Zbl 1331.62138号 ·doi:10.1214/13-STS422
[9] Ferguson,T.S。;Rizvi,M。;Rustagi,J。;Siegmund,D.,《统计学的最新进展:纪念赫尔曼·切尔诺夫六十岁生日的论文》,“正态分布混合的贝叶斯密度估计”,287-302(1983),纽约:学术出版社,纽约·Zbl 0517.00012号
[10] Hoff,P.D.,贝叶斯统计方法第一课程(2009),纽约:Springer Verlag,纽约·Zbl 1213.62044号
[11] Ishwaran,H。;James,L.F.,“棒断裂先验的吉布斯采样方法”,《美国统计协会杂志》,96161-173(2001)·Zbl 1014.62006年 ·doi:10.19198/0162114501750332758
[12] Ishwaran,H。;James,L.F.,《物种抽样混合模型的广义加权中餐馆过程》,《中国统计》,第13期,第1211-1235页(2003年)·Zbl 1086.62036号
[13] 詹姆斯·L.F。;A·李高。;Prünster,I.,“具有独立增量的标准化随机测度的后验分析”,《斯堪的纳维亚统计杂志》,36,76-97(2009)·兹比尔1190.62052 ·文件编号:10.1111/j.1467-9469.2008.00609.x
[14] Kallenberg,O.,《概率对称和不变性原理》(2005),纽约:Springer,纽约·Zbl 1084.60003号
[15] 金曼,J.F.C.,泊松过程,3(1993),牛津:牛津大学出版社,牛津·Zbl 0771.60001号
[16] 刘建伟。;Green,P.J.,“基于贝叶斯模型的聚类过程”,《计算与图形统计学杂志》,16526-558(2007)·doi:10.1198/106186007X238855
[17] A·李高。;梅纳,R.H。;普伦斯特,I.,“控制贝叶斯非参数混合模型中的强化”,《皇家统计学会杂志》,B辑,69,715-740(2007)·Zbl 07555373号 ·文件编号:10.1111/j.1467-9868.2007.00609.x
[18] A·李高。;普伦斯特,I。;Hjort,N。;霍姆斯,C。;缪勒,P。;Walker,S.,《贝叶斯非参数学,Dirichlet过程以外的模型》,80-136(2010),剑桥:剑桥大学出版社,剑桥
[19] Lo,A.Y.,“关于一类贝叶斯非参数估计:I.密度估计”,《统计年鉴》,第12卷,第351-357页(1984年)·Zbl 0557.62036号 ·doi:10.1214/aos/1176346412
[20] MacEachern,S.N.,相关非参数过程,50-55(1999)
[21] Malsiner-Walli,G。;Frühwirth-Schnatter,S。;Grün,B.,“使用贝叶斯估计识别混合物”,《计算与图形统计杂志》,26,285-295(2017)·doi:10.1080/10618600.2016.1200472
[22] 缪勒,P。;Quintana,F.,“协变量回归的随机划分模型”,《统计规划与推断杂志》,1402801-2808(2010)·Zbl 1191.62073号 ·doi:10.1016/j.jspi.2010.03.002
[23] Neal,R.M.,“Dirichlet过程混合模型的马尔可夫链抽样方法”,《计算与图形统计杂志》,9,249-265(2000)·doi:10.2307/1390653
[24] 皮涅罗,J。;Bates,D.,《S和S-PLUS中的混合效应模型》(2000),纽约:施普林格出版社,纽约·Zbl 0953.62065号
[25] 皮特曼,J。;Ferguson,T.S。;Shapley,L.S。;MacQueen,J.B.,《统计学、概率论和博弈论:为纪念David Blackwell而写的论文》,30,《Blackwell-MacQueen Urn方案的一些发展》,245-267(1996),海沃德:海沃德数理统计研究所·兹比尔0996.60500
[26] Pitman,J.,《科学与统计:Terry Speed的一场盛宴》,IMS讲稿-专著系列,40,Poisson-Kingman分区,1-34(2003),加利福尼亚州海沃德:数学统计研究所,加利福尼亚州海沃德·Zbl 1029.00084号
[27] Pitman,J.,组合随机过程,讲义-专题系列,1875(2006),纽约:Springer,纽约·Zbl 1103.60004号
[28] Regazzini,E。;A·李高。;普伦斯特,I.,“具有独立增量的标准化随机测度均值的分布结果”,《统计年鉴》,31560-585(2003)·Zbl 1068.62034号 ·doi:10.1214/aos/1051027881
[29] Teh,Y.W。;约旦医学院。;Hjort,N。;霍姆斯,C。;Müller,P.,Bayesian Nonparametrics,“分层贝叶斯非参数模型及其应用”,158-207(2010),剑桥:剑桥大学出版社,剑桥
[30] Teh,Y.W.先生。;约旦医学院。;Beal,M.J。;Blei,D.M.,“相关群体之间的共享集群:分层Dirichlet过程,神经信息处理系统的进展,1385-1392(2005)
[31] Teh,Y.W。;约旦医学院。;Beal,M.J。;Blei,D.M.,“层次Dirichlet过程”,《美国统计协会杂志》,1011566-1581(2006)·Zbl 1171.62349号 ·doi:10.1198/016214500000302
[32] Tyurin,I.S.,“李亚普诺夫定理常数上限估计的改进”,《俄罗斯数学调查》,65,201-202(2010)·兹比尔1225.60050
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。