×

分布有限混合中的奇异结构及其对参数估计的影响。 (英语) Zbl 1499.62460号

摘要:统计模型的奇异性是模型参数空间的元素,它使相应的Fisher信息矩阵退化。在这些点上,估计技术,如最大似然估计和标准贝叶斯程序,不允许根参数收敛率。我们提出了有限混合参数空间奇异结构识别的一般框架,并研究了紧致参数空间上奇异结构对极大似然估计的极小极大下界和收敛速度的影响。我们的研究明确了模型奇异性、参数估计收敛速度和极小极大下界以及连续分布混合参数空间的代数几何之间的深层联系。应用该理论建立了有限混合偏态分布参数估计的具体收敛速度。这种丰富且越来越流行的混合模型显示出一系列非常复杂的渐近行为,这些行为迄今为止在文献中尚未报道。

MSC公司:

62卢比 代数统计学
2012年12月62日 参数估计量的渐近性质
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] E.S.Allman、C.Matias和J.A.Rhodes,具有多个观测变量的潜在结构模型中参数的可识别性,Ann.Statist。,37(2009年),第3099-3132页·Zbl 1191.62003号
[2] M.Aoyagi,泛化误差的贝叶斯学习系数和Vandermonde矩阵型奇点,公共统计。《理论方法》,39(2010),第2667-2687页·Zbl 1272.62010年
[3] R.B.Arellano-Valle、L.M.Castro、M.C.Genton和H.W.Goímez,偏态分布形状混合的贝叶斯推断及其在回归分析中的应用,贝叶斯分析。,3(2008年),第513-540页·Zbl 1330.62242号
[4] R.B.Arellano-Valle、M.C.Genton和R.H.Loschi,《多元偏态分布的形状混合》,《多元分析杂志》。,100(2009),第91-101页·Zbl 1151.62042号
[5] A.Azzalini,关于包含正态分布的一类分布的进一步结果,统计(博洛尼亚),46(1986),第199-208页·Zbl 2013年6月6日
[6] A.Azzalini和A.Capitanio,多元偏态正态分布的统计应用,J.R.Stat.Soc.Ser。B.统计方法。,61(1999),第579-602页·Zbl 0924.62050号
[7] A.Azzalini和A.D.Valle,《多元偏态正态分布》,《生物统计学》,83(1996),第715-726页·Zbl 0885.62062号
[8] P.Buöhlmann和S.van de Geer,《高维数据统计》,斯普林格,海德堡,2011年·Zbl 1273.62015年
[9] A.Canale和B.Scarpa,贝叶斯非参数位置-尺度形状混合,TEST,25(2016),第113-130页·兹比尔1343.62015
[10] H.Chen和J.Chen,存在结构参数的正常混合物均匀性测试,统计量。Sinica,13(2003),第351-365页·Zbl 1015.62015号
[11] H.Chen、J.Chen和J.D.Kalbfleisch,有限混合模型中同质性的修正似然比检验,J.R.Stat.Soc.Ser。B.统计方法。,63(2001年),第19-29页·Zbl 0976.62011号
[12] 陈勇军,混合模型下最大似然估计的一致性,统计学家。科学。,32(2017年),第47-63页·Zbl 1442.62064号
[13] 陈建华,有限混合模型的最优收敛速度,Ann.Statist。,23(1995年),第221-233页·Zbl 0821.62023号
[14] M.Chiogna,关于标量偏态分布最大似然估计量渐近分布的注记,Stat.Methods Appl。,14(2005),第331-341页·Zbl 1103.62024号
[15] D.Cox、J.Little和D.O'Shea,《理想、多样性和算法:计算代数几何和交换代数导论》,Springer,纽约,2007年·Zbl 1118.13001号
[16] D.Dacunha-Castelle和E.Gassiat,局部二次曲线模型的测试和混合模型的应用,ESAIM Probab。统计人员。,1(1997年),第285-317页·Zbl 1007.62507号
[17] D.Dacuhan-Castelle和E.Gassiat,使用局部二次曲线参数化测试模型阶数:总体混合和平稳ARMA过程,Ann.Statist。,27(1999),第1178-1209页·Zbl 0957.62073号
[18] A.DasGupta,统计和概率的渐近理论,Springer,纽约,2008年·Zbl 1154.62001年
[19] M.Drton,似然比检验与奇异性,Ann.Statist。,37(2009),第979-1012页·Zbl 1196.62020年
[20] M.Drton和M.Plummer,奇异模型的贝叶斯信息准则,J.R.Stat.Soc.Ser。B.统计方法。,79(2017),第323-380页·Zbl 1414.62088号
[21] M.Drton、B.Sturmfels和S.Sullivant,《代数因子分析:四分位、五分位及以上》,Probab。理论相关领域,138(2007),第463-493页·Zbl 1111.13020号
[22] M.Drton、B.Sturmfels和S.Sullivant,《代数统计学讲座》,Birkha¨user出版社,巴塞尔,2009年·兹比尔1166.13001
[23] M.Drton和S.Sullivant,代数统计模型,统计学。Sinica,17(2007),第1273-1297页·Zbl 1132.62003号
[24] R.Dwivedi、N.Ho、K.Khamaru、M.J.Wainwright、M.I.Jordan和B.Yu,《奇异性、错误规范和EM的收敛速度》,预印本,https://arxiv.org/abs/11810.00828, 2018.
[25] R.Dwivedi、N.Ho、K.Khamaru、M.J.Wainwright、M.I.Jordan和B.Yu,EM在弱可辨识混合模型应用中的挑战,预印本,https://arxiv.org/abs/1902.00194, 2019.
[26] E.Gassiat和R.V.Handel,有限混合物的局部几何,Trans。阿默尔。数学。Soc.,366(2014),第1047-1072页·Zbl 1291.52004号
[27] D.Geiger、D.Heckerman、H.King和C.Meek,《分层指数族:图形模型和模型选择》,《统计年鉴》。,29(2001),第505-529页·Zbl 1012.62012年
[28] S.Ghosal和A.Roy,预测依赖性下的错误发现比例,J.Amer。统计师。协会,106(2011),第1208-1217页·Zbl 1229.62098号
[29] S.Ghosal和A.van der Vaart,正态密度混合的极大似然熵和收敛速度以及Bayes估计,Ann.Statist。,29(2001),第1233-1263页·兹比尔1043.62025
[30] M.Hallin和C.Ley,《不对称分布和Fisher信息——两种密度的故事》,Bernoulli,18(2012),第747-763页·Zbl 1243.62068号
[31] M.Hallin和C.Ley,《不对称分布和Fisher信息:偏态正态的双正弦》,Bernoulli,20(2014),第1432-1453页·Zbl 1302.60030号
[32] T.Hastie、R.Tibshrani和M.J.Wainwright,《稀疏的统计学习:拉索和泛化》,CRC出版社,佛罗里达州博卡拉顿,2015年·Zbl 1319.68003号
[33] P.Heinrich和J.Kahn,有限混合估计的最佳速率,预印本,https://arxiv.org/abs/11507.04313, 2015.
[34] N.Ho和X.Nguyen,一些弱可识别有限混合参数估计的收敛速度,Ann.Statist。,44(2016),第2726-2755页·Zbl 1359.62076号
[35] N.Ho和X.Nguyen,关于有限混合参数估计的强可辨识性和收敛速度,Electron。《美国统计杂志》,10(2016),第271-307页·Zbl 1332.62095号
[36] N.Ho和X.Nguyen,分布有限混合中的奇异结构及其对参数估计的影响,预印本,https://arxiv.org/abs/1609.02655, 2016.
[37] H.Holzmann、A.Munk和T.Gneiting,椭圆分布有限混合的可识别性,Scand。《统计杂志》,33(2006),第753-763页·Zbl 1164.62354号
[38] H.Kasahara和K.Shimotsu,测试正态混合回归模型中的成分数量,J.Amer。统计师。协会,110(2015),第1632-1645页·Zbl 1373.62344号
[39] N.M.Kiefer,《关于异质性模型参数化的评论》,工作文件278,康奈尔大学经济系,纽约州伊萨卡,1982年。
[40] K.Kubjas、E.Robeva和B.Sturmfels,EM算法的不动点和非负秩边界,Ann.Statist。,43(2015),第422-461页·Zbl 1308.62035号
[41] L.F.Lee和A.Chesher,《分数测试统计为零时的规范测试》,《计量经济学杂志》,31(1986),第33-61页·Zbl 0615.62146号
[42] S.X.Lee和G.J.McLachlan,关于偏斜正态分布和偏斜t-分布的混合,高级数据分析。分类。,7(2013),第241-266页·Zbl 1273.62115号
[43] E.L.Lehmann和G.Casella,点估计理论,Springer,纽约,1998年·Zbl 0916.62017号
[44] C.Ley和D.Paindaveine,《关于多元偏对称模型的奇异性》,《多元分析杂志》。,101(2010),第1434-1444页·Zbl 1196.60024号
[45] 林天一,多元正态混合模型的最大似然估计,多元分析。,100(2009),第257-265页·Zbl 1152.62034号
[46] T.I.Lin、J.C.Lee和S.Y.Yen,使用斜态正态分布的有限混合建模,Statist。Sinica,17(2007),第909-927页·Zbl 1133.62012年
[47] B.Lindsay,《混合模型:理论、几何和应用》,载于美国国家科学基金会CBMS区域概率统计会议系列,IMS,加利福尼亚州海沃德,1995年·Zbl 1163.62326号
[48] J.Marin、K.Mengersen和C.P.Robert,混合分布的贝叶斯建模和推断,《统计手册》,第25卷,Elsevier,阿姆斯特丹,2005年,第459-507页。
[49] G.J.McLachlan和K.E.Basford,《混合模型:推断和聚类应用》,《统计学:教科书和专著》,马塞尔·德克尔,纽约,1988年·Zbl 0697.62050号
[50] W.Mou,N.Ho,M.J.Wainwright,P.L.Bartlett和M.I.Jordan,《贝叶斯混合模型中幂次后验抽样的多项式时间算法》,手稿,2019年。
[51] X.Nguyen,有限和无限混合模型中潜在混合测度的收敛性,Ann.Statist。,4(2013),第370-400页·Zbl 1347.62117号
[52] M.O.Prates、C.R.B.Cabral和V.H.Lachos,混合:偏斜正态分布的尺度混合的拟合有限混合,J.Stat.Softw。,54 (2013).
[53] A.Rotnitzky、D.R.Cox、M.Bottai和J.Robins,基于似然的奇异信息矩阵推理,伯努利,6(2000),第243-284页·Zbl 0976.62015号
[54] J.Rousseau和K.Mengersen,过量混合模型中后验分布的渐近行为,J.R.Stat.Soc.Ser。B.统计方法。,73(2011),第689-710页·Zbl 1228.62034号
[55] S.W.Schnatter和S.Pyne,单变量和多元偏正态和偏t分布有限混合的贝叶斯推断,生物统计学,11(2009),第317-336页·Zbl 1437.62465号
[56] B.Stumfel,《多项式方程的求解系统》,AMS,普罗维登斯,RI,2002年·Zbl 1101.13040号
[57] W.Toussile和E.Gassiat,使用多点基因型数据进行基于模型聚类的变量选择,高级数据分析。分类。,3(2009年),第109-134页·Zbl 1284.62397号
[58] C.Uhler,高斯图形模型中最大似然估计的几何,Ann.Statist。,40(2012年),第238-261页·Zbl 1246.62140号
[59] S.van de Geer,《M估计中的经验过程》,剑桥大学出版社,英国剑桥,2000年·Zbl 1179.62073号
[60] A.W.van der Vaart,《渐进统计》,剑桥大学出版社,英国剑桥,1998年·Zbl 0910.62001号
[61] C.Villani,《最佳运输主题》,AMS,普罗维登斯,RI,2003年·Zbl 1106.90001号
[62] S.Watanabe,《代数几何与统计学习理论》,剑桥大学出版社,英国剑桥,2009年·Zbl 1180.93108号
[63] 肖绍,曾国庆,多元有理函数极限的确定,科学。中国数学。,57(2014),第397-416页·Zbl 1284.68687号
[64] C.B.Zeller、C.R.B.Cabral和V.H.Lachos,基于偏态正态分布比例混合的稳健混合回归建模,TEST,25(2016),第375-396页·Zbl 1342.62113号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。