×

聚类线性回归模型的最大似然估计和模型选择的尺度约束方法。 (英语) Zbl 1436.62247号

摘要:我们考虑一种等变方法,对方差施加数据驱动的界,以避免在聚类线性回归模型的最大似然估计中出现奇异和伪解。我们研究了它在组件数量选择中的应用,并提出了一种计算快捷方式,它大大减少了调整数据边界所需的计算时间。在仿真研究和两个实际数据应用中,我们表明,与标准的无约束方法相比,所提出的方法能够可靠地评估组件数量,并能准确估计模型参数和恢复聚类。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62J05型 线性回归;混合模型
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿尔福,M。;维维亚尼,S。;Hennig,C。;梅拉,M。;Murtagh,F。;Rocci,R.,《结构模型的有限混合》,《聚类分析手册》,217-240(2016),博卡拉顿:查普曼和霍尔,博卡拉顿·Zbl 1396.62120号
[2] Arlot,S。;Celisse,A.,模型选择的交叉验证程序,Stat Surv,4,40-79(2010)·Zbl 1190.62080号
[3] 巴吉洛夫,AM;Ugon,J。;Mirzayeva,H.,聚类线性回归问题的非光滑非凸优化方法,《欧洲运营研究杂志》,229,1,132-142(2013)·Zbl 1317.90242号
[4] Carbonneau,RA;卡波罗西,G。;Hansen,P.,《基于混合逻辑二次规划的全局最优聚类回归》,《欧洲运营研究杂志》,212,1,213-222(2011)
[5] Cerioli,A。;加西亚·埃斯库德罗,洛杉矶;Mayo-Iscar,A。;Riani,M.,《通过约束可能性发现基于模型的聚类中的组数》,J Compute Graph Stat(2017)
[6] Day,NE,估计两个正态分布混合的成分,Biometrika,56,463-474(1969)·Zbl 0183.48106号
[7] 美联社登普斯特;新墨西哥州莱尔德;Rubin,DB,通过EM算法从不完整数据中获得的最大似然,J R Stat Soc Ser B(Stat Methodol),39,1-38(1977)·Zbl 0364.62022号
[8] Di Mari,R。;Rocci,R。;Gattone,SA,带软尺度约束的聚类线性回归建模,国际J近似推理,91,160-178(2017)·Zbl 1429.62286号
[9] 弗雷利,C。;Raftery,AE,正态混合估计和基于模型聚类的贝叶斯正则化,J Classif,24,2,155-181(2007)·Zbl 1159.62302号
[10] 加西亚·埃斯库德罗,洛杉矶;Gordaliza,A。;格雷塞林,F。;Ingrassia,S.公司。;Mayo Iscar,A.,混合建模中的特征值和约束:几何和计算问题,Adv Data Anal Classif(2017)·Zbl 1505.62152号
[11] Hathaway,RJ,正态混合分布最大似然估计的约束公式,《Ann Stat》,第13期,第795-800页(1985年)·Zbl 0576.62039号
[12] Hennig,C。;Liao,TF,《如何为混合型变量找到合适的聚类并应用于社会经济分层》,J R Stat Soc Ser C,62,3,309-369(2013)
[13] 休伯特,L。;Arabie,P.,比较分区。J Classif,2193-218(1985)
[14] Ingrassia,S.,《多元正态混合模型的基于似然的约束算法》,《统计方法应用》,第13期,第151-166页(2004年)·Zbl 1205.62066号
[15] Ingrassia,S.公司。;Rocci,R.,多元高斯有限混合的约束单调EM算法,计算统计数据分析,51,5339-5351(2007)·Zbl 1445.62116号
[16] Keribin,C.,混合模型阶数的一致估计,Sankhyá,62,49-66(2000)·Zbl 1081.62516号
[17] Kiefer,NM,《离散参数变化:切换回归模型的有效估计》,《计量经济学》,46,427-434(1978)·Zbl 0408.62058号
[18] 基弗,J。;Wolfowitz,J.,无限多附带参数存在下最大似然估计的一致性,《数学统计年鉴》,27886-906(1956)·Zbl 0073.14701号
[19] Kim,D。;Seo,B.,在存在多个局部最大化器的情况下评估高斯混合模型中的组分数量,J Multivar Anal,125100-120(2014)·Zbl 1280.62028号
[20] Koehler,AB;Murphree,ES,选择模型顺序的Akaike和Schwarz标准的比较,应用统计,37187-195(1988)
[21] Leroux,BG,混合分布的一致估计,Ann Stat,201350-1360(1992)·Zbl 0763.62015号
[22] GJ麦克拉克伦;Peel,D.,有限混合模型(2000),纽约:威利,纽约·Zbl 0963.62061号
[23] Quandt,RE,估计转换回归的新方法,美国统计协会杂志,67,338,306-310(1972)·Zbl 0237.62047号
[24] Quandt,RE公司;Ramsey,JB,估计正态分布和切换回归的混合,美国统计学会杂志,73,364,730-738(1978)·Zbl 0401.62024号
[25] Ritter G(2014)稳健聚类分析和变量选择。统计学和应用概率专著,第137卷。CRC出版社·Zbl 1341.62037号
[26] Rocci,R。;南非Gattone;Di Mari,R.,约束高斯混合建模的数据驱动等变方法,高级数据分析分类(2017)
[27] Seo,B。;Kim,D.,正态混合模型中的根选择,计算统计数据分析,562454-2470(2012)·Zbl 1252.62013年
[28] Seo,B。;Lindsay,BG,在正态混合模型中举例说明的双平滑MLE的计算策略,Comput Stat Data Anal,54,8191930-1941(2010)·Zbl 1284.62234号
[29] Smyth P(1996)使用Monte-Carlo交叉验证进行聚类。摘自:第二届知识发现和数据挖掘国际会议论文集,加利福尼亚州门洛帕克,AAAI出版社,第126-133页
[30] Smyth,P.,使用交叉验证可能性进行概率聚类的模型选择,统计计算,10,1,63-72(2000)
[31] 邹,H。;哈斯蒂,T。;Tibshirani,R.,《关于套索的“自由度”》,Ann Stat,35,52173-2192(2007)·Zbl 1126.62061号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。