×

国际贸易数据的半自动稳健回归聚类。 (英语) Zbl 1480.62242号

摘要:本文的目的是在回归聚类中展示如何选择最相关的解决方案,分析其稳定性,并提供关于最佳组数的最佳组合、组间误差方差的限制因子和修剪水平的信息。该程序基于两个步骤。首先,我们将约束稳健多元聚类的信息准则推广到聚类加权模型的情况。与传统方法不同的是,传统方法是基于最小化信息标准(即BIC)找到的最佳解决方案的选择,我们将注意力集中在所谓的最优稳定解决方案上。在第二步中,使用监测方法,选择最佳的修剪因子值。最后,我们使用验证性正向搜索方法验证了该解决方案。基于欧盟口罩贸易新数据集的一个令人鼓舞的例子显示了当前现有程序的局限性。该方法最初应用于稳健回归聚类文献中的一组已知数据集。然后,我们将注意力集中在一组国际贸易数据集上,并在随机开始方法中提供了更新子集的新的信息方法。本着特刊的精神,补充材料深化了对贸易数据的分析,并将建议的方法与文献中现有的方法进行了比较。

MSC公司:

62第20页 统计学在经济学中的应用
62层35 鲁棒性和自适应程序(参数推断)
62H30型 分类和区分;聚类分析(统计方面)
62J05型 线性回归;混合模型
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿特金森,AC;Riani,M.,《向前搜索和数据可视化》,《计算统计》,第19期,第29-54页(2004年)·Zbl 1053.62007年 ·doi:10.1007/bf02915275
[2] 巴拉贝西,L。;Cerasa,A。;佩罗塔,D。;Cerioli,A.,《利用tweedie分布为反欺诈和政策支持建模国际贸易数据》,《欧洲运营研究杂志》,248,3,1031-1043(2015)·Zbl 1346.62154号 ·doi:10.1016/j.ejor.08.042
[3] 比尔纳基,C。;Celeux,G.和Govaert。用综合完全似然评估聚类的混合模型,IEEE Trans-Pattern Ana Mach Intell,22719-725(2000)·doi:10.1109/34.865189
[4] Cerioli,A。;Perrotta,D.,《高密度区域回归线的稳健聚类》,《高级数据分析分类》,8,5-26(2014)·Zbl 1474.62217号 ·doi:10.1007/s11634-013-0151-5
[5] Cerioli,A。;Riani,M。;阿特金森,AC;Corbellini,A.,《监测的力量:如何充分利用受污染的多元样本》(讨论),《统计方法应用》(2017年)·Zbl 1428.62217号 ·doi:10.1007/s10260-017-0409-8
[6] Cerioli,A。;加西亚·埃斯库德罗,洛杉矶;梅奥·伊斯卡尔,A。;Riani,M.,《通过约束可能性在基于模型的聚类中发现正常组的数量》,《计算图统计杂志》,27,414-416(2018)·Zbl 07498957号 ·doi:10.1080/10618602017.1390469
[7] Cerioli,A。;法科梅尼,A。;Riani,M.,《稳健估计和聚类分析的野自适应调整》,《Scand J Stat》,46,1,235-256(2019)·兹比尔1417.62169 ·doi:10.1111/sjos.12349
[8] 德萨博,W。;Cron,W.,《聚类线性回归的最大似然法》,J Classif,5,2,249-282(1988)·Zbl 0692.62052号 ·doi:10.1007/BF01897167
[9] 多托,F。;法科梅尼,A。;加西亚·埃斯库德罗,洛杉矶;Mayo-Iscar,A.,稳健回归聚类的模糊方法,高级数据分析分类,11691-710(2017)·Zbl 1414.62240号 ·doi:10.1007/s11634-016-0271-9
[10] 弗雷利,C。;Raftery,AE,基于模型的聚类、判别分析和密度估计,美国统计协会杂志,97,611-631(2002)·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[11] 加西亚·埃斯库德罗,洛杉矶;Gordaliza,A。;Mayo-Iscar,A。;San Martin,R.,通过修剪实现稳健聚类线性回归,《计算统计数据分析》,54,3057-3069(2010)·Zbl 1284.62198号 ·doi:10.1016/j.csda.2009.07.002
[12] 加西亚·埃斯库德罗,洛杉矶;Gordaliza,A。;格雷塞林,F。;Ingrassia,S.公司。;Mayo-Iscar,A.,《通过调整和约束对随机协变量回归混合物的稳健估计》,《统计计算》,27,377-402(2017)·Zbl 1505.62152号 ·doi:10.1007/s11222-016-9628-3
[13] 加西亚·埃斯库德罗,洛杉矶;Gordaliza,A。;Mayo-Iscar,A。;San Martin,R.,通过修剪实现稳健聚类线性回归,《计算统计数据分析》,54,3057-3069(2010)·Zbl 1284.62198号 ·doi:10.1016/j.csda.2009.07.002
[14] Gershenfeld,N。;Schoner,B。;Metois,E.,时间序列分析的聚类加权模型,《自然》,397,6717,329-332(1999)·doi:10.1038/16873M3
[15] Gershenfeld,N.,《非线性推理和聚类加权建模》,Ann N Y Acad Sci,808,1,18-24(1997)·doi:10.1111/j.1749-6632.1997.tb51651.x
[16] 格雷科,L。;卢卡达莫,A。;Agostinelli,A.,加权似然潜在类线性回归,统计方法应用(2020)·Zbl 1480.62144号 ·doi:10.1007/s10260-020-00540-8
[17] 格鲁恩,B。;Leisch,F.,在r中拟合广义线性回归的有限混合,计算统计数据分析,51,11,5247-5252(2007)·Zbl 1445.62192号 ·doi:10.1016/j.csda.2006.08.014
[18] 约翰逊,荷兰;科茨,S。;Balakrishnan,N.,连续单变量分布-1(1994),纽约:威利出版社,纽约·兹伯利0811.62001
[19] Maitra,R。;Melnykov,V.,《模拟数据以研究有限混合建模和聚类算法的性能》,《计算图形统计杂志》,19,354-376(2010)·doi:10.1198/jcgs.2009.08054
[20] Mazza,A。;Ingrassia,S.公司。;Punzo,A.,集群加权模型的灵活框架,J Stat Softw,86,2,1-30(2018)·doi:10.18637/jss.v086.i02
[21] 佩罗塔,D。;托蒂,F。;Palumbo,F。;中国大陆劳罗;Greenacre,MJ,《使用前向搜索检测欧洲贸易数据中的价格异常值》,《数据分析和分类》(2010年),海德堡:施普林格出版社
[22] Perrotta D、Checchi E、Torti F、Cerasa A、Arnes Novau X(2020)《解决监测数据中的价格和重量异质性以及极端异常值——口罩案例》。技术报告JRC122315,欧盟委员会,联合研究中心,欧盟出版物办公室,卢森堡,ISBN 978-92-76-24707-4。doi:10.2760/817681
[23] Riani,M。;Cerioli,A。;阿特金森,AC;Perrotta,D.,《监测稳健回归》,Electr J Stat,8642-673(2014)·Zbl 1348.62200号
[24] Riani,M。;Cerioli,A。;佩罗塔,D。;Torti,F.,在fsda库中模拟具有固定簇重叠的多元数据混合物,高级数据分析分类,9,4,461-481(2015)·Zbl 1414.62267号 ·doi:10.1007/s11634-015-0223-9
[25] Riani,M。;科尔贝里尼,A。;AC Atkinson,《在非常稳健的回归中使用先验信息进行欺诈检测》,《国际统计评论》,86,2,205-218(2018)·Zbl 07763591号 ·doi:10.1111/insr.12247
[26] 卢梭,P。;佩罗塔,D。;Riani,M。;Hubert,M.,时间序列的稳健监测及其在欺诈检测中的应用,经济统计,9108-121(2019)·doi:10.1016/j.ecosta.2018.5.001
[27] Torti,F.,《向前搜索的进展:方法学和应用贡献》(2011年),帕多瓦伊迪特里斯大学图书馆合作社
[28] 托蒂,F。;佩罗塔,D。;Riani,M。;Cerioli,A.,《评估聚类线性回归数据的修剪方法》,《高级数据分析分类》,第13期,第227-257页(2018年)·Zbl 1459.62010号 ·文件编号:10.1007/s11634-018-0331-4
[29] 托蒂,F。;科尔贝里尼,A。;Atkinson,AC,fsdasas:一个用于非常大数据集的稳健回归的软件包,包括批向前搜索,Stats,4,2,327-347(2021)·doi:10.3390/stats402022
[30] von der Leyen U(2019)《政治指南》。技术报告,欧盟委员会主席
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。