×

基于聚类的\(L2\)重新加权回归。 (英语) Zbl 1487.62076号

小结:提出了一种简单的稳健(L2)回归估计。该方法混合了最小协方差行列式(MCD公司)浓度算法与受控的普通最小二乘回归阶段。然后,层次聚类分析将数据划分为“半集”的主聚类和一个或多个组的次聚类。初始最小二乘回归估计来自“半集”的主簇。然后,使用拟合统计量中的组加性差异来激活小簇,并且受控的加权最小二乘回归产生了一个具有高崩溃值的稳健有效估计量。仿真实验表明,与常用的稳健回归技术相比,该方法在系数的稳健性以及将异常诊断过程与参数估计相结合方面具有优势。

理学硕士:

62J05型 线性回归;混合模型
62层35 鲁棒性和自适应程序(参数推断)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alih,E。;Ong,H.C.,线性模型中基于聚类的多元离群值识别和加权回归,J.Appl。统计(2015)·Zbl 1514.62395号
[2] Atkinson,A.C.,《回归诊断、转换和构建变量》,J.R.Stat.Soc.Ser。B统计方法。,44, 1-36 (1982) ·Zbl 0508.62058号
[3] Austin,P.C.,估计相对风险的不同倾向评分方法的表现,J.Clin。流行病。,61, 537-545 (2008)
[4] Austin,P.C.,倾向核心匹配分析中的I类错误率、置信区间覆盖率和方差估计,国际生物统计杂志。,5 (2009)
[5] Baklizi,A。;Kibria,B.M.G.,《估计偏态总体平均值的一个和两个样本置信区间:实证比较研究》,J.Appl。统计,36,601-609(2009)·兹比尔1473.62098
[6] 巴尼克,S。;Kibria,B.M.G.,估算正偏分布平均值的一些参数型和非参数型单样本置信区间的比较,Comm.Statist。模拟计算。,39, 361-389 (2010) ·Zbl 1183.62051号
[7] 贝克曼,R.J。;库克·R·D·奥利耶。。。s、 技术计量学,25119-149(1983)·Zbl 0514.62041号
[8] 比克尔,P。;Doksum,K。;霍奇斯,J.,(埃里希·莱曼的节日。埃里希·莱曼的圣诞节,华兹华斯国际统计(1982),泰勒和弗朗西斯)
[9] Billor,N。;Chatterjee,S。;Hadi,A.S.,《稳健回归估计的重新加权最小二乘法》,美国数学杂志。管理。科学。,26, 229-252 (2006) ·Zbl 1244.62024号
[10] Birch,J.B。;阿加德,D.B.,《回归中的稳健推断:比较研究》,Comm.Statist。模拟计算。,22, 217-244 (1993)
[11] 卡罗尔·R·J。;Ruppert,D.,《回归中的转换:稳健分析》,技术计量学,27,1-12(1985)·Zbl 0558.62032号
[12] Chatterjee,S。;Mächler,M.,《稳健回归:加权最小二乘法》,Comm.Statist。理论方法,261381-1394(1997)·Zbl 0920.62039号
[13] Dempster,A.P。;Gasko-Green,M.,残差分析的新工具,Ann.Statist。,9, 945-959 (1981) ·Zbl 0477.62052号
[14] 乔治·F。;Kibria,B.M.G.,估计人群信噪比的置信区间:模拟研究,J.Appl。《法律总汇》第39卷,1225-1240页(2012年)·Zbl 1514.62053号
[15] Hample,F.,《超越位置参数:稳健的概念和方法》,Bull。国际统计学会,46,375-382(1975)·Zbl 0349.62029号
[16] 霍金斯博士。;Olive,D.,最小修剪绝对偏差和回归的应用和算法,计算。统计师。数据分析。,32, 119-134 (1999)
[17] 霍金斯博士。;Olive,D.J.,高分解回归估计量重采样算法的不一致性和一种新算法,J.Amer。统计师。协会,97,136-159(2002)·Zbl 1073.62546号
[18] Huber,P。;Ronchetti,E.,(稳健统计,稳健统计,概率统计中的威利级数(2009),威利)·Zbl 1276.62022号
[19] 新罕布什尔州贾达夫。;Kashid,D.N。;Kulkarni,S.R.,存在离群值和多重共线性的多元线性回归中的子集选择,Stat.Methodol。,19, 44-59 (2014) ·Zbl 1486.62203号
[20] Janson,M.A.,《结合稳健和传统最小二乘法:关键评估》,J.Bus。经济。统计人员。,6, 415-427 (1988)
[21] Jensen,D.,回归中的杠杆和子集效率,Stat.Methodol。,7, 541-551 (2010) ·兹比尔1233.62144
[22] Jung,K.-M.,多元最小二乘回归估计,计算。统计师。数据分析。,48, 307-316 (2005) ·Zbl 1429.62293号
[23] 考夫曼,L。;Rousseeuw,P.,(《数据中的发现群体:聚类分析导论》,《数据中发现群体:集群分析导论,概率统计中的威利级数》(2009),威利出版社)·Zbl 1345.62009号
[24] B.M.G.Kibria。;Banik,S.,估计两个偏倚总体均值差异的参数和非参数置信区间,J.Appl。统计,40,2617-2636(2013)·Zbl 1514.62667号
[25] Kibria,B.G。;George,F.,用于测试泊松分布平均值的一些测试统计数据的经验比较,Appl。申请。数学。,30, 1814-1829 (2011)
[26] B.M.G.Kibria。;George,F.,《人口信噪比测试方法》,Comm.Statist。模拟计算。,43, 443-461 (2014) ·Zbl 1291.62053号
[27] Lange,K.L。;Little,R.J。;Taylor,J.M.,使用t分布的稳健统计建模,J.Amer。统计师。协会,84,881-896(1989)
[28] 劳伦斯,D.E。;Birch,J.B。;Chen,Y.,基于聚类的有界影响回归,Qual。Reliab公司。《工程国际》,30,97-109(2014)
[29] Lee,J.,纸浆纤维和纸张性能之间的关系(1992年),多伦多大学林业学院,(未发表博士论文)
[30] Li,G.,《稳健回归》,281-343(2006),John Wiley and Sons,Inc。
[31] Lipovetsky,S.,等距回归建模,模型辅助。统计申请。,2, 71-80 (2007) ·Zbl 1121.62065号
[32] Lipovetsky,S。;Conklin,W.,{IRLS}方法中的潜在类回归模型,数学。计算。建模,42,301-312(2005)·Zbl 1079.62063号
[33] Lipovetsky,S。;Conklin,M.,《通过判别分析通过数据段进行回归》,《现代应用杂志》。统计师。方法,4,7(2005)
[34] Maronna,R。;马丁·D·。;Yohai,V.,(稳健统计学:理论和方法。稳健统计学:原理和方法,概率统计中的威利级数(2006),威利)·兹比尔1094.62040
[35] Maronna,R.A。;Zamar,R.H.,高维数据集位置和离散度的稳健估计,技术计量学,44,307-317(2002)
[36] Myers,R.,(经典与现代回归与应用。经典与现代的回归与应用,杜克斯伯里经典系列(2000),杜克斯伯里/汤普森学习)
[37] Pison,G。;Van Aelst,S。;Willems,G.,LTS和MCD的小样本修正,Metrika,55,111-123(2002)·Zbl 1320.62060号
[38] Rousseeuw,P.J.,最小二乘回归中值,J.Amer。统计师。协会,79,871-880(1984)·Zbl 0547.62046号
[39] Rousseeuw,P.J。;Aelst,S.V.公司。;德莱森,K.V。;Agulló,J.,稳健多元回归,技术计量学,46293-305(2004)
[40] Rousseeuw,P.J。;Driessen,K.V.,最小协方差行列式估计的快速算法,《技术计量学》,41,212-223(1999)
[41] 卢梭,P。;Leroy,A.,(稳健回归和异常值检测。稳健回归与异常值检测,概率统计中的威利级数(2003),威利)·兹比尔0711.62030
[42] Shi,W。;Kibria,B.M.G.,《关于估计偏态总体平均值的一些置信区间》,国际出版社。数学杂志。编辑科学。技术,38,412-421(2007)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。