×

多相回归模型的鲁棒算法。 (英语) Zbl 1481.62039号

摘要:本文提出了一种解决多相回归问题的稳健方法,该方法能够有效处理由于测量误差或重尾分布引起的非典型观测数据污染的数据。将期望和最大化算法与M估计技术相结合,我们同时得出了变化点和回归参数的稳健估计,然而,由于所提出的方法仍然不能抵抗高杠杆率的离群值,我们进一步建议了一个修改的版本,首先适度地修剪这些离群值然后对修剪后的数据实施新的程序。本研究使用Huber损失函数和Tukey的双权函数建立了两种鲁棒算法,分别替代基于正态分布的期望和最大化算法中的最小二乘准则,通过大量仿真和灵敏度分析说明了所提算法的有效性和优越性。实验结果表明,该方法能够抵抗异常值和重尾分布。此外,由于对高杠杆离群值的抵抗特别重要,因为它们对数据拟合回归模型具有破坏性影响,各种实际应用表明了该方法的实用性。

MSC公司:

62J05型 线性回归;混合模型
62层35 鲁棒性和自适应程序(参数推理)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Khodadadi,A.,M Asgharian,《变点问题与回归:注释参考书目》,COBRA预印本系列(2008)44,http://biostats.bepress.com/cobra/art44。
[2] Muggeo,V.M.R.,Segmented:一个R包,用于拟合具有断线关系的回归模型,新闻。R项目。,8, 20-25 (2008)
[3] 洛斯基,R.H。;庞特尔,J.G。;Cruz,F.R.B.,线性回归模型的多变化点分析,Chil。J.Stat.,193-112(2010)·Zbl 1213.62046号
[4] Chang,S.T。;Lu,K.P。;Yang,M.S.,回归模型的模糊变点算法,IEEE Trans。模糊系统。,23, 2343-2357 (2015)
[5] 刘杰。;Wu,S。;Zidek,J.V.,《分段多元回归》,Stat.Sin。,7, 497-525 (1997) ·Zbl 1003.62524号
[6] R.沃纳。;瓦列夫,D。;达诺夫,D。;Guineva,V.,《通过分段回归研究全球和半球温度序列中的结构突变点》,《高级空间研究》,56,2323-2334(2015)
[7] 汤姆斯,J.D。;米歇尔·维拉德。A.,阈值检测:将统计方法与生态问题和保护规划目标相匹配,Avian Conserve。经济。,10, 1, 2 (2015)
[8] Frick,K。;Munk,A。;Sienling,H.,多尺度变化点推断,J.R.Stat.Soc.Ser。B.统计方法。,76, 495-580 (2014) ·Zbl 1411.62065号
[9] 佩因,F。;西林,H。;Munk,A.,《异质变化点推断》,J.R.Stat.Soc.Ser。B.统计方法。,79, 1207-1227 (2017) ·Zbl 1373.62258号
[10] 邹,C。;尹,G。;冯·L。;Wang,Z.,多变点问题的非参数最大似然方法,《Ann.Stat.》,42,970-1002(2014)·Zbl 1305.62158号
[11] Haynes,K。;费恩黑德,P。;Eckle,I.A.,一种用于变化点检测的计算效率高的非参数方法,《统计计算》。,271293-1305(2017)·Zbl 1505.62181号
[12] Arlot,S。;塞利斯,A。;Harchaoui,Z.,《基于模型选择的核多变点算法》(2016),hal-00671174v3
[13] 查卡尔,S。;Lebarbier,E。;Lévy-Leduc,C。;Robin,S.,估计AR(1)过程平均值变化点的稳健方法,Bernoulli,231408-1447(2017)·Zbl 1378.62059号
[14] 拉朱吉,R。;巴赫,F。;Arlot,S.,约束划分问题的大边缘度量学习,(第31届机器学习国际会议(ICML)论文集)。第31届机器学习国际会议(ICML)论文集,中国北京(2014),297-395
[15] 基利克,R。;费恩黑德,P。;Eckley,I.A.,用线性计算成本优化检测变化点,美国统计协会,107,1590-1598(2012)·Zbl 1258.62091号
[16] 梅德斯通,R。;霍金,T。;Rigaill,G.公司。;Fearnhead,P.,《关于大数据的最优多变化点算法》,Stat.Comput。,27, 519-533 (2017) ·Zbl 1505.62269号
[17] Fryzlewicz,P.,《用于多变化点检测的野生二进制分割》,《Ann.Stat.》,42,2243-2281(2014)·Zbl 1302.62075号
[18] 费恩黑德,P。;Rigaill,G.,《存在离群值时的变化点检测》,美国统计协会,114169-183(2018)·Zbl 1478.62238号
[19] Maronna,R.A。;马丁·R·D。;尤海,V.J.,《稳健统计:理论和方法》(2006),威利出版社:威利纽约·兹比尔1094.62040
[20] Bai,J.,《绝对偏差最小的多变量回归估计》,J.Stat.Plan。推理,74103-134(1998)·Zbl 0952.62021号
[21] Ciuperca,G.,《用lad方法估计有变点和无变点的非线性回归》,《Ann.Inst.Stat.Math.》。,63, 717-743 (2011) ·Zbl 1230.62089号
[22] Yang,F.,使用EM算法通过拉普拉斯线性回归进行稳健均值变化点检测,J.Appl。数学。(2014年)·Zbl 1442.62158号
[23] Jafaril,A。;Yarmohammadil,M。;Rasekhi,A.,检测两相拉普拉斯模型中变化点的贝叶斯分析,科学。Res.随笔,11787-193(2016)
[24] Osorio,F。;Galea,M.,《学生t线性回归模型中变化点的检测》,Stat.Pap。,45, 31-48 (2005) ·Zbl 1086.62077号
[25] Lin,J.G。;Ghen,J。;Li,Y.,具有未知变化点的学生线性回归的贝叶斯分析及其在股票数据分析中的应用,计算机。经济。,40, 203-217 (2012)
[26] Hawkins,D.M.,将多个变点模型拟合到数据,计算。统计数据分析。,37, 323-341 (2001) ·Zbl 0990.62019号
[27] 张,F。;Li,Q.,稳健折线回归,J.Stat.Plan。推断,185,41-55(2017)·Zbl 1360.62390号
[28] 施,S。;李毅。;Wan,C.,具有多个变化点的稳健连续分段线性回归模型,J.Supercomput。(2018)
[29] Muggeo,V.M.R.,《用未知断点估计回归模型》,《Stat.Med.》,第22期,第3055-3071页(2003年)
[30] Chen,C.W.S。;Chan,J.S。;Gerlach,K.R。;谢伟林,带变点回归模型估计量的比较,统计计算。,21, 395-414 (2011) ·Zbl 1255.62194号
[31] 胡贝尔,P.J。;Ronchetti,E.M.,《稳健统计》(2009),威利出版社:威利纽约·Zbl 1276.62022号
[32] 汉佩尔,F.R。;Ronchetti,E.M。;Rousseeuw,P.J。;Stahel,W.A.,《稳健统计:基于影响函数的方法》(1986),威利:威利纽约·Zbl 0593.62027号
[33] Bai,X。;姚,W。;Boyer,J.E.,混合回归模型的稳健拟合,计算。统计师。数据分析。,5622347-2359(2012年)·Zbl 1252.62011年
[34] Lu,K.P。;Chang,S.T.,分段回归模型的模糊分类方法,应用。软计算。,69, 671-688 (2018)
[35] Rousseeuw,P·J。;Leroy,A.M.,《稳健回归和异常检测》(1987),Wiley-Interscience:Wiley-Interscience纽约·Zbl 0711.62030号
[36] Rousseeuw,P.J.,平方回归的最小中值,美国统计协会,79,871-880(1984)·兹伯利0547.62046
[37] Lopuhaa,H.P。;Rousseeuw,P.J.,多元位置和协方差矩阵的仿射等变估计的分解点,《统计年鉴》,19,229-248(1991)·Zbl 0733.62058号
[38] Rousseeuw,P.J。;Van Driessen,K.,最小协方差行列式估计的快速算法,技术计量学,41,212-223(1999)
[39] Pison,G。;Van Aelst,S。;Willems,G.,LTS和MCD的小样本修正,Metrika,55,111-123(2002)·Zbl 1320.62060号
[40] 姚,W。;魏毅。;Yu,C.,使用t分布的稳健混合回归,计算。统计数据分析。,71, 116-127 (2014) ·Zbl 1471.62227号
[41] 奈科夫,N。;Filzmoser,P。;迪莫娃,R。;Neytchev,P.,使用修剪似然估计对混合物进行稳健拟合,计算。统计数据分析。,52, 299-308 (2007) ·Zbl 1328.62033号
[42] Karlis,D。;Xekalaki,E.,为有限混合物的EM算法选择初始值,计算。统计数据分析。,41, 577-590 (2003) ·Zbl 1429.62082号
[43] Garland,T.,《陆生哺乳动物最大跑步速度与体重之间的关系》,J.Zool。,199, 157-170 (1983)
[44] Grubbs,F.E.,《检验离群观测值的样本标准》,《数学年鉴》。Stat.,21,27-58(1950)·Zbl 0036.21003号
[45] Ryan,S。;Porth,L.,《分段回归法应用于推移质输运数据的教程》,1-41(2007),美国农业部林务局落基山研究站柯林斯堡:美国农业部林务局落基山研究站科林斯堡公司
[46] 奥斯·鲁阿奈德,J.J.K。;Fitzgerald,W.J.,《应用于信号处理的数值贝叶斯方法》(1996),Springer:Springer New York·兹比尔0871.62025
[47] Ciuperca,G.,《确定变化点数量的通用标准》,Stat.Probab。莱特。,81, 1267-1275 (2011) ·Zbl 1219.62110号
[48] Seber,G.A.F。;Wild,C.J.,非线性回归(2003),威利:威利纽约·Zbl 0721.62062号
[49] Anderson,R.,稳健回归的现代方法(2008),Sage
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。