×

线性回归中同时选择变量和识别异常值的方法。 (英语) Zbl 0900.62352号

小结:我们提出了一种基于后验模型概率计算的同时变量选择和异常值识别方法。这避免了您选择的模型取决于变量选择和异常值识别的执行顺序的问题。我们的方法可以找到多个离群值,并且在识别屏蔽离群值方面似乎很成功。我们还通过贝叶斯模型平均来解决模型不确定性问题。对于模型数量较大的问题,我们建议使用马尔可夫链蒙特卡罗方法来近似所有可能变量和异常值空间上的贝叶斯模型平均值。描述了实现此方法的软件。在一个例子中,我们表明,与可能合理选择的任何单个模型相比,通过同时变量选择和离群值识别进行模型平均可以提高预测性能,并提供更准确的预测区间。

MSC公司:

62J05型 线性回归;混合模型
62J20型 诊断、线性推理和回归
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Adams,J.L.:评估回归策略的计算机实验。程序。美国统计协会统计计算部分,55-62(1991)
[2] 阿特金森,A.C.:绘图、转换和回归。(1985年)·Zbl 0582.62065号
[3] 阿特金森,A.C.:蒙面。Biometrika生物计量学73533-541(1986)·Zbl 0614.62092号
[4] Atkinson,A.C.:关于“有影响力的观察、高杠杆点和线性回归中的异常值”的评论。统计师。科学。1, 397-402 (1986)
[5] 阿特金森,A.C.:无遮蔽的转变。技术计量学30,311-318(1988)·Zbl 0651.62070号
[6] 巴内特,V。;Lewis,T.:统计数据中的异常值。(1994) ·Zbl 0801.62001
[7] 贝萨格,J.E。;Higdon,D.M.:农业田间试验的贝叶斯推断。牛。国际统计局。inst.55,121-136(1993)
[8] 布莱特纳,M。;Sauerbrei,W.:建模策略对病例对照研究结果的影响。统计师。医学12,1325-1388(1993)
[9] 布鲁姆菲尔德,P。;Steiger,W.L.:最小绝对偏差:理论、应用和算法。(1983) ·Zbl 0536.62049号
[10] 盒子,G.E.P。;Tiao,G.C.:一些异常问题的贝叶斯方法。《生物特征》55,119-129(1968)·Zbl 0159.47901号
[11] 布朗利,K.A.:《科学与工程中的统计理论与方法》(1965)·Zbl 0136.39203号
[12] 钱伯斯,R.L。;Heathcote,C.R.:关于线性回归中斜率的估计和异常值的识别。《生物特征》68,21-33(1981)·Zbl 0463.62061号
[13] Chatterjee,S。;Hadi,A.S.:影响性观察、高杠杆点和线性回归中的异常值。统计师。科学。1, 379-416 (1986) ·Zbl 0633.62059号
[14] 克莱德,M。;Desimone,H。;Parmigiani,G.:通过正交模型混合进行预测。(1994年)·Zbl 0880.62026号
[15] 丹尼尔,C。;Wood,F.S.:将方程与数据拟合。(1980) ·Zbl 0418.65006号
[16] Draper,D.:模型不确定性的评估和传播(讨论)。J.罗伊。统计师。soc.B 57,45-97(1995)·Zbl 0812.62001号
[17] Garthwaite,P.H。;Dickey,J.M.:引证回归中变量选择问题的先验分布。安。统计师。20, 1697-1719 (1992) ·Zbl 0786.62043号
[18] Geisser,S.:关于科学建模和稳健性中的抽样和贝叶斯推断的讨论(G.E.P.Box)。J.罗伊。统计师。soc.A 143,416-417(1980)
[19] E.I.乔治。;Mcculloch,R.E.:通过吉布斯抽样进行变量选择。J.阿默尔。统计师。协会88、881-890(1993)
[20] E.I.乔治。;Mcculloch,R.E.:快速贝叶斯变量选择。CSS技术报告94-01(1994)
[21] 很好,I.J.:理性的决定。J.罗伊。统计师。社会学委员会B 14,107-114(1952)
[22] 格特曼,I。;杜特,R。;Freeman,P.R.:关注和处理一般线性模型中的单变量异常值,以检测虚假性。技术计量学20187-193(1978)·Zbl 0408.62059号
[23] Hadi,A.S.:线性回归中识别多个异常值的逐步程序。程序。美国统计协会统计计算部分,137-142(1990)
[24] Hadi,A.S.:线性回归中整体潜在影响的新度量。计算。中央集权主义者。数据分析。14, 1-27 (1992) ·兹比尔0875.62302
[25] 霍金斯,D.M.:异常值的识别。(1980) ·Zbl 0438.62022号
[26] 海伯格,R。;Becker,R.A.:使用迭代加权最小二乘设计稳健回归的S函数。AT&T统计研究报告(1991)
[27] Hettmansperger,T.P。;Sheather,S.J.:关于最小二乘法的警告。阿默尔。中央集权主义者。46, 79-83 (1992)
[28] 霍格林特区。;Mosteller,F。;Tukey,J.W.:理解稳健和探索性数据分析。(1983) ·Zbl 0599.62007号
[29] Hoeting,J.A.:线性回归中模型不确定性的解释。博士论文(1994)
[30] 霍廷,J。;Raftery,A.E。;Madigan,D.:线性回归中的同时变量和变换选择。技术报告9506(1995)
[31] 卡丹·J·B。;Dickey,J.M。;Winkler,R.L。;Smith,W.S。;Peters,S.C.:正态线性模型的交互式观点启发。J.阿默尔。统计师。协会75、845-854(1980)
[32] Kass,R.E。;Raftery,A.E.:贝叶斯因素。J.阿默尔。统计师。协会90、773-795(1995)·Zbl 0846.62028号
[33] Kianifard,F。;Swallow,W.H.:使用基于自适应排序观测计算的递归残差来识别线性回归中的异常值。生物统计学45,571-585(1989)·Zbl 0715.62144号
[34] Lange,K.L。;Little,R.J.A。;Taylor,J.M.G.:使用t分布的稳健统计建模。J.阿默尔。统计师。协会84、881-896(1989)
[35] Leamer,E.:规范搜索:用非实验数据进行特殊推断。(1978年)·Zbl 0384.62089号
[36] Madigan,D。;Raftery,A.E.:使用奥卡姆窗口的图形模型中的模型选择和模型不确定性说明。J.阿默尔。统计师。协会89,1535-1546(1994)·Zbl 0814.62030号
[37] Madigan,D。;约克·J:离散数据的贝叶斯图形模型。国际。中央集权主义者。第63版,215-232(1995)·Zbl 0834.62003号
[38] Marasinghe,M.G.:检测线性回归中几个异常值的多阶段程序。《技术计量学》27,395-399(1985)
[39] Neter,J。;Wasserman,W。;Kutner,M.:应用线性统计模型。(1990)
[40] Pettit,L.I.:使用虚拟观测设备的异常值模型的贝叶斯因子。J.阿默尔。统计师。协会87,541-545(1992)
[41] Raftery,A.E.:近似贝叶斯因子和广义线性模型中模型不确定性的解释。技术报告255(1993)
[42] Raftery,A.E。;Madigan,D。;Hoeting,J.:线性回归模型的贝叶斯模型平均。技术报告9412(1994)·Zbl 0888.62026号
[43] 皇家君威。;Hook,E.B.:模型选择对封闭总体大小置信区间的影响。统计师。医学博士10,717-721(1991)
[44] Rousseeuw,P.J.:最小二乘回归。J.阿莫尔。统计师。协会79,871-888(1984)·Zbl 0547.62046号
[45] Rousseeuw,P.J。;Leroy,A.M.:稳健回归和异常值检测。(1987) ·Zbl 0711.62030号
[46] A.F.M.史密斯。;Roberts,G.O.:通过吉布斯采样器和相关马尔可夫链蒙特卡罗方法进行贝叶斯计算。J.罗伊。统计师。soc.B 55,3-24(1993)·Zbl 0779.62030号
[47] 塔普林,R。;Raftery,A.E.:存在异常值和生育率跳跃的农业田间试验分析。生物统计学50,764-781(1994)·Zbl 0825.62777号
[48] Verdinelli,I。;Wasserman,L.:使用吉布斯采样器对异常值问题进行贝叶斯分析。统计师。计算。1, 105-117 (1991)
[49] Weisberg,S.:应用线性回归。(1985) ·Zbl 0646.62058号
[50] West,M.:贝叶斯线性回归中的离群模型和先验分布。J.罗伊。统计师。soc.B 46,431-439(1984)·Zbl 0567.62022号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。