×

贝叶斯限制似然方法:贝叶斯回归中的不充分统计条件(附讨论)。 (英语) Zbl 07808156号

摘要:贝叶斯方法已经证明自己在一系列科学问题上是成功的,并且与竞争方法相比有许多有据可查的优势。然而,这些方法在两大类普遍存在的问题上遇到了困难:处理具有离群值的数据集和处理模型错误指定。我们概述了以前解决这两个问题的方法的缺点,并提出了一种新的替代方法。使用新方法时,通过一组不充分的统计信息对数据进行汇总,以感兴趣的推断量为目标,并使用汇总统计信息而非完整数据更新先验分布。通过仔细选择条件统计量,我们保留了贝叶斯方法的主要优点,同时降低了分析对条件统计量未捕获的数据特征的敏感性。为了降低对异常值的敏感性,经典稳健估计量(例如,M-估计量)是条件统计的自然选择。这项工作的主要贡献是为线性模型和一大类汇总统计量开发了数据增强马尔可夫链蒙特卡罗(MCMC)算法。我们在包含离群值和模型错误的模拟和实际数据集上演示了该方法。与竞争方法相比,成功表现在对感兴趣的数据点具有更好的预测性能。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Beaumont,M.A.、Cornuet,J.-M.、Marin,J.-M和Robert,C.P.(2009年)。“自适应近似贝叶斯计算。”生物特征, 96(4): 983-990. 数字对象标识符:10.1093/biomet/asp052谷歌学者:查找链接MathSciNet:MR2767283 zbMATH:05650366·Zbl 1437.62393号 ·doi:10.1093/biomet/asp052
[2] Beaumont,M.A.、Zhang,W.和Balding,D.J.(2002)。“群体遗传学中的近似贝叶斯计算。”遗传学, 162: 2025-2035.
[3] Berger,J.(2006)。《客观贝叶斯分析案例》,贝叶斯分析,1:385-402。数字对象标识符:10.1214/06-BA115谷歌学者:查找链接MathSciNet:MR22221271欧几里得:欧几里得.ba/11340371035 zbMATH:133162042·Zbl 1331.62042号 ·doi:10.1214/06-BA115
[4] Bernardo,J.M.和Smith,A.(2000年)。贝叶斯理论。John Wiley&Sons Ltd.数字对象标识符:10.1002/9780470316870谷歌学者:查找链接数学科学网:MR1274699·Zbl 0943.62009号 ·doi:10.1002/9780470316870
[5] Clarke,B.和Ghosh,J.K.(1995年)。“平均后验收敛”,《统计年鉴》,23:2116-2144。数字对象标识符:10.1214/aos/1034713650谷歌学者:查找链接MathSciNet:MR1389868 zbMATH:0854.62023·Zbl 0854.62023号 ·doi:10.1214/aos/1034713650
[6] 克拉克,J.L.,克拉克,B.,余,C.-W.等人(2013)。“有限样本下M-完全问题的预测”,贝叶斯分析,8(3):647-690。数字对象标识符:10.1214/13-BA826谷歌学者:查找链接MathSciNet:MR3102229 zbMATH:1329.62121·Zbl 1329.62121号 ·doi:10.1214/13-BA826
[7] Clyde,M.和George,E.I.(2004年)。“模型不确定性”,《统计科学》,81-94。数字对象标识符:10.1214/08834230400000035谷歌学者:查找链接数学科学网:MR2082148·Zbl 1062.62044号 ·doi:10.1214/0883423040000035
[8] Clyde,M.A.和Iversen,E.S.(2013)。“M-open框架中的贝叶斯模型平均”,《贝叶斯理论与应用》。数字对象标识符:10.1093/acprof:oso/9780199695607.003.0024谷歌学者:查找链接数学科学网:MR3221178·doi:10.1093/acprof:oso/9780199695607.003.0024
[9] Doksum,K.A.和Lo,A.Y.(1990年)。“基于部分信息定位的一致且稳健的贝叶斯程序”,《统计年鉴》,18:443-453。数字对象标识符:10.1214/aos/1176347510谷歌学者:查找链接MathSciNet:MR1041403 zbMATH:0701.62043·Zbl 0701.62043号 ·doi:10.1214/aos/1176347510
[10] Drovandi,C.、Pettitt,A.和Lee,A.(2015)。“使用参数辅助模型的贝叶斯间接推断”,《统计科学》,30:72-95。数字对象标识符:10.1214/14-STS498谷歌学者:查找链接数学科学网:MR3317755·Zbl 1332.62088号 ·doi:10.1214/14-STS498
[11] Fearnhead,P.和Prangle,D.(2012年)。“为近似贝叶斯计算构建摘要统计:半自动近似贝叶斯计算”,《皇家统计学会期刊:B辑》,74:419-474。数字对象标识符:10.1111/j.1467-9868.2011.010.10.x谷歌学者:查找链接数学科学网:MR2925370 zbMATH:1411.62057·Zbl 1411.62057号 ·文件编号:10.1111/j.1467-9868.2011.010.10.x
[12] Garthwaite,P.H.、Kadane,J.B.和O’Hagan,A.(2005)。《概率分布统计方法》,《美国统计协会期刊》,100:680-701。数字对象标识符:10.1198/0162145050000000105谷歌学者:查找链接数学科学网:MR2170464·兹比尔1117.62340 ·doi:10.19198/0162114505000000105
[13] Gelfand,A.E.和Smith,A.F.M.(1990)。《基于抽样的边际密度计算方法》,《美国统计协会杂志》,85:398-409。数字对象标识符:10.1080/01621459.1990.10476213谷歌学者:查找链接数学科学网:MR1141740 zbMATH:0702.6202·Zbl 0702.62020号 ·网址:10.1080/01621459.1990.10476213
[14] Gelman,A.(2006)。“多级(层次)建模:它能做什么和不能做什么。”技术计量学, 48(3): 432-435. 数字对象标识符:10.1198/004017005000000661谷歌学者:查找链接数学科学网:MR2252307·doi:10.1198/004017005000000661
[15] Hampel,F.R.(1971)。“稳健性的一般定性定义”,《数理统计年鉴》,42:1887-1896。数字对象标识符:10.1214/aoms/1177693054谷歌学者:查找链接MathSciNet:MR0301858 zbMATH:0229.62041·Zbl 0229.62041号 ·doi:10.1214/aoms/1177693054
[16] 黑斯廷斯,W.K.(1970)。“使用马尔可夫链的蒙特卡罗采样方法及其应用。”生物特征, 57: 97-109. 数字对象标识符:10.1093/biomet/57.1.97谷歌学者:查找链接MathSciNet:MR3363437 zbMATH:0219.65008·Zbl 0219.65008号 ·doi:10.1093/biomet/57.1.97
[17] Hoff,P.、Fosdick,B.、Volfovsky,A.和Stovel,K.(2013)。“固定等级提名网络的可能性”,《网络科学》,1:253-277。
[18] Huber,P.和Ronchetti,E.(2009年)。稳健统计。概率与统计学中的威利级数。新泽西州霍博肯:John Wiley&Sons,Inc,第二版。数字对象标识符:10.1002/9780470434697谷歌学者:查找链接数学科学网:MR2488795·Zbl 1276.62022号 ·doi:10.1002/9780470434697
[19] Huber,P.J.(1964年)。“位置参数的稳健估计”,《数理统计年鉴》,35(1):73-101。数字对象标识符:10.1214/aoms/177703732谷歌学者:查找链接MathSciNet:MR0161415 Euclid:Euclid.aoms/1177703732 zbMATH:0136.39805·Zbl 0136.39805号 ·doi:10.1214/aoms/1177703732
[20] Hwang,H.、So,B.和Kim,Y.(2005)。“关于限制后验分布。”测试, 14: 567-580. 数字对象标识符:10.1007/BF02595418谷歌学者:查找链接数学科学网:MR2211395·Zbl 1087.62038号 ·doi:10.1007/BF02595418
[21] Joyce,P.和Marjoram,P.(2008年)。“近似充分统计学和贝叶斯计算”,统计学在遗传学和分子生物学中的应用,7(1)。数字对象标识符:10.2202/1544-6115.1389谷歌学者:查找链接数学科学网:MR2438407·Zbl 1276.62077号 ·doi:10.202/1544-6115.1389
[22] Jung,Y.、MacEachern,S.和Lee,Y.(2014)。“通过异常值修剪进行交叉验证”。正在准备中。
[23] Kass,R.E.和Raftery,A.E.(1995)。“贝叶斯因素”,《美国统计协会杂志》,90:773-795。数字对象标识符:10.1080/01621459.1995.10476572谷歌学者:查找链接数学科学网:MR3363402 zbMATH:0846.62028·Zbl 0846.62028号 ·doi:10.1080/01621459.1995.10476572
[24] Kass,R.E.和Wasserman,L.(1995)。“嵌套假设的参考贝叶斯检验及其与施瓦兹标准的关系”,《美国统计协会杂志》,90(431):928-934。数字对象标识符:10.1080/01621459.1995.10476592谷歌学者:查找链接数学科学网:MR1354008 zbMATH:0851.6202·Zbl 0851.62020号 ·doi:10.1080/01621459.1995.10476592
[25] Lee,J.和MacEachern,S.N.(2014)。“高维贝叶斯推理中的推理功能”,《统计学及其接口》,7(4):477-486。数字对象标识符:10.4310/SII.2014.v7.n4.a5谷歌学者:查找链接数学科学网:MR3302376 zbMATH:1388.62143·Zbl 1388.62143号 ·doi:10.4310/SII.2014.v7.n4.a5
[26] Lewis,J.(2014)。“贝叶斯限制似然方法”,俄亥俄州立大学博士论文。数学科学网:MR3337628
[27] Lewis,J.、Lee,Y.和MacEachern,S.(2012年)。“通过混合范式进行稳健推断”,《JSM学报》贝叶斯统计科学部分,1773-1786年。美国统计协会。
[28] Lewis,J.R.、MacEachern,S.N.和Lee,Y.(2021)。“贝叶斯限制似然方法:贝叶斯回归中统计不足的条件”的补充材料贝叶斯分析。数字对象标识符:10.1214/21-BA1257SUPP谷歌学者:查找链接·doi:10.1214/21-BA1257SUPP文件
[29] Liang,F.、Paulo,R.、Molina,G.、Clyde,M.A.和Berger,J.O.(2008)。“贝叶斯变量选择的g先验混合”,《美国统计协会期刊》,103:410-423。数字对象标识符:10.1198/0162145000001337谷歌学者:查找链接MathSciNet:MR2420243 zbMATH:05564499·Zbl 1335.62026号 ·doi:10.19198/0162114507000001337
[30] Liu,J.S.(1994)。“贝叶斯计算中的坍塌吉布斯采样器及其在基因调控问题中的应用”,《美国统计协会杂志》,89:958-966。数学科学网:MR1294740·Zbl 0804.62033号
[31] Marjoram,P.、Molitor,J.、Plagnol,V.和Tavaré,S.(2003)。《没有可能性的马尔可夫链蒙特卡罗》,美国国家科学院学报,100:15324-15328。
[32] Maronna,R.、Martin,D.和Yohai,V.(2006年)。稳健统计学:理论与方法。概率与统计学中的威利级数。英国西苏塞克斯:John Wiley&Sons,Ltd.数字对象标识符:10.1002/0470010940谷歌学者:查找链接数学科学网:MR2238141·邮编1094.62040 ·doi:10.1002/0470010940
[33] Miao,J.和Ben-Israel,A.(1992年)。“关于\[{mathbb{R}^n}\]子空间之间的主角”,《线性代数及其应用》,171:81-98。数字对象标识符:10.1016/0024-3795(92)90251-5谷歌学者:查找链接数学科学网:MR1165446·Zbl 0779.15003号 ·doi:10.1016/0024-3795(92)90251-5
[34] O'Hagan,A.、Buck,C.E.、Daneshkhah,A.,Eiser,J.R.、Garthwaite,P.H.、Jenkinson,D.J.、Oakley,J.E.和Rakow,T.(2006年)。不确定判断:引出专家的可能性。约翰·威利父子公司。兹马特:1269.62009·Zbl 1269.62009号
[35] Pettitt,A.N.(1982)。《使用基于等级的可能性进行线性模型推断》,《皇家统计学会杂志》。B系列,44:234-243。数学科学网:MR0676214 zbMATH:0493.62044·Zbl 0493.62044号
[36] Pettitt,A.N.(1983年)。《使用配对的签名等级进行基于可能性的推断》,《皇家统计学会杂志》。B系列,45:287-296。数学科学网:MR0676214 zbMATH:0529.62031·Zbl 0529.62031号
[37] Pratt,J.W.(1965年)。《标准推理语句的贝叶斯解释》,《皇家统计学会杂志》。B系列,27:169-203。数学科学网:MR0196830 zbMATH:0142.15203·Zbl 0142.15203号
[38] Pritchard,J.K.、Seielstad,M.T.、Perez-Lezaun,A.和Feldman,M.W.(1999)。“人类Y染色体的群体增长:Y染色体微卫星的研究”,《分子生物学与进化》,16:1791-1798。
[39] Ratcliff,R.(1993)。“处理反应时间异常值的方法”,《心理学公报》,114:510。
[40] Ronchetti,E.、Field,C.和Blanchard,W.(1997)。“通过交叉验证进行稳健线性模型选择”,《美国统计协会杂志》,92:1017-1023。数字对象标识符:10.2307/2965566谷歌学者:查找链接MathSciNet:MR1482132 zbMATH:1067.62551·Zbl 1067.62551号 ·doi:10.2307/2965566
[41] Rousseeuw,P.J.和Leroy(1987)。稳健回归和异常值检测。约翰·威利父子公司。数字对象标识符:10.1002/0471725382谷歌学者:查找链接数学科学网:MR0914792·兹比尔0711.62030 ·doi:10.1002/0471725382
[42] Savage,I.R.(1969年)。“非参数统计:个人评论”,《Sankhya:印度统计杂志》,A辑(1961-2002),31:107-144。数学科学网:MR0248950·Zbl 0193.47403号
[43] Stigler,S.M.(1977年)。“稳健估计是否适用于实际数据?”《统计年鉴》,5(6):1055-1098。数学科学网:MR0455205 zbMATH:0374.62050·Zbl 0374.62050
[44] Tavaré,S.、Balding,D.J.、Griffiths,R.和Donnelly,P.(1997)。“从DNA序列数据推断聚合时间。”遗传学, 145: 505-518.
[45] Turner,B.M.和Van Zandt,T.(2012年)。“近似贝叶斯计算教程”,《数学心理学杂志》,56(2):69-85。数字对象标识符:10.1016/j.jmp.2012.02.005谷歌学者:查找链接数学科学网:MR2909506 zbMATH:1245.91084·Zbl 1245.91084号 ·doi:10.1016/j.jmp.2012.02.005
[46] Turner,B.M.和Van Zandt,T.(2014)。“分层近似贝叶斯计算。”心理测量学, 79(2): 185-209. 数字对象标识符:10.1007/s11336-013-9381-x谷歌学者:查找链接数学科学网:MR3255116 zbMATH:1288.62191·Zbl 1288.62191号 ·数字对象标识代码:10.1007/s11336-013-9381-x
[47] Wilkinson,R.D.(2013)。“近似贝叶斯计算(ABC)在模型误差的假设下给出了准确的结果。”《遗传学和分子生物学的统计应用》,12(2):129-141。数字对象标识符:10.1515/sagmb-2013-0010谷歌学者:查找链接数学科学网:MR3071024·doi:10.1515/sagmb-2013-0010
[48] Wong,H.和Clarke,B.(2004)。“存在模型不确定性时小样本贝叶斯预测的改进”,《加拿大统计杂志》,32(3):269-283。数字对象标识符:10.2307/3315929谷歌学者:查找链接数学科学网:MR2101756 zbMATH:1061.62041·Zbl 1061.62041号 ·doi:10.2307/3315929
[49] Yuan,A.和Clarke,B.(2004)。“给定统计的后验概率的渐近正态性”,《加拿大统计杂志》,32:119-137。数字对象标识符:10.2307/3315937谷歌学者:查找链接数学科学网:MR2064396 zbMATH:1056.62019·兹比尔1056.62019 ·doi:10.2307/315937
[50] Yuan,A.和Clarke,B.S.(1999)。“决策分析的最小信息可能性:图解与稳健性”,《加拿大统计杂志》,27(3):649-665。数字对象标识符:10.2307/3316119谷歌学者:查找链接数学科学网:MR1745829 zbMATH:1066.62511·Zbl 1066.62511号 ·doi:10.2307/3316119
[51] Zellner,A.(1986年)。“关于评估先验分布和使用g-先验分布的贝叶斯回归分析”,《贝叶斯推理和决策技术:布鲁诺·德·菲内蒂荣誉论文》,233。数学科学网:MR0881437·Zbl 0608.00012号
[52] Zhu,H.、Ibrahim,J.G.和Tang,N.(2011年)。“贝叶斯影响分析:几何方法。”生物特征, 98(2): 307-323. 数字对象标识符:10.1093/biomet/asr009谷歌学者:查找链接MathSciNet:MR2806430 zbMATH:1215.62029·Zbl 1215.62029号 ·doi:10.1093/biomet/asr009
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。