×

后验预测零。 (英语) Zbl 07810210号

摘要:贝叶斯模型批评是贝叶斯统计实践的重要组成部分。传统上,模型批评方法都是基于预测检验、对贝叶斯模型的良好性测试的适应性以及理解模型如何很好地捕获数据分布的有效方法。然而,在现代实践中,研究人员反复构建和开发许多模型,探索模型空间以帮助解决手头的问题。虽然经典的预测检查可以帮助评估每个模型,但它们无法帮助研究人员了解模型之间的相互关系。本文介绍了后验预测零校验(PPN),一种贝叶斯模型批评方法,有助于描述模型之间的关系。PPN背后的理念是检查一个模型的预测分布数据是否可以通过为另一个模型设计的预测检查。这种批评形式通过提供比较工具来补充经典的预测检查。收集PPN,我们称之为PPN研究,可以帮助我们了解哪些模型是等效的,哪些模型提供了不同的数据视角。通过混合模型,我们演示了PPN研究以及传统的预测检查如何根据简约原则帮助选择成分数量。通过概率因子模型,我们展示了PPN研究如何帮助理解不同类别模型之间的关系,例如线性模型和基于神经网络的模型。最后,我们分析了预测检验文献中的数据,以说明PPN研究如何改进贝叶斯模型批评的实践。

MSC公司:

62至XX 统计

软件:

亚当
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bayarri,M.和Berger,J.O.(1999年)。“量化数据和模型验证中的惊喜”,贝叶斯统计,6:53-82。数学科学网:MR1723493·Zbl 0974.62021号
[2] Bayarri,M.和Berger,J.O.(2000年)。“复合零模型的P值”,《美国统计协会杂志》,95(452):1127-1142。数字对象标识符:10.2307/2669749谷歌学者:查找链接数学科学网:MR1804239·Zbl 1004.62022号 ·doi:10.2307/2669749
[3] Bayarri,M.和Castellanos,M.(2007年)。《第二层次层次模型的贝叶斯检验》,《统计科学》,22:322-343。数字对象标识符:10.1214/07-STS235谷歌学者:查找链接数学科学网:MR2416808·Zbl 1246.62029号 ·doi:10.1214/07-STS235
[4] Blei,D.M.、Kucukelbir,A.和McAuliffe,J.D.(2017年)。《变分推理:统计学家评论》,《美国统计协会杂志》,112(518):859-877。数字对象标识符:10.1080/01621459.2017.1285773谷歌学者:查找链接数学科学网:MR3671776·doi:10.1080/01621459.2017.1285773
[5] Box,G.E.(1980)。《科学建模和稳健性中的抽样和贝叶斯推断》,《皇家统计学会杂志:A辑(综述)》,143(4):383-404。数字对象标识符:10.2307/2982063谷歌学者:查找链接数学科学网:MR0603745·Zbl 0471.62036号 ·doi:10.2307/2982063
[6] Breiman,L.(2001)。《统计建模:两种文化》,《统计科学》,16(3):199-231。数字对象标识符:10.1214/s/1009213726谷歌学者:查找链接zbMATH:10596.2505欧几里得:欧几里得.s/1009213726数学科学网:MR1874152·Zbl 1059.62505号 ·doi:10.1214/ss/1009213726
[7] Dieng,A.B.、Kim,Y.、Rush,A.M.和Blei,D.M.(2019年)。“利用生成跳跃模型避免潜在变量崩溃”,《人工智能与统计》。
[8] Draper,D.(1996)。“评论:贝叶斯模型选择中的效用、敏感性分析和交叉验证”,《中国统计》第6期(760-767.)。
[9] Evans,M.和Moshonov,H.(2006年)。“检查前数据冲突”,贝叶斯分析,1(4):893-914。数字对象标识符:10.1214/06-BA129谷歌学者:查找链接MathSciNet:MR2282210 Euclid:Euclid.ba/1340370946 zbMATH:1331.62030·Zbl 1331.62030号 ·doi:10.1214/06-BA129
[10] Gelfand,A.、Dey,D.和Chang,H.(1992年)。“使用预测分布确定模型,并通过基于抽样的方法实现。”《贝叶斯统计》。数学科学网:MR1380275
[11] Gelfand,A.E.和Ghosh,S.K.(1998年)。“模型选择:最小后验预测损失方法。”生物特征, 85(1): 1-11. 数字对象标识符:10.1093/biomet/85.11谷歌学者:查找链接MathSciNet:MR1627258·Zbl 0904.62036号 ·doi:10.1093/biomet/85.1.1
[12] Gelman,A.(2004)。“复杂模型的探索性数据分析”,《计算与图形统计杂志》,13(4):755-779。数字对象标识符:10.1198/106186004X11435谷歌学者:查找链接数学科学网:MR2109052·doi:10.1198/106186004X11435
[13] Gelman,A.、Meng,X.-L.和Stern,H.(1996)。“通过实现的差异对模型适合性进行后验预测评估”,《中国统计》,733-760。zbMATH:0859.62028数学科学网:MR1422404
[14] Gelman,A.和Shalizi,C.(2012年)。“贝叶斯统计的哲学和实践”,《英国数学与统计心理学杂志》,66:8-38。数字对象标识符:10.1111/j.2044-8317.2011.02037.x谷歌学者:查找链接数学科学网:MR3044854·Zbl 1410.62009年 ·doi:10.1111/j.2044-8317.2011.02037.x
[15] Gelman,A.、Vehtari,A.、Simpson,D.、Margossian,C.C.、Carpenter,B.、Yao,Y.、Kennedy,L.、Gabri,J.、Bürkner,P.-C.和Modrák,M.(2020年)。“贝叶斯工作流”。arXiv预印本arXiv:2011.01808。
[16] Gershman,S.和Goodman,N.(2014)。“概率推理中的分期推理”,《认知科学学会年会论文集》。
[17] Guttman,I.(1967年)。《未来观察概念在质量问题中的应用》,《皇家统计学会杂志》。B系列(方法学),83-100。数学科学网:MR0216699·兹伯利0158.37305
[18] Jeffreys,H.(1961年)。概率论。牛津大学出版社,第3版。zbMATH:0116.34904数学科学网:MR0187257·Zbl 0116.34904号
[19] Jordan,M.I.、Ghahramani,Z.、Jaakkola,T.S.和Saul,L.K.(1999)。“图形模型变分方法简介”,《机器学习》,37(2):183-233。兹马特:0945.68164·Zbl 0945.68164号
[20] Kass,R.E.和Raftery,A.E.(1995)。“贝叶斯因素”,《美国统计协会杂志》,90(430):773-795。数字对象标识符:10.1080/01621459.1995.10476572谷歌学者:查找链接数学科学网:MR3363402 zbMATH:0846.62028·Zbl 0846.62028号 ·doi:10.1080/01621459.1995.10476572
[21] Kingma,D.P.和Ba,J.(2014)。《亚当:随机优化的方法》,arXiv预印本arXiv:1412.6980。
[22] Kingma,D.P.和Welling,M.(2014)。“自动编码变分贝叶斯”,学习表征国际会议。
[23] Marshall,E.和Spiegelhalter,D.(2007)。“识别贝叶斯层次模型中的异常值:基于模拟的方法”,《贝叶斯分析》,2(2):409-444。数字对象标识符:10.1214/07-BA218谷歌学者:查找链接MathSciNet:MR2312289 zbMATH:1331.62032·Zbl 1331.62032号 ·doi:10.1214/07-BA218
[24] 孟晓乐(1994)。“后验预测值”,《统计学年鉴》,22(3):1142-1160。数字对象标识符:10.1214/aos/1176325622谷歌学者:查找链接数学科学网:MR1311969·兹比尔0820.62027 ·doi:10.1214/aos/1176325622
[25] Moran,G.E.、Cunningham,J.P.和Blei,D.M.(2022)。“后验预测空值”贝叶斯分析的补充材料。数字对象标识符:10.1214/22-BA1313SUPP谷歌学者:查找链接·doi:10.1214/22-BA1313SUPP文件
[26] O'Hagan,A.(2003年)。“HSSS模型批评(讨论)”,《高度结构化随机系统》,423-453。数学科学网:MR2082418
[27] Rezende,D.J.、Mohamed,S.和Wierstra,D.(2014)。“深度生成模型中的随机反向传播和近似推理”,《机器学习国际会议》,1278-1286年。PMLR公司。
[28] Robins,J.M.、van der Vaart,A.和Ventura,V.(2000)。“复合零模型中p值的渐近分布”,《美国统计协会杂志》,95(452):1143-1156。数字对象标识符:10.2307/2669750谷歌学者:查找链接MathSciNet:MR1804240·Zbl 1072.62522号 ·doi:10.2307/2669750
[29] Rubin,D.B.(1984)。“应用统计学家的贝叶斯合理和相关频率计算”,《统计年鉴》,12(4):1151-1172。数字对象标识符:10.1214/aos/1176346785谷歌学者:查找链接MathSciNet:MR0760681 zbMATH:055.62010 Euclid:Euclid.aos/1176346785·Zbl 0555.62010号 ·doi:10.1214/aos/1176346785
[30] Semenova,L.、Rudin,C.和Parr,R.(2019年)。“Rashomon曲线和体积研究:机器学习中泛化和模型简化的新视角”,arXiv预印本arXiv:1908.01755。
[31] Stern,H.S.、Arcus,D.、Kagan,J.、Rubin,D.B.和Snidman,N.(1995年)。“在气质研究中使用混合模型”,《国际行为发展杂志》,18(3):407-423。
[32] Tipping,M.E.和Bishop,C.M.(1999)。《概率主成分分析》,《皇家统计学会杂志:B辑(统计方法)》,61(3):611-622。数字对象标识符:10.1111/1467-9868.00196谷歌学者:查找链接数学科学网:MR1707864 zbMATH:0924.62068·Zbl 0924.62068号 ·doi:10.1111/1467-9868.00196
[33] Vehtari,A.和Ojanen,J.(2012年)。“模型评估、选择和比较的贝叶斯预测方法调查”,《统计调查》,6:142-228。数字对象标识符:10.1214/12-SS102谷歌学者:查找链接MathSciNet:MR3011074 zbMATH:1302.62011·Zbl 1302.62011年 ·doi:10.1214/12-SS102
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。