×

整值数据的同时转换和舍入(STAR)模型。 (英语) Zbl 1439.62102号

摘要:我们提出了一个简单但功能强大的框架来建模积分值数据,如计数、分数和四舍五入数据。数据生成过程由同步变换和舍入(STAR)定义,STAR是一个连续值过程,它生成一系列灵活的积分值分布,能够建模零通货膨胀、有界或删失数据以及过度或不足分布。为了获得更大的分布灵活性,将转换建模为未知,而取整操作确保了连贯的积分值数据生成过程。开发了一种有效的MCMC算法用于后验推理,并提供了一种机制,用于将连续数据的成功贝叶斯模型和算法适应于整值数据集。使用STAR框架,我们为整值数据设计了一个新的贝叶斯加性回归树模型,该模型对合成数据和大型医疗利用数据集都显示了令人印象深刻的预测分布准确性。对于基于可解释回归的推理,我们开发了一个STAR加性模型,与现有的积分值模型相比,该模型具有更大的灵活性和可扩展性。应用STAR加性模型研究亚马逊河海豚的近期数量减少。

MSC公司:

62G08号 非参数回归和分位数回归
62M20型 随机过程推断和预测
62N01号 审查数据模型
62页第12页 统计在环境和相关主题中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agresti,A.(2013)。,分类数据分析,第3版。纽约:惠利·Zbl 1281.62022号
[2] Bening,V.E.和Korolev,V.Y.(2012)。,广义泊松模型及其在保险和金融中的应用。沃尔特·德·格鲁伊特·Zbl 1041.60004号
[3] Bhattacharya,A.、Chakraborty,A.和Mallick,B.K.(2016)。高维回归中高斯混合先验的快速采样。,《生物特征》,103(4):985-991。
[4] Box,G.E.和Cox,D.R.(1964年)。对转换的分析。,英国皇家统计学会杂志:B辑(方法学),26(2):211-243·Zbl 0156.40104号 ·doi:10.1111/j.2517-6161.1964.tb00553.x
[5] Cameron,A.C.和Trivedi,P.K.(2013)。,计数数据的回归分析,第53卷。剑桥大学出版社·兹比尔1301.62003
[6] Canale,A.和Dunson,D.B.(2011年)。贝叶斯核混合计数。,美国统计协会杂志,106(496):1528-1539·Zbl 1233.62041号 ·doi:10.1198/jasa.2011.tm10552
[7] Canale,A.和Dunson,D.B.(2013年)。计数过程的非参数Bayes建模。,生物特征,100(4):801-816·Zbl 1279.62202号 ·doi:10.1093/biomet/ast037
[8] Carvalho,C.M.、Polson,N.G.和Scott,J.G.(2010年)。稀疏信号的马蹄形估计。,《生物特征》,第465-480页·Zbl 1406.62021号 ·doi:10.1093/biomet/asq017
[9] Chipman,H.A.、George,E.I.和McCulloch,R.E.(1998年)。贝叶斯CART模型搜索。,美国统计协会杂志,93(443):935-948。
[10] Chipman,H.A.、George,E.I.和McCulloch,R.E.(2010年)。BART:贝叶斯加性回归树。,应用统计年鉴,4(1):266-298·Zbl 1189.62066号 ·doi:10.1214/09-AOAS285
[11] da Silva,V.M.、Freitas,C.E.、Dias,R.L.和Martin,A.R.(2018)。巴西亚马逊河流域的两种鲸目动物在过去二十年中都出现了持续而严重的数量下降。,普洛斯一号,13(5):e0191304。
[12] Dale,J.R.(1986)。双变量离散有序响应的全局交叉比模型。,生物统计学,第909-917页。
[13] Deb,P.和Trivedi,P.K.(1997)。老年人的医疗需求:有限混合方法。,应用计量经济学杂志,12(3):313-336。
[14] Dorazio,R.M.、Jelks,H.L.和Jordan,F.(2005)。通过对空间上不同的亚种群进行抽样,改进基于迁移的丰度估计。,生物计量学,61(4):1093-1101。
[15] Dorie,V.、Chipman,H.和R,M.(2018)。,dbarts:离散贝叶斯加性回归树采样器。R软件包版本3.1。
[16] Duan,L.L.、Johndrow,J.E.和Dunson,D.B.(2018年)。通过校准扩大数据增强MCMC。,机器学习研究杂志,19(1):2575-2608·Zbl 1412.62101号
[17] Famoye,F.(1993年)。限制广义泊松回归模型。,统计学中的传播——理论与方法,22(5):1335-1354·Zbl 0784.62018号 ·doi:10.1080/03610929308831089
[18] Flegal,J.M.、Hughes,J.、Vats,D.和Dai,N.(2017年)。,mcmcse:MCMC的蒙特卡罗标准误差。加利福尼亚州河滨市、科罗拉多州丹佛市、英国考文垂市和明尼苏达州明尼阿波利斯市软件包版本1.3-2。
[19] Friedman,J.H.(1991)。多元自适应回归样条。,统计年鉴,第1-67页·Zbl 0765.62064号 ·doi:10.1214/aos/1176347963
[20] Gelman,A.和Hill,J.(2006)。,使用回归和多级/层次模型进行数据分析。剑桥大学出版社。
[21] Gelman,A.、Hwang,J.和Vehtari,A.(2014)。了解贝叶斯模型的预测信息标准。,统计与计算,24(6):997-1016·Zbl 1332.62090号 ·doi:10.1007/s11222-013-9416-2
[22] Gneiting,T.和Raftery,A.E.(2007年)。严格正确的评分规则、预测和估计。,美国统计协会杂志,102(477):359-378·兹比尔1284.62093 ·doi:10.1198/0162145000001437
[23] Goodrich,B.、Gabri,J.、Ali,I.和Brilleman,S.(2018年)。rstanam:贝叶斯通过Stan应用回归建模。R包版本,2.17.4。
[24] Hilbe,J.M.(2011)。,负二项回归。剑桥大学出版社·Zbl 1269.62063号
[25] Klami,A.(2015)。因子模型的Pólya伽玛增广。年,亚洲机器学习会议,第112-128页。
[26] Kleiber,C.和Zeileis,A.(2008)。,《应用计量经济学》,R.Springer-Verlag,纽约,ISBN 978-0-387-77316-2·Zbl 1155.91004号
[27] Kowal,D.R.(2019)。麻疹预测的整值函数数据分析。,生物计量学。即将到来·Zbl 1448.62174号
[28] Lord,D.、Guikema,S.D.和Geedipally,S.R.(2008)。Conway-Maxwell-Poisson广义线性模型在汽车碰撞分析中的应用。,事故分析与预防,40(3):1123-1134。
[29] Mallick,B.K.和Gelfand,A.E.(1994年)。具有未知链接函数的广义线性模型。,《生物特征》,81(2):237-245·Zbl 0825.62609号 ·doi:10.1093/biomet/81.2.237
[30] Matteson,D.S.、McLean,M.W.、Woodard,D.B.和Henderson,S.G.(2011年)。预测紧急医疗服务呼叫到达率。,应用统计年鉴,5(2B):1379-1406·Zbl 1223.62161号 ·doi:10.1214/10-AOAS442
[31] McCullagh,P.(1980)。有序数据的回归模型。,英国皇家统计学会杂志:B辑(方法学),42(2):109-127·Zbl 0483.62056号 ·doi:10.1111/j.2517-6161.1980.tb01109.x
[32] McCullagh,P.和Nelder,J.A.(1989)。,广义线性模型,统计学和应用概率专著第37卷。查普曼和霍尔,伦敦·Zbl 0744.62098号
[33] Murray,J.S.(2017)。用于分类和计数响应的对数线性贝叶斯加性回归树。,arXiv预印arXiv:1701.01503。
[34] Neal,R.M.(2003)。切片取样。,《统计年鉴》,第705-741页·Zbl 1051.65007号 ·doi:10.1214/aos/1056562461
[35] Neelon,B.(2019年)。基于pólya-gamma混合的贝叶斯零膨胀负二项回归。,贝叶斯分析,14(3):849-875·Zbl 1421.62077号
[36] O'Hara,R.B.和Kotze,D.J.(2010年)。不记录并转换计数数据。,生态学与进化方法,1(2):118-122。
[37] Osthus,D.、Gattiker,J.、Priedhorsky,R.和Del Valle,S.Y.(2018年)。美国具有等级差异的动态贝叶斯流感预测。,贝叶斯分析·Zbl 1416.62612号 ·doi:10.1214/18-BA1117
[38] Polson,N.G.、Scott,J.G.和Windle,J.(2013)。基于Pólya-Gamma潜变量的逻辑模型贝叶斯推断。,美国统计协会杂志,108(504):1339-1349·Zbl 1283.62055号 ·doi:10.1080/01621459.2013.829001
[39] Ramsay,J.O.(1988)。单调回归样条函数的作用。,统计科学,3(4):425-441。
[40] Rue,H.(2001)。高斯马尔可夫随机场的快速采样。,英国皇家统计学会杂志:B辑(统计方法),63(2):325-338·Zbl 0979.62075号 ·doi:10.1111/1467-9868.00288
[41] Scheipl,F.、Fahrmeir,L.和Kneib,T.(2012年)。结构化加性回归模型中函数选择的尖峰和平顶先验。,美国统计协会杂志,107(500):1518-1532·Zbl 1258.62082号 ·doi:10.1080/01621459.2012.737742
[42] Sellers,K.F.和Shmueli,G.(2010年)。计数数据的灵活回归模型。,《应用统计年鉴》,第943-961页·Zbl 1194.62091号 ·doi:10.1214/09-AOAS306
[43] Shen,H.和Huang,J.Z.(2008)。呼叫中心到达的日间预测和日间更新。,制造与服务运营管理,10(3):391-410。
[44] Shmueli,G.、Minka,T.P.、Kadane,J.B.、Borle,S.和Boatwright,P.(2005)。拟合离散数据的有用分布:康韦-麦克斯韦-泊松分布的恢复。,英国皇家统计学会杂志:C辑(应用统计学),54(1):127-142·Zbl 1490.62058号 ·文件编号:10.1111/j.1467-9876.2005.00474.x
[45] Vats,D.、Flegal,J.M.和Jones,G.L.(2019年)。马尔可夫链蒙特卡罗的多元输出分析。,Biometrika,106(2):321-337·兹比尔1434.62100 ·doi:10.1093/biomet/asz002
[46] Vihola,M.(2012)。具有强制接受率的鲁棒自适应metropolis算法。,统计与计算,22(5):997-1008·Zbl 1252.65024号 ·doi:10.1007/s11222-011-9269-5
[47] Wang,W.和Yan,J.(2018)。,样条曲线2:回归样条曲线函数和类。R包版本0.2.8。
[48] Warton,D.I.(2018)。为什么你不能改变你的方式摆脱小麻烦。,生物统计学,74(1):362-368·Zbl 1415.62153号 ·doi:10.1111/biom.12728
[49] Watanabe,S.(2010年)。奇异学习理论中贝叶斯交叉验证的渐近等价性和广泛适用的信息准则。,机器学习研究杂志,11(12月):3571-3594·Zbl 1242.62024号
[50] 周,M。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。