×

海量数据的贝叶斯自举。 (英语) Zbl 1459.62038号

摘要:在本文中,我们提出了数据子集算法,该算法允许贝叶斯引导的近似和可扩展实现。它们类似于频率学家文献中的两种现有算法:小引导包[A.克莱纳等,“大规模数据的可扩展引导”,预打印,arXiv:1112.5016]和子采样双引导[S.Sengupta公司,S.Volgushev公司X.邵,“海量数据的子样本双引导”,预打印,arXiv:1508.01126]. 我们的算法具有吸引人的理论和计算特性,可以与相应的频域算法进行比较。此外,我们还提供了一种对贝叶斯引导的一类泛函进行无损推理的策略,并简要介绍了Dirichlet过程的扩展。

MSC公司:

62G05型 非参数估计
62G09号 非参数统计重采样方法
62兰特 大数据和数据科学的统计方面
60年12月 一般二阶随机过程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Barrientos,A.F.和PeñA,V.(2019年)。“补充材料:海量数据的贝叶斯自举法”,贝叶斯分析·Zbl 1459.62038号 ·doi:10.1214/19-BA1155
[2] Barrientos,A.F.、Bolton,A.、Balmat,T.、Reiter,J.P.、de Figueiredo,J.M.、Machanavajhala,A.、Chen,Y.、Kneifel,C.和DeLong,M.(2018)。“通过综合和验证提供对机密研究数据的访问:美国联邦政府雇员数据的应用”,《应用统计年鉴》,12(2):1124-1156·兹比尔1405.62236 ·doi:10.1214/18-AOAS1194
[3] Bolton,A.D.和de Figueiredo,J.M.(2016a)。“测量并解释联邦政府中的性别工资差距”,论文发表于宾夕法尼亚州费城美国政治科学协会2016年年会。
[4] Bolton,A.D.和de Figueiredo,J.M.(2016b)。“联邦政府中工资和人力资本的增长”,在波多黎各圣胡安举行的南部政治科学协会2016年年会上提交的论文。
[5] Carroll,R.J.和Pederson,S.(1993年)。《关于逻辑回归模型的稳健性》,《皇家统计学会杂志》。B系列(方法学),693-706·Zbl 0794.62021号 ·doi:10.1111/j.2517-6161.1993.tb01934.x
[6] Castillo,I.和Nickl,R.(2014)。“关于非参数贝叶斯程序的伯恩斯坦-冯-米塞斯现象”,《统计年鉴》,42(5):1941-1969·Zbl 1305.62190号 ·doi:10.1214/14-AOS1246
[7] Chamberlain,G.和Imbens,G.W.(2003)。“贝叶斯推断的非参数应用”,《商业与经济统计杂志》,21(1):12-18。
[8] Choudhuri,N.(1998年)。“多维均值泛函的贝叶斯自举可信集”,《统计年鉴》,26(6):2104-2127·Zbl 0933.62035号 ·doi:10.1214/aos/1024691463
[9] Cifarelli,D.M.和Mellilli,E.(2000年)。“Dirichlet先验的一些新结果”,《统计年鉴》,28(5):1390-1413·Zbl 1105.62303号 ·doi:10.1214/aos/1015957399
[10] Clyde,M.和Lee,H.(2001年)。《打包和贝叶斯引导》(Bayesian bootstrap),摘自Richardson,T.和Jaakkola,T.(编辑),《人工智能与统计》,169-174。
[11] Datta,J.和Ghosh,J.K.(2014)。“Bootstrap-an exploration”,《统计方法》,20:63-72·Zbl 1486.62124号 ·doi:10.1016/j.stamet.2013.08.003
[12] Dong,Q.、Elliott,M.R.和Raghunathan,T.E.(2014)。“生成合成总体以调整复杂抽样设计特征的非参数方法。”《调查方法》,40(1):29-46。
[13] Efron,B.(1979年)。“引导方法:又一次折刀”,《统计年鉴》,7(1):1-26·Zbl 0406.62024号 ·doi:10.1214/aos/1176344552
[14] Fushiki,T.(2010)。“贝叶斯自举预测”,《统计规划与推断杂志》,140(1):65-74·兹比尔1178.62044 ·doi:10.1016/j.jspi.2009.06.007
[15] 加斯帕里尼,M.(1995年)。“矩的精确多元贝叶斯自举分布”,《统计年鉴》,23(3):762-768·Zbl 0838.62032号 ·doi:10.1214/aos/1176324620
[16] Graham,D.J.、McCoy,E.J.和Stephens,D.A.(2016年)。“双重稳健估计的近似贝叶斯推断”,贝叶斯分析,11(1):47-69·Zbl 1357.62186号 ·doi:10.1214/14-BA928
[17] Gu,J.、Ghosal,S.和Roy,A.(2008)。“ROC曲线的贝叶斯自举估计”,《医学统计学》,27(26):5407-5420。
[18] Hahn,J.(1997)。“分位数回归估计的贝叶斯自举:一项大样本研究”,《国际经济评论》,38(4):795-808·Zbl 0894.62018号 ·doi:10.2307/2527216
[19] Heckelei,T.和Mittelhammer,R.C.(2003)。贝叶斯引导多元回归〉,《计量经济学杂志》,112(2):241-264·Zbl 1026.62019 ·doi:10.1016/S0304-4076(02)00196-3
[20] Ishwaran,H.、James,L.F.和Zarepour,M.(2009年)。“n中取m引导的替代方法”,《统计规划与推断杂志》,139(3):788-801·Zbl 1157.62024号 ·doi:10.1016/j.jspi.2008.04.032
[21] Ishwaran,H.和Zarepour,M.(2002年)。“Dirichlet过程的精确和近似和表示法”,《加拿大统计杂志》,30(2):269-283·Zbl 1035.60048号 ·doi:10.2307/3315951
[22] Jackmin-Gadda,H.、Sibillot,S.、Proust,C.、Molina,J.-M.和Thie baut,R.(2007)。“线性混合模型对错误指定误差分布的鲁棒性”,《计算统计与数据分析》,51(10):5142-5154·Zbl 1162.62319号 ·doi:10.1016/j.csda.2006.05.021
[23] James,L.F.(1997)。“审查数据的一类加权自举的研究”,《统计年鉴》,25(4):1595-1621·Zbl 0936.62051号 ·doi:10.1214/aos/1031594733
[24] James,L.F.(2008)。“双参数Poisson-Dirichlet过程的大样本渐近性”,摘自《推动当代统计学的极限:纪念Jayanta K.Ghosh的贡献》,187-199年。数理统计研究所。
[25] Kim,Y.和Lee,J.(2003)。“比例危险模型的贝叶斯自举”,《统计学年鉴》,31(6):1905-1922·兹比尔1042.62030 ·doi:10.1214操作系统/1074290331
[26] Kingman,J.F.(1975年)。《随机离散分布》,《皇家统计学会杂志》。B系列(方法学),1-22·Zbl 0331.62019号 ·doi:10.1111/j.2517-6161.1975.tb01024.x
[27] Kleiner,A.、Talwalkar,A.,Sarkar,P.和Jordan,M.I.(2014)。“海量数据的可扩展引导”,《皇家统计学会杂志》。B辑:统计方法,76(4):795-816·Zbl 07555464号
[28] Lee,H.K.H.和Clyde,M.A.(2004年)。“无损在线贝叶斯装袋”,《机器学习研究杂志》,5:143-151。
[29] Li,C.、Srivastava,S.和Dunson,D.B.(2017)。“简单、可扩展和准确的后间隔估计”,《生物统计学》,104(3):665-680·Zbl 07072234号 ·doi:10.1093/biomet/asx033
[30] Liang,K.-Y.和Zeger,S.L.(1986)。“使用广义线性模型进行纵向数据分析”,《生物统计学》,73(1):13-22·Zbl 0595.62110号 ·doi:10.1093/biomet/73.1.13
[31] Lo,A.Y.(1983)。“Dirichlet过程的弱收敛”,Sankhyá:印度统计杂志,A辑,105-111·Zbl 0531.60072号
[32] Lo,A.Y.(1987)。“贝叶斯引导法的大样本研究”,《统计年鉴》,15(1):360-375·Zbl 0617.62032号 ·doi:10.1214/aos/1176350271
[33] Lo,A.Y.(1988)。“有限人口的贝叶斯引导”,《统计年鉴》,16(4):1684-1695·Zbl 0691.62005号 ·doi:10.1214/aos/1176351061
[34] Lo,A.Y.(1991)。“贝叶斯自举克隆和生物测量功能”。A、 53(3):320-333·Zbl 0755.62006号
[35] Lo,A.Y.(1993)。“审查数据的贝叶斯引导”,《统计年鉴》,21(1):100-123·Zbl 0787.62048号 ·doi:10.1214操作系统/1176349017
[36] Lyddon,S.、Holmes,C.和Walker,S.(2019)。“广义贝叶斯更新和损失可能性引导。”Biometrika(出版中)·Zbl 1454.62098号 ·doi:10.1093/biomet/asz006
[37] Meeden,G.(1993年)。“分位数的非信息性非参数贝叶斯估计”,《统计与概率快报》,16(2):103-109。
[38] Minsker,S.、Srivastava,S.,Lin,L.和Dunson,D.B.(2017年)。“通过子集后验中位数的稳健和可扩展贝叶斯”,《机器学习研究杂志》,18(1):4488-4527·Zbl 1442.62056号
[39] Muliere,P.和Secchi,P.(1996年)。“贝叶斯非参数预测推断和引导技术”,《统计数学研究所年鉴》,48(4):663-673·Zbl 1121.62542号 ·doi:10.1007/BF00052326
[40] Neiswanger,W.、Wang,C.和Xing,E.P.(2014)。“渐进精确,令人尴尬的平行MCMC”,《第三十届人工智能不确定性会议论文集》,UAI'14,623-632。AUAI出版社。
[41] Pinheiro,J.、Bates,D.、DebRoy,S.、Sarkar,D.和R核心团队(2018年)。nlme:线性和非线性混合效应模型。R软件包版本3.1-137。统一资源定位地址https://CRAN.R-project.org/package=nlme
[42] Pitman,J.(1995)。“可交换和部分可交换随机分区”,《概率论及相关领域》,102:145-158·Zbl 0821.60047号 ·doi:10.1007/BF01213386
[43] Pitman,J.(1996)。“Blackwell-MacQueen骨灰盒方案的一些发展”,讲义-专著系列,245-267。
[44] Pustejovsky,J.(2018)。clubSandwich:带小样本修正的聚类-半截形(Sandwick)方差估计量。R包版本0.3.2。统一资源定位地址https://CRAN.R-project.org/package=clubSandwich
[45] R核心团队(2015)。“R:统计计算的语言和环境。”URLhttps://www.R-project.org/
[46] Rubin,D.B.(1981)。“贝叶斯引导法”,《统计年鉴》,9(1):130-134。
[47] Rubin,D.B.和Schenker,N.(1986年)。“利用可忽略无响应的简单随机样本进行区间估计的多重插补”,《美国统计协会杂志》,81(394):366-374·Zbl 0615.62011号 ·doi:10.1080/01621459.1986.10478280
[48] Scott,S.L.、Blocker,A.W.、Bonassi,F.V.、Chipman,H.A.、George,E.I.和McCulloch,R.E.(2016)。《贝叶斯与大数据:共识蒙特卡罗算法》,《国际管理科学与工程管理杂志》,11(2):78-88。
[49] Sengupta,S.、Volgushev,S.和Shao,X.(2016)。《美国统计协会期刊》,111(515):1222-1232。
[50] Sethuraman,J.(1994)。“Dirichlet先验的建设性定义”,《中国统计》,2:639-650·Zbl 0823.62007号
[51] Siddique,J.和Belin,T.R.(2008)。“使用近似贝叶斯引导法对不可忽略的缺失数据进行乘法插补”,《计算统计与数据分析》,53(2):405-415·Zbl 1231.62037号 ·doi:10.1016/j.csda.2008.07.042
[52] Srivastava,S.、Cevher,V.、Tran-Dinh,Q.和Dunson,D.B.(2015)。《WASP:通过子集后验的重心的可伸缩贝叶斯》,摘自《人工智能与统计》。
[53] Srivastava,S.、Li,C.和Dunson,D.B.(2018年)。“通过Wasserstein空间重心的可缩放贝叶斯”,《机器学习研究杂志》,19(1):312-346·兹比尔1444.62037
[54] Taddy,M.、Chen,C.-S.、Yu,J.和Wyle,M.(2015)。“贝叶斯和经验贝叶斯森林”,摘自Blei,D.和Bach,F.(编辑),《第32届机器学习国际会议论文集》(ICML-15),967-976。
[55] Taddy,M.、Gardner,M.,Chen,L.和Draper,D.(2016)。“数字实验中异质处理效应的非参数贝叶斯分析”,《商业与经济统计杂志》,34(4):661-672·doi:10.1080/07350015.2016.1172013
[56] van der Vaart,A.W.和Wellner,J.A.(1996)。弱收敛和经验过程。统计学中的斯普林格系列。纽约施普林格-弗拉格,统计应用·兹比尔0862.60002
[57] Varron,D.(2014)。“推广经验过程的一类过程的Donsker和Glivenko-Cantelli定理”,《统计学电子期刊》,8(2):2296-2320·Zbl 1320.60092号 ·doi:10.1214/14-EJS955
[58] Wang,X.和Dunson,D.B.(2013)。“通过Weierstrass采样器并行化MCMC。”arXiv预印本arXiv:1312.4605。
[59] Wang,X.、Guo,F.、Heller,K.A.和Dunson,D.B.(2015)。“用随机划分树并行MCMC”,《神经信息处理系统进展》,451-459。
[60] Walsh,A.和Richardson,A.(1997)。“混合模型稳健估计的13种方法”,《统计手册》,15:343-384·Zbl 0908.62071号
[61] 翁,C.-S.(1989)。“关于贝叶斯自举平均值的二阶渐近性质”,《统计年鉴》,17(2):705-710·Zbl 0672.62027号 ·doi:10.1214/aos/1176347136
[62] 周,H。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。