×

大数据贝叶斯线性回归和正态-负极值求和变量选择。 (英语) Zbl 1407.62262号

小结:我们引入了正态-逆-γ求和算子,该算子结合了不同数据源的贝叶斯回归结果,并导出了一个用于大数据回归的简单拆分和合并算法。求和算子还可用于计算边际似然,并有助于贝叶斯模型选择方法,包括贝叶斯套索、随机搜索变量选择、马尔可夫链蒙特卡罗模型合成等。一次扫描观测值,然后采样器在不重新加载数据的情况下迭代组合正态-逆伽马分布。仿真研究表明,我们的算法能够有效地处理高度相关的大数据。还分析了就业和工资的真实数据集。

MSC公司:

62J05型 线性回归;混合模型
2015年1月62日 贝叶斯推断
2007年6月62日 岭回归;收缩估计器(拉索)
62第20页 统计学在经济学中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ang,A.和Chen,J.(2007)。“长期CAPM:1926–2001。”《实证金融杂志》,14(1):1–40。
[2] Branch,W.A.和Evans,G.W.(2006年)。《简单递归预测模型》,《经济学快报》,91(2):158-166·兹比尔1254.91639 ·doi:10.1016/j.econlet.2005.09.005
[3] Carlin,B.P.和Chib,S.(1995年)。《通过马尔可夫链蒙特卡罗方法选择贝叶斯模型》,《皇家统计学会杂志》。B系列(方法学),57(3):473-484·Zbl 0827.62027号
[4] Dean,J.和Ghemawat,S.(2008年)。“MapReduce:大型集群上的简化数据处理”,《ACM通讯》,51(1):107–113。
[5] Fan,J.和Lv,J.(2010)。“高维特征空间中变量选择的选择性概述”,《统计》,20(1):101–148·Zbl 1180.62080号
[6] George,E.I.和Foster,D.P.(2000)。“校准和经验贝叶斯变量选择”,Biometrika,87(4):731–747·Zbl 1029.62008号 ·doi:10.1093/biomet/87.4.731
[7] George,E.I.和McCulloch,R.E.(1993)。“通过吉布斯抽样进行变量选择”,《美国统计协会杂志》,88(423):881-889。
[8] George,E.I.和Mcculloch,R.E.(1997)。“贝叶斯变量选择方法”,《中国统计》,339-374·Zbl 0884.62031号
[9] Geweke,J.(1996)。回归中的变量选择和模型比较。牛津:牛津大学出版社·Zbl 0864.62083号 ·doi:10.1016/0304-4076(95)01773-9
[10] Ghosh,J.和Reiter,J.P.(2013年)。“水平分区数据的安全贝叶斯模型平均”,《统计与计算》,23(3):311-322·Zbl 1322.62101号 ·doi:10.1007/s11222-011-9312-6
[11] Godsill,S.J.(2001)。“关于模型不确定性的马尔可夫链蒙特卡罗方法之间的关系”,《计算与图形统计杂志》,10(2):230–248·doi:10.1198/10618600152627924
[12] Green,P.J.(1995)。“可逆跳跃马尔可夫链蒙特卡罗计算和贝叶斯模型确定”,《生物特征识别》,82:711-732·Zbl 0861.62023号 ·doi:10.1093/biomet/82.4.711
[13] Johnson,V.E.和Rossell,D.(2012年)。“高维环境下的贝叶斯模型选择”,《美国统计协会杂志》,107(498):649-660·Zbl 1261.62024号 ·doi:10.1080/01621459.2012.682536
[14] Kuo,L.和Mallick,B.(1998年)。“回归模型的变量选择”,Sankhya:The Indian Journal of Statistics,B辑,60(1):65–81·Zbl 0972.62016号
[15] Lin,D.、Foster,D.P.和Ungar,L.H.(2011年)。《VIF回归:大数据的快速回归算法》,《美国统计协会杂志》,106(493):232–247·Zbl 1396.62170号 ·doi:10.1198/jasa.2011.tm10113
[16] Madigan,D.、York,J.和Allard,D.(1995年)。“离散数据的贝叶斯图形模型”,《国际统计评论》,63(2):215-232·Zbl 0834.62003号 ·doi:10.2307/1403615
[17] Miroshnikov,A.、Savel’ev,E.和Conlon,E.M.(2015)。“BayesSummaryStatLM:大数据和数据科学贝叶斯线性模型的R包。”手稿:https://arxiv.org/abs/1503.00635。
[18] Neiswanger,W.、Wang,C.和Xing,E.P.(2014)。“渐近精确,令人尴尬的并行MCMC”,《第三十届人工智能不确定性会议论文集》,623-632。阿灵顿:AUAI出版社。
[19] Ordonez,C.、Garcia Alvarado,C.和Baladandayuthapani,V.(2014)。“大型数据集一次性线性回归中的贝叶斯变量选择”。ACM数据知识发现事务,9(1):1–14。
[20] Park,T.和Casella,G.(2008)。《贝叶斯拉索》,《美国统计协会杂志》,103(482):681-686·Zbl 1330.62292号 ·doi:10.1198/016214500000037
[21] 钱宏(2017)。《大数据贝叶斯线性回归和变量选择的正态反转伽马求和补充材料》,贝叶斯分析。
[22] Raftery,A.E.、Madigan,D.和Hoeting,J.A.(1997)。“线性回归模型的贝叶斯模型平均值”,《美国统计协会杂志》,92(437):179-191·Zbl 0888.62026号 ·doi:10.1080/0162145.1997.10473615
[23] Scott,S.L.、Blocker,A.W.、Bonassi,F.V.、Chipman,H.A.、George,E.I.和McCulloch,R.E.(2016)。“贝叶斯和大数据:共识蒙特卡洛算法”,《国际管理科学与工程管理杂志》,11:78-88。
[24] Smith,M.和Kohn,R.(1996年)。“使用贝叶斯变量选择的非参数回归”,《计量经济学杂志》,75(2):317-343·兹比尔0864.62025 ·doi:10.1016/0304-4076(95)01763-1
[25] Tibshirani,R.(1996)。《通过拉索进行回归收缩和选择》,《皇家统计学会期刊B》,58:267-288·Zbl 0850.62538号
[26] Zeller,A.(1986年)。关于评估先验分布和使用g-先验分布的贝叶斯回归分析·Zbl 0655.62071号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。