×

通过条件秩的Plackett-Luce模型进行可缩放贝叶斯非参数回归。 (英语) Zbl 1397.62148号

摘要:我们提出了一种新的协变量(X)和连续响应变量(Y)的贝叶斯非参数回归模型。该模型根据(Y)和(X)的边际分布以及调节条件分布(F(Y | X)的随机顺序的回归函数进行参数化。通过采用近似复合似然方法,我们表明,对于模型的各个组成部分,所得到的后验推断可以解耦。该程序可以扩展到非常大的数据集,并允许使用贝叶斯非参数密度估计和Plackett-Luce排名估计中的标准现有软件。作为一个例子,我们展示了我们的方法在美国人口普查数据集上的应用,该数据集包含1300000多个数据点和100多个协变量。

MSC公司:

62G08号 非参数回归和分位数回归
62H30型 分类和区分;聚类分析(统计方面)
62第25页 统计学在社会科学中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Caron,F.、Davy,M.和Doucet,A.,2007年。时变Dirichlet过程混合物的广义Polya urn。年,第23届人工智能不确定性会议(UAI’2007)。
[2] Caron,F.、Davy,M.、Doucet,A.、Duflos,E.和Vanheehee,P.,2008年。Dirichlet过程混合线性动态模型的贝叶斯推断。,IEEE信号处理汇刊,56(1),71-84·Zbl 1391.62144号 ·doi:10.1109/TSP.2007.900167
[3] Chipman,H.A.、George,E.I.和McCulloch,R.E.,2010年。BART:贝叶斯加性回归树。,Ann.应用。统计,4(1),266-298·兹比尔1189.62066 ·doi:10.1214/09-AOAS285
[4] Chung,Y.和Dunson,D.B.,2009年。具有变量选择的非参数贝叶斯条件分布建模。,美国统计协会杂志,104(488)·Zbl 1205.62039号 ·doi:10.1198/jasa.2009.tm08302
[5] 考克斯,D.R.,1972年。回归模型和生命表。,英国皇家统计学会杂志。B系列(方法学),34(2),187-220·Zbl 0243.62041号
[6] Cox,D.R.&Reid,N.,2004年。关于由边缘密度构造伪似然的注记。,《生物特征》,91(3),729-737·Zbl 1162.62365号 ·doi:10.1093/biomet/91.3.729
[7] 霍夫,P.D.,2007年。推广半参数copula估计的秩似然。,Ann.应用。统计,1(1),265-283·邮编1129.62050 ·doi:10.1214/07-AOAS107
[8] De Iorio,M.、Müller,P.、Rosner,G.L.和MacEachern,S.N.,2004年。相依随机测度的方差分析模型。,《美国统计协会杂志》,99(465),205-215·Zbl 1089.62513号 ·doi:10.1198/016214500000205
[9] Denison,D.G.T.、Holmes,C.C.、Mallick,B.K.和Smith,A.F.M.,2002年,《非线性分类和回归的贝叶斯方法》。约翰·威利父子公司·Zbl 0994.62019号
[10] Dunson,D.B.和Park,J.-H.,2008年。内核破胶过程。,《生物特征》,95(2),307-323·Zbl 1437.62448号 ·doi:10.1093/biomet/asn012
[11] Dunson,D.B.,Pillai,N.和Park,J.-H.,2007年。贝叶斯密度回归。,英国皇家统计学会杂志:B辑(统计方法),69(2),163-183·Zbl 1120.62025号 ·文件编号:10.1111/j.1467-9868.2007.00582.x
[12] Escobar,M.D.和West,M.,1995年。贝叶斯密度估计和混合推理。,《美国统计协会杂志》,90(430),577-588·Zbl 0826.62021号 ·doi:10.2307/2291069
[13] 弗格森,T.S.,1973年。一些非参数问题的贝叶斯分析。,统计年鉴,1(2),209-230·Zbl 0255.62037号 ·doi:10.1214/aos/1176342360
[14] Ferguson,T.S.,1974年。概率测度空间上的先验分布。,《统计年鉴》,2(4),615-629·兹伯利0286.62008 ·doi:10.1214/aos/1176342752
[15] Gelfand,A.和Kottas,A.,2003年。中位剩余寿命的贝叶斯半参数回归。,《斯堪的纳维亚统计杂志》,30(4),651-665·Zbl 1053.62049号 ·doi:10.1111/1467-9469.00356
[16] Ghosal,S.和Van der Vaart,A.W.,2013年,《非参数贝叶斯推断基础》。剑桥大学出版社,纽约·Zbl 1376.62004号
[17] Griffin,J.E.&Steel,M.F.J.,2006年。基于顺序的依赖Dirichlet过程。,《美国统计协会杂志》,101(473),179-194·Zbl 1118.62360号 ·doi:10.1198/01621450000000727
[18] Hannah,L.A.,Blei,D.,&Powell,W.B.,2011年。广义线性模型的Dirichlet过程混合。,《机器学习研究杂志》,1923-1953年,第12期·Zbl 1280.62031号
[19] Hjort,N.L.、Holmes,C.C.、Müller,P.和Walker,S.G.,2010年,《贝叶斯非参数学》。剑桥统计与概率数学系列。剑桥大学出版社·Zbl 1360.62124号
[20] Jara,A.,2007年。使用DPpackage.应用贝叶斯非参数和半参数推理。,R新闻,7(3),17-26。
[21] Jara,A.、Hanson,T.、Quintana,F.、Müller,P.和Rosner,G.,2011年。DPpackage:R中的贝叶斯半参数和非参数建模,《统计软件杂志》,40(5),1-30。
[22] Kim,Y.,2006年。比例风险模型的Bernstein-von Mises定理。,《统计年鉴》,34(4),1678-1700·Zbl 1246.62050号 ·doi:10.1214/0090536000000533
[23] Kottas,A.和Gelfand,A.E.,2001年。贝叶斯半参数中值回归建模。,《美国统计协会杂志》,96(456),1458-1468·Zbl 1051.62038号 ·doi:10.1198/016214501753382363
[24] Lavine,M.,1992年。统计建模用Polya树分布的一些方面。,《统计年鉴》,20(3),1222-1235·Zbl 0765.62005年 ·doi:10.1214操作系统/1176348767
[25] 拉文,M.,1994年。用于统计建模的Polya树分布的更多方面。,《统计年鉴》,22(3),1161-1176·Zbl 0820.62016号 ·doi:10.1214/aos/1176325623
[26] Lavine,M.&Mockus,A.,1995年。保序回归的非参数Bayes方法。,《统计规划与推断杂志》,46(2),235-248·Zbl 0833.62040号 ·doi:10.1016/0378-3758(94)00106-6
[27] 林赛,B.G.,1988年。复合似然法。,当代数学,80(1),221-39·Zbl 0672.62069号 ·doi:10.1090/conm/080/999014
[28] Lo,A.Y.,1984年。关于一类贝叶斯非参数估计:I.密度估计。,《统计年鉴》,12(1),351-357·Zbl 0557.62036号 ·doi:10.1214/aos/1176346412
[29] 卢斯,R.D.,1959年,《个人选择行为:理论分析》。约翰·威利父子公司·Zbl 0093.31708号
[30] MacEachern,S.N.,1999年。相关非参数过程。在:,《贝叶斯统计科学学报》。美国统计协会。
[31] MacEachern,S.N.&Müller,P.,1998年。估计Dirichlet过程模型的混合。,计算与图形统计杂志,7(2),223-238。
[32] Mauldin,R.D.,Sudderth,W.D.,&Williams,S.C.,1992年。Polya树和随机分布。,《统计年鉴》,20(3),1203-1221·Zbl 0765.62006年 ·doi:10.1214/aos/1176348766
[33] Müller,P.&Quintana,F.A.,2004年。非参数贝叶斯数据分析。,统计科学,19(1),95-110·Zbl 1057.62032号 ·doi:10.1214/0883423040000017
[34] Müller,P.、Erkanli,A.和West,M.,1996年。使用多元正态混合物的贝叶斯曲线拟合。,Biometrika,83(1),67-79·Zbl 0865.62029号 ·doi:10.1093/biomet/83.1.67
[35] Murray,J.S.、Dunson,D.B.、Carin,L.和Lucas,J.E.,2013年。混合数据的贝叶斯-高斯copula因子模型。,《美国统计协会杂志》,108(502),656-665·Zbl 06195968号 ·doi:10.1080/01621459.2012.762328
[36] Neal,R.M.,2000年。Dirichlet过程混合模型的马尔可夫链抽样方法。,计算与图形统计杂志,9(2),249-265。
[37] Pati,D.&Dunson,D.B.,2014年。变残差密度贝叶斯非参数回归。,统计数学研究所年鉴,66(1),1-31·Zbl 1281.62102号 ·doi:10.1007/s10463-013-0415-z
[38] Pauli,F.、Racugno,W.和Ventura,L.,2011年。贝叶斯复合边际可能性。,《中国统计》,21(1),149·Zbl 1206.62039号
[39] Plackett,R.L.,1975年。排列分析。,英国皇家统计学会杂志。C辑(应用统计学),24(2),193-202。
[40] Rasmussen,C.E.,2006年,机器学习的高斯过程。麻省理工学院出版社·Zbl 1177.68165号
[41] Ribate,M.、Cooley,D.和Davison,A.C.,2012年。基于复合可能性的贝叶斯推断,以及对空间极值的应用。,中国统计局,22813-845·Zbl 1238.62031号 ·doi:10.5705/ss.2009.248
[42] Shahbaba,B.&Neal,R.,2009年。使用Dirichlet过程混合物的非线性模型。,机器学习研究杂志,101829-1850·Zbl 1235.62069号
[43] Trippa,L.、Müller,P.和Johnson,W.,2011年。多元β过程和Polya树模型的扩展。,《生物特征》,98(1),17-34·Zbl 1214.62101号 ·doi:10.1093/biomet/asq072
[44] Varin,C.、Reid,N.和Firth,D.,2011年。复合似然方法概述。,中国统计,21(1),5-42·兹伯利05849508
[45] Wade,S.、Dunson,D.B.、Petrone,S.和Trippa,L.,2014年。通过富集改进Dirichlet工艺混合物的预测。,《机器学习研究杂志》,第15期,1041-1071页·Zbl 1319.62085号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。