×

逻辑回归中截距参数的默认先验值。 (英语) Zbl 1507.62018年

总结:在逻辑回归中,当预测因子的线性组合能够完美区分二元结果时,就会发生分离。由于分离条件下不存在有限值最大似然参数估计,具有回归系数信息收缩的贝叶斯回归提供了一种合适的替代方法。分离的经典研究表明,估计回归系数的效率也可能取决于截距先验的选择,但相对较少关注是否以及如何缩小截距参数。提出了截距的替代先验分布,该分布降低了参数空间中令人难以置信的极值区域,使得回归估计对分离不太敏感。通过对样本数据集的模拟和分析,通过测量分离程度的既定统计数据分层的先验差异被量化。与扩散先验相比,当数据接近分离时,这些提出的先验通常能更有效地估计回归系数本身。它们在非分离数据集中同样有效,因此适合默认使用。在样本外歧视方面观察到轻微差异。这些数值研究还强调了截距先验值和回归系数之间的相互作用:与信息收缩先验值相比,当对回归系数使用弱信息先验值时,结果对截距先期的选择更为敏感。

MSC公司:

62-08 统计问题的计算方法
62J12型 广义线性模型(逻辑模型)
2015年1月62日 贝叶斯推断
62J07型 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 阿尔伯特。;Anderson,J.,关于logistic回归模型中最大似然估计的存在性,Biometrika,71,1,1-10(1984)·Zbl 0543.62020号
[2] 阿玛根,A。;邓森,D。;Lee,J.,广义双帕累托收缩,统计。Sinica,23,1,119-143(2013)·Zbl 1259.62061号
[3] 巴巴拉·R。;布恩斯特拉,P。;Kuo,K。;Selewski,D。;Bailly,D。;斯通,C。;Chow,C。;Annich,G。;莫勒,F。;Paden,M.,《评估接受体外支持治疗的呼吸衰竭儿童的死亡率风险调整》,ASAIO J.(2018),提前在线出版
[4] Barbaro,R。;Boonstra,P。;巴登,M。;罗伯茨,L。;Annich,G。;Bartlett,R。;莫勒,F。;Davis,M.,使用体外呼吸支持的儿童儿科风险评估评分的开发和验证(Ped RESCUERS),重症监护医学,42,5,879-888(2016)
[5] Bedrick,E。;Christensen,R。;Johnson,W.,《广义线性模型先验的新观点》,J.Amer。统计师。协会,91,436,1450-1460(1996)·Zbl 0882.62057号
[6] Box,G.,峰度测试区域注释,生物统计学,40,3/4,465-468(1953)·兹比尔0051.10806
[7] 盒子,G。;Tiao,G.,《统计分析中的贝叶斯推断》(1992),John Wiley&Sons:John Willey&Sons纽约,NY·Zbl 0850.62004号
[8] Carpenter,B.,Stan:概率编程语言,J.Statist。软件,76,1,1-32(2017)
[9] 卡瓦略,C.M。;新几内亚波尔森。;Scott,J.G.,《通过马蹄铁处理稀疏性》,(van Dyk,D.;Welling,M.,《第十二届人工智能和统计国际会议论文集》,第十二届国际人工智能和统计学会议论文集,《机器学习研究论文集》第5卷(2009),PMLR:美国佛罗里达州克利尔沃特海滩PMLR),73-80
[10] 卡瓦略,C。;Polson,N。;Scott,J.,稀疏信号的马蹄形估计器,Biometrika,97,2,465-480(2010)·Zbl 1406.62021号
[11] Christmann,A。;Rousseeuw,P.,《测量二元回归中的重叠》,计算。统计师。数据分析。,37, 1, 65-75 (2001) ·Zbl 1051.62065号
[12] Clogg,C。;鲁宾,D。;Schenker,N。;B.舒尔茨。;Weidman,L.,《使用贝叶斯逻辑回归对人口普查公共用途样本中的行业和职业代码进行多重插补》,J.Amer。统计师。协会,86,413,68-78(1991)
[13] Finney,D.,《从个体记录中估算剂量与量子反应之间的关系》,《生物统计学》,34,3/4,320-334(1947)·Zbl 0036.09701号
[14] 盖尔曼,A。;Hill,J.,《使用回归和多级/层次模型的数据分析》(2007),剑桥大学出版社,纽约州纽约市,美国
[15] Gelman,A。;雅库林,A。;Pittau,M.G。;Su,Y.,logistic和其他回归模型的弱信息默认先验分布,Ann.Appl。统计,2,4,1360-1383(2008)·Zbl 1156.62017年
[16] Ghosh,J。;李毅。;Mitra,R.,《关于贝叶斯逻辑回归中柯西先验分布的使用》,贝叶斯分析。(2017)
[17] 格陵兰,南部。;Mansournia,M.A.,《逻辑及相关分类和生存率回归中的惩罚、偏见减少和违约先验》,《统计医学》,34,23,3133-3143(2015)
[18] Hanson,T。;Branscum,A。;Johnson,W.,逻辑回归的信息性\(g\)-先验,贝叶斯分析。,9, 3, 597-612 (2014) ·Zbl 1327.62395号
[19] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素:数据挖掘、推断和预测》(2009),Springer:Springer New York,NY·Zbl 1273.62005年
[20] 海因策,G。;Schemper,M.,逻辑回归中分离问题的解决方案,Stat.Med.,21,16,2409-2419(2002)
[21] Jaeger,H.J。;迈尔,T。;盖勒,M。;Kinne,R.K。;Christmann,A。;Mathias,K.D.,下腔静脉滤器测试用计算机控制流量系统的下腔静脉体外生理模型,Invest。无线电。,32, 9, 511-522 (1997)
[22] Jeffreys,H.,估计问题中先验概率的不变形式,Proc。事务处理。R.Soc.伦敦。序列号。数学。物理。科学。,186, 1007, 453-461 (1946) ·Zbl 0063.03050号
[23] Künsch,H。;斯蒂芬斯基,L。;Carroll,R.,《一般回归模型中的条件无偏有界影响估计及其在广义线性模型中的应用》,J.Amer。统计师。协会,84、406、460-466(1989)·Zbl 0679.62024号
[24] Lee,E.,线性逻辑回归分析的计算机程序,计算。生物识别程序。,4, 2, 80-92 (1974)
[25] 马林,J。;Robert,C.,《贝叶斯核心:计算贝叶斯统计的实用方法》(Bayesian Core:A Practical Approach to Computational Bayesia Statistics)(2007),纽约州纽约市斯普林格科学与商业媒体:斯普林格科学与商业媒体·Zbl 1137.62013年
[26] Neutra,R.R。;菲恩伯格,S.E。;格陵兰,南部。;Friedman,E.A.,《胎儿监护对新生儿死亡率的影响》,北英格兰。《医学杂志》,299、7、324-326(1978)
[27] 帕克,T。;Casella,G.,《贝叶斯套索》,J.Amer。统计师。协会,103,482,681-686(2008)·Zbl 1330.62292号
[28] Piironen,J.,Vehtari,A.,2015年。基于Stan+R的投影预测变量选择;ArXiv预印ArXiv:1508.02502;Piironen,J.,Vehtari,A.,2015年。使用Stan+R的投影预测变量选择;ArXiv预印ArXiv:1508.02502·Zbl 1505.62321号
[29] Piironen,J。;Vehtari,A.,关于马蹄形先验中全局收缩参数的超先验选择,(Singh,A。;朱,J.,《第20届国际人工智能与统计会议论文集》。第20届国际人工智能与统计会议论文集,《机器学习研究论文集》,第54卷(2017),PMLR:PMLR Fort Lauderdale,FL,USA),905-913
[30] Piironen,J。;Vehtari,A.,马蹄铁和其他收缩先验中的稀疏信息和规则化,Electron。J.Stat.,11,2,5018-5051(2017)·Zbl 1459.62141号
[31] R核心团队,2016年。R: 统计计算语言和环境。R统计计算基金会;奥地利维也纳;https://www.R-project.org/; R核心团队,2016年。R: 统计计算语言和环境。R统计计算基金会;奥地利维也纳;https://www.R-project.org/
[32] 雷尼,C.,《处理逻辑回归模型中的分离》,《政治分析》。,24, 3, 339-355 (2016)
[33] 桑特纳,T。;Duffy,E.,关于A.albert和ja anderson在逻辑回归模型中存在最大似然估计的条件的注记,Biometrika,73,3,755-758(1986)·Zbl 0655.62022号
[34] Schauberger,G.、Tutz,G.,2014年。catdata:分类数据;网址:https://CRAN.R-project.org/package=catdata; Schauberger,G.、Tutz,G.,2014年。catdata:分类数据;网址:https://CRAN.R-project.org/package=catdata ·Zbl 1443.62537号
[35] 史密斯,J.W。;埃弗哈特,J。;Dickson,W。;Knowler,W。;Johannes,R.,使用adap学习算法预测糖尿病的发病,(美国医学信息学会计算机应用于医疗保健年度研讨会论文集(1988)),261
[36] Stan开发团队,2017年。Stan建模语言用户指南和参考手册,2.17.0版;http://mc-stan.org/; Stan开发团队,2017年。Stan建模语言用户指南和参考手册,2.17.0版;http://mc-stan.org/
[37] Stan开发团队,2018年。RStan:与Stan的R接口。网址:http://mc-stan.org/; Stan开发团队,2018年。RStan:与Stan的R接口。网址:http://mc-stan.org/
[38] 沙利文,S.G。;格陵兰,S.,sas软件中的贝叶斯回归,国际流行病学杂志。,42, 1, 308-317 (2013)
[39] 韦纳布尔斯,W.N。;Ripley,B.D.,现代应用统计学与S(2002),施普林格:施普林格纽约,网址http://www.stats.ox.ac.uk/pub/MASS4网站 ·Zbl 1006.62003号
[40] West,M.,正态分布的尺度混合,生物统计学,74,3,646-648(1987)·Zbl 0648.62015.中
[41] Wickham,H.,ggplot2:《数据分析的优雅图形》(2009年),纽约州施普林格出版社·Zbl 1170.62004号
[42] Zellner,A.,《贝叶斯分析在计量经济学中的应用》,J.Roy。统计师。Soc.序列号。D、 32、1/2、23-34(1983年)
[43] Zorn,C.,二进制响应模型中分离的解决方案,政治分析。,13, 2, 157-170 (2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。