×

零修正泊松-林德利回归模型的贝叶斯方法。 (英语) Zbl 1433.62198号

本文提出了一个零修正的泊松-林德利回归模型,以拟合在存在协变量的情况下表现为零膨胀或零收缩的过分散计数数据。利用零修正Poisson-Lindley分布的跨栏版本,构造了参数向量的可分离似然函数,并在没有数据集中零修正的先验信息的情况下对模型进行了拟合。推理过程是在贝叶斯观点下进行的,采用了g先验方法的改编。采用随机游走Metropolis算法,通过马尔可夫链蒙特卡罗抽样进行估计。进行了蒙特卡罗模拟,以评估所开发方法的性能。为了进行比较,还评估了最大似然估计的性能。该模型被应用于一组公司收到的投标数量的真实数据集的分析,并研究了选择不同的先验分布对回归系数的影响。采用Kullback-Leibler散度进行敏感性分析,以检测影响点。

MSC公司:

62J12型 广义线性模型(逻辑模型)
65二氧化碳 蒙特卡罗方法
第60页 统计学在工程和工业中的应用;控制图
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Angers,J.F.和Biswas,A.(2003年)。零膨胀广义泊松模型的贝叶斯分析。计算统计与数据分析42,37-46·Zbl 1429.62091号 ·doi:10.1016/S0167-9473(02)00154-8
[2] Bahn,G.D.和Massenburg,R.(2008)。处理离散因变量中多余的零,即芝加哥人口普查区的谋杀案数量。美国统计协会联合统计会议,3905-3912。
[3] Bazán,J.L.、Torres Avilés,F.、Suzuki,A.K.和Louzada,F.(2017)。二元回归的幂和反转幂链接:汽车保险投保人的应用。商业和工业中的应用随机模型33,22-34·Zbl 1411.62348号 ·doi:10.1002/asmb.2215
[4] Bertoli,W.、Conceiçáo,K.S.、Andrade,M.G.和Louzada,F.(2018年)。零修正Poisson-Shanker回归模型及其在胎儿死亡通知数据中的应用。计算统计33,807-836·Zbl 1417.62041号 ·doi:10.1007/s00180-017-0788-1
[5] Beuf,K.D.、Schrijver,J.D.、Thas,O.、Crieking,W.V.、Irizarry,R.A.和Clement,L.(2012)。基于障碍泊松模型改进了454测序的基本调用和质量分数。BMC生物信息学13,303。
[6] Bohara,A.K.和Krieg,R.G.(1996年)。偏移频率的零膨胀泊松模型。《国际区域科学评论》19,211-222。
[7] Bulmer,M.G.(1974年)。关于将泊松对数正态分布拟合到物种丰度数据。生物识别101-110·Zbl 0276.62088号 ·doi:10.2307/2529621
[8] Carlin,B.P.和Louis,T.A.(2010年)。数据分析的贝叶斯和经验贝叶斯方法。博卡拉顿:查普曼和霍尔/CRC·Zbl 0871.62012号
[9] Chen,M.H.和Ibrahim,J.G.(2003)。广义线性模型的共轭先验。中国统计局461-476·Zbl 1015.62074号
[10] 科恩,A.C.(1960)。截尾泊松分布的扩展。生物统计学16,446-450·Zbl 0114.35802号 ·doi:10.2307/2527694
[11] Conceiçáo,K.S.、Andrade,M.G.和Louzada,F.(2013年)。零修正泊松模型:贝叶斯方法,影响诊断,以及对巴西钩端螺旋体病通知数据的应用。《生物医学杂志》55,661-678·Zbl 1284.62169号 ·doi:10.1002/bimj.201100175
[12] Conceiçáo,K.S.、Louzada,F.、Andrade,M.G.和Helou,E.S.(2017年)。零修正功率系列分布及其障碍分布版本。统计计算与模拟杂志871842-1862·Zbl 07192034号
[13] Csiszár,I.(1967年)。概率分布差异和间接观测的信息型度量。匈牙利科学研究所2,299-318·Zbl 0157.25802号
[14] Dietz,E.和Böhning,D.(2000年)。关于零修正泊松模型中泊松参数的估计。计算统计与数据分析34,441-459·Zbl 1046.62085号 ·doi:10.1016/S0167-9473(99)00111-5
[15] Geisser,S.(1993)。预测推理:导论。查普曼和霍尔/CRC统计学与应用概率专著。博卡拉顿:CRC出版社·Zbl 0824.62001号
[16] Gelman,A.和Rubin,D.B.(1992年)。使用多序列的迭代模拟推断。统计科学457-472·Zbl 1386.65060号 ·doi:10.1214/ss/117701136
[17] Geweke,J.(1992年)。评估基于抽样的后验矩计算方法的准确性。贝叶斯统计4169-193。
[18] Ghitany,M.E.、Al-Mutairi,D.K.和Nadarajah,S.(2008)。零截尾泊松-林德利分布及其应用。模拟中的数学和计算机79,279-287·Zbl 1153.62308号 ·doi:10.1016/j.matcom.2007.11.021
[19] Ghosh,S.K.、Mukhopadhyay,P.和Lu,J.C.(2006)。零膨胀回归模型的贝叶斯分析。统计规划与推断杂志136,1360-1375·Zbl 1088.62139号 ·doi:10.1016/j.jspi.2004.10.008
[20] Gupta,M.和Ibrahim,J.G.(2009年)。具有高维数据的广义线性模型中贝叶斯分析的先验信息矩阵。中国统计局,1641-1663年·Zbl 1191.62043号
[21] Gurmu,S.和Trivedi,P.K.(1996)。休闲旅行计数模型中的多余零。《商业与经济统计杂志》14,469-477。
[22] Heilbron,D.C.和Gibson,D.R.(1990年)。关于艾滋病的共用针头使用和健康信念:零重计数数据的回归建模。海报会议。第六届艾滋病问题国际会议记录。加利福尼亚州旧金山。
[23] Hörmann,W.、Leydold,J.和Derflinger,G.(2004)。自动非均匀随机变量生成。柏林:斯普林格·Zbl 1038.65002号
[24] Hu,M.C.、Pavlicova,M.和Nunes,E.V.(2011年)。带有额外零的计数数据的零膨胀和障碍模型:来自HIV风险降低干预试验的示例。《美国药物和酒精滥用杂志》37,367-375。
[25] Jaggia,S.和Thosar,S.(1993年)。目标管理层阻力导致的多次投标:计数数据方法。《定量金融与会计评论》3,447-457。
[26] Karlis,D.和Xekalaki,E.(2005年)。混合泊松分布。《国际统计评论》73,35-58·Zbl 1104.62010年 ·doi:10.1111/j.1751-5823.005.tb00250.x
[27] Lambert,D.(1992)。零膨胀泊松回归,及其在制造缺陷中的应用。《技术计量学》34,1-14·Zbl 0850.62756号 ·doi:10.2307/1269547
[28] Lindley,D.V.(1958年)。置信分布和贝叶斯定理。英国皇家统计学会杂志,B辑(方法学)102-107·Zbl 0085.35503号 ·doi:10.1111/j.2517-6161.1958.tb00278.x
[29] McCulloch,R.E.(1989)。局部模型影响。《美国统计协会杂志》84,473-478。
[30] McDowell,A.(2003)。来自帮助台:跨栏跑模型。Stata Journal3178-184。
[31] McLachlan,G.J.和Peel,D.(2000)。有限混合模型。纽约:Wiley·Zbl 0963.62061号
[32] Mullahy,J.(1986年)。一些修改的计数数据模型的规范和测试。《计量经济学杂志》33,341-365。
[33] Ngatchou-Wandji,J.和Paris,C.(2011年)。关于零膨胀计数模型,用于模拟法国某些职业过敏性疾病发病率的年度趋势。《数据科学杂志》9,639-659。
[34] Oliveira,M.、Einbeck,J.、Higueras,M.、Ainsbury,E.、Puig,P.和Rothkam,K.(2016)。辐射诱发染色体畸变数据的零膨胀回归模型:一项比较研究。《生物医学杂志》58,259-279·Zbl 1381.62280号 ·doi:10.1002/bimj.201400233
[35] Peng,F.和Dey,D.K.(1995)。使用散度度量对异常值问题进行贝叶斯分析。加拿大统计杂志23,199-213·Zbl 0833.62028号 ·doi:10.2307/3315445
[36] R开发核心团队(2017年)。R: 统计计算的语言和环境。奥地利维也纳:R统计计算基金会。
[37] Ridout,M.、Demétrio,C.G.B.和Hinde,J.(1998年)。带有多个零的计数数据模型。第十九届国际生物识别会议论文集,第19卷,179-192。
[38] Roberts,G.O.、Gelman,A.和Gilks,W.R.(1997)。随机行走Metropolis算法的弱收敛性和最优尺度。应用概率年鉴7110-120·Zbl 0876.60015号 ·doi:10.1214/aoap/1034625254
[39] 罗德里格斯,J.(2003)。零膨胀分布的贝叶斯分析。统计学理论与方法中的传播32,281-289·Zbl 1024.62009年 ·doi:10.1081/STA-120018186
[40] Saffar,S.E.、Adnan,R.和Greene,W.(2012年)。截尾数据下跨栏泊松回归模型的参数估计。《侏罗纪经济学》57,189-198。
[41] 桑卡兰,M.(1970)。离散泊松-林德利分布。生物统计学26145-149。
[42] Shaban,S.A.(1981年)。关于离散泊松-逆高斯分布。生物医学杂志23297-303·Zbl 0477.62007年 ·doi:10.1002/bimj.47102309
[43] Shanker,R.(2016a)。离散Poisson-Shanker分布。雅各布斯生物统计杂志1,1-7。
[44] Shanker,R.(2016年b)。离散Poisson-Sujatha分布。国际概率统计杂志5,1-9。
[45] Shanker,R.和Fesshaye,H.(2016)。关于Poisson、Poisson-Lindley和Poisson-Sujatha分布的零截断及其应用。生物统计学与生物统计学国际期刊3,1-13。
[46] Umbach,D.(1981)。关于泊松分布和退化分布混合的推断。统计学理论与方法传播10,299-306·Zbl 0455.62023号 ·doi:10.1080/03610928108828039
[47] Wagh,Y.S.和Kamalja,K.K.(2018)。零膨胀模型和零膨胀泊松分布中的估计。统计学中的通信-模拟和计算47,2248-2265·Zbl 07550135号
[48] Zamani,H.和Ismail,N.(2010年)。负二项-林德利分布及其应用。数学与统计杂志6,4-9·Zbl 1188.91092号 ·doi:10.3844/jmssp.2010年4月9日
[49] Zellner,A.(1986年)。关于评估先验分布和使用g-先验分布的贝叶斯回归分析。贝叶斯推理和决策技术:布鲁诺·德·菲内蒂荣誉论文6,233-243·Zbl 0655.62071号
[50] Zorn,C.J.W.(1996年)。评估零膨胀和跨栏泊松规范。中西部政治科学协会18,1-16。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。