×

计数数据的边际零膨胀回归模型。 (英语) Zbl 1516.62463号

摘要:在许多学科中,经常分析带有多余零的数据集。用于分析此类数据的通用框架是零膨胀(ZI)回归模型。它将退化分布与零处的点质量与非退化分布混合在一起。ZI模型的估计量化了协变量对潜在随机变量均值的影响,而潜在随机变量往往不是主要关注的数量。最近,边际零膨胀泊松(MZIP[D.L.长等,“具有整体暴露效应的边缘化零膨胀泊松回归模型”,《Stat.Med.33》,第29期,5151–5165(2014;数字对象标识代码:10.1002/sim.6293)])和负二项式(MZINB[J.S.普雷瑟等,“边缘化零膨胀负二项回归与龋齿应用”,同上,第10号,1722-1735(2016;数字对象标识代码:10.1002/sim.6804)])引入了直接模拟平均响应的模型。这些模型产生的协变量效应具有简单的解释,对于许多应用来说,这些解释比ZI回归更具吸引力。本文概述了边际零膨胀模型的一般框架,其中潜在分布是指数分散族的成员,重点讨论计数数据的常见分布。特别是,我们的讨论包括之前没有讨论过的边际零膨胀二项式(MZIB)模型。给出了基于EM算法的最大似然估计的细节,并通过仿真检验了估计量的性质以及基于Wald和似然比的推理。给出的两个示例说明了MZIP、MZINB和MZIB模型在实际数据分析中的优势。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] J.M.Albert、W.Wang和S.Nelson,零膨胀回归模型的总体暴露效应评估及其在龋病中的应用,统计。方法医学研究23(2014),第257-278页。doi:10.1177/0962280211407800·doi:10.1177/0962280211407800
[2] J.Catty、P.Lissouba、S.White、T.Becker、R.E.Drake、A.Fioritti、M.Knapp、C.Lauber、W.Rössler、T.Tomov、J.van Busschbach、D.Wiersma和T.Burns,严重精神疾病患者就业的预测因素:一项国际六中心随机对照试验的结果《英国精神病学杂志》192(2008),第224-231页。doi:10.1192/bjp.bp.107.041475·doi:10.1192/bjp.bp.107.041475
[3] B.H.Cohen,召回分类单词列表J.Exp.心理医生。66(1963年),第227-234页。doi:10.1037/h0048846·doi:10.1037/h0048846
[4] M.克劳德,比例的二项方差分析J.R.统计。Soc.:序列号。A(Appl.Stat.)27(1977年),第34-37页。
[5] W.Greene,泊松和负二项回归模型中多余零点的解释和样本选择《EC-94-10报告》,纽约大学经济系,纽约,1994年。
[6] D.B.霍尔,具有随机效应的零膨胀泊松和二项回归:一个案例研究《生物统计学》第56卷(2000年),第1030-1039页。doi:10.1111/j.0006-341X.2000.01030.x·兹比尔1060.62535 ·doi:10.1111/j.0006-341X.2000.01030.x
[7] P.J.Heagerty,纵向二进制数据的边缘指定逻辑正态模型《生物统计学》第55卷(1999年),第688-698页。doi:10.1111/j.0006-341X.1999.00688.x·兹比尔1059.62566 ·doi:10.1111/j.0006-341X.1999.00688.x
[8] D.C.海尔布伦,添加零的计数数据的零改变和其他回归模型,生物。《J.36》(1994年),第531-547页。doi:10.1002/bimj.4710360505·Zbl 0846.62053号 ·doi:10.1002/bimj.4710360505
[9] S.Jackman,pscl:斯坦福大学政治科学计算实验室开发的R类和方法。斯坦福大学政治学系,斯坦福大学,加利福尼亚州。R软件包版本1.4.92015。
[10] B.约根森,指数色散模型J.R.统计。Soc.序列号。B(统计学,Methodol.)(1987年),第127-162页·Zbl 0662.62078号
[11] W.Kassahun、T.Neyens、G.Molenberghs、C.Faes和G.Verbeke,具有多余零的过度分散和相关计数数据的边缘化多级跨栏和零膨胀模型《Stat.Med.33》(2014年),第4402-4419页。doi:10.1002/sim.6237·Zbl 1457.62349号 ·doi:10.1002/sim.6237
[12] D.兰伯特,零膨胀泊松回归及其在制造缺陷中的应用《技术计量学》第34卷(1992年),第1-14页。doi:10.2307/1269547·Zbl 0850.62756号
[13] J.Lawless等人,负二项和混合泊松回归,可以。《美国联邦法律大全》第15卷(1987年),第209-225页。doi:10.2307/3314912·Zbl 0632.62060号 ·doi:10.2307/3314912
[14] D.L.Long、J.S.Preisser、A.H.Herring和C.E.Golin,具有整体暴露效应的边缘化零膨胀泊松回归模型《Stat.Med.33》(2014年),第5151-5165页。数字对象标识代码:10.1002/sim.6293·数字对象标识代码:10.1002/sim.6293
[15] M.N.Maunder和A.E.Punt,标准化渔获量和努力量数据:对最近方法的回顾,鱼。第70号决议(2004年),第141-159页。doi:10.1016/j.fishres.2004.08.002·doi:10.1016/j.fishres.2004.08.002
[16] L.H.Moulton、F.C.Curriero和P.F.Barroso,定量HIV RNA数据的混合模型,统计。方法医学研究11(2002),第317-325页。doi:10.1191/0962280202sm292ra·兹比尔1121.62640 ·doi:10.1191/0962280202sm292ra
[17] L.Moulton和N.Halsey,带有检测限的混合模型用于疫苗抗体反应的回归分析《生物统计学》51(1995),第1570-1578页。doi:10.2307/2533289·Zbl 0875.62502号 ·doi:10.2307/2533289
[18] M.Olsen和J.Schafer,半连续纵向数据的两部分随机效应模型《美国统计杂志》。协会96(2001),第730-745页。doi:10.1198/016214501753168389·Zbl 1017.62064号
[19] J.S.Preisser、K.Das、D.L.Long和K.Divaris,边缘化零膨胀负二项回归及其在龋病中的应用,《医学总汇》第35卷(2016年),第1722-1735页。数字对象标识代码:10.1002/sim.6804·数字对象标识代码:10.1002/sim.6804
[20] R核心团队,R:统计计算的语言和环境,R统计计算基金会,奥地利维也纳,2015年。
[21] M.Ridout、C.G.Demétrio和J.Hinde,带多个零的计数数据模型《第十九届国际生物识别会议论文集》,南非开普敦开普敦大学,1998年第19卷,第179-192页。
[22] D.Todem、K.Kim和W.W.Hsu,零膨胀计数数据的边际平均模型,生物统计学。2016. ·兹比尔1390.62313 ·doi:10.1111/biom.12492
[23] M.W.van Iersel、R.D.Oetting和D.B.Hall,通过地下灌溉施用吡虫啉防治一品红银叶粉虱(同翅目:粉虱科)《经济学杂志》。昆虫。93(2000),第813-819页。doi:10.1603/0022-0493-93.3813·doi:10.1603/0022-0493-93.3813
[24] R.Wedderburn,拟似然函数、广义线性模型和Gauss-Newton方法《生物统计学》第61卷(1974年),第439-447页·兹比尔0292.62050
[25] A.Yešilova、M.B.Kaydan和Y.Kaya,使用零膨胀回归模型对带有多余零的虫卵数据进行建模,Hacettepe J.数学。《美国联邦法律大全》第39卷(2010年),第273-282页·Zbl 1196.62148号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。