×

过分散计数数据的Pólya-Appli回归模型。 (英语) Zbl 07289539号

摘要:以线性方差函数和均值与协变量之间的对数关系为特征的对数泊松模型嵌入广义线性模型(GLM)提供的指数族回归框架中,仍然是用回归模型分析计数数据响应的标准方法。然而,在实践中,计数数据往往过于分散,因此不利于泊松回归。因此,本文的主要目标是介绍一个基于Pólya-Alppli(PA)分布的对数线性模型,该模型是泊松分布的扩展,通过包含分散参数来解决过度分散的问题。本文讨论了最大似然(ML)估计程序,以及确定PA回归是否需要标准泊松回归的测试。此外,还提出了一种简单的EM型算法,用于迭代计算ML估计。为了研究偏离误差假设的情况以及异常值的存在,我们基于标准化皮尔逊残差进行残差分析。此外,对于不同的参数设置和样本大小,进行了各种模拟。最后,我们在三个真实数据集上演示了新方法,其中两个来自生物学研究,另一个来自暴力研究。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿特金森,AC 1985绘图、转换和回归牛津:牛津大学出版社·Zbl 0582.62065号
[2] 负担,CJ(2014a)polyaAepli:Pólya-Aeppli分布的实现.R包版本2.0。统一资源定位地址https://CRAN.R-项目。
[3] 负担,CJ(2014b)Pólya-Aeppli分布的R实现。ArXiv电子版1406.2780。统一资源定位地址http://adsabs.harvard.edu/abs/2014arXiv1406.2780B。[edu/abs/2014arXiv1406.2780B]
[4] Chen,CW,Randolph,P,Tian-Shy,L(2005)使用CUSUM控制方案监测复合泊松生产环境中的质量水平:几何泊松过程。质量工程17, 207-217. ·doi:10.1081/QEN-200056448
[5] Crawley,MJ(2007)R书纽约州纽约市:John Wiley&Sons·Zbl 1115.62007号 ·数字对象标识代码:10.1002/9780470515075
[6] Czado,C,Gneiting,T,Held,L(2009)计数数据的预测模型评估。生物计量学65 1254-1261. ·兹比尔1180.62162 ·文件编号:10.1111/j.1541-0420.2009.01191.x
[7] Dempster,AP,Laird,NM,Rubim,DB(1977)通过em算法从不完整数据中获得最大似然(带讨论)。英国皇家统计学会杂志B辑39, 1-38. ·Zbl 0364.62022号
[8] Efron,B,Tibshirani,R(1993)引导程序简介纽约州纽约市:查普曼和霍尔·Zbl 0835.62038号 ·doi:10.1007/978-1-4899-4541-9
[9] Hilbe,JM(2011)负二项回归纽约州纽约市:剑桥大学出版社·Zbl 1269.62063号 ·doi:10.1017/CBO9780511973420
[10] Hinde,J,Demetrio,CGB(2000)过度分散:模型与估计第1卷,第110页。加州伯克利:加州大学伯克利分校。
[11] Johnson,NL,Kotz,S,Kemp,AW(1992年)单变量离散分布,第2版。纽约州纽约市:John Wiley&Sons·Zbl 0773.62007号
[12] Marin,J,Jones,O,Hadlow,W(1993)柱状苹果树的微繁殖。园艺科学杂志68, 289-297. ·doi:10.1080/00221589.1993.11516354
[13] McCullagh,P,Nelder,JA(1997)广义线性模型,第2版。伦敦:查普曼和霍尔/CRC·Zbl 0588.62104号
[14] Ozel,G,Inal,C(2010)几何泊松分布的概率函数。统计计算与模拟杂志, 80 479-487. ·Zbl 1197.60008号 ·doi:10.1080/00949650802711925
[15] Pólya,G(1930)Surquelques points de la theorie des probabilityés[关于概率论的一些观点]。亨利·彭加莱学院年鉴(法语),117-161。
[16] Ridout,MS,Demétrio,CGB,Hinde,JP(1998)多个零的计数数据模型。第十九届国际生物统计学会议记录开普敦,第179-192页。
[17] Robin,S,Schbath,S,Vandewalle,V(2007)《比较基序计数例外的统计检验》。生物信息学, 8, 1-20.
[18] Rosychuk,RJ,Huston,C,Prasad,NGN(2006)使用复合泊松分布进行空间事件聚类检测。生物计量学, 61, 465-470. ·Zbl 1097.62135号 ·文件编号:10.1111/j.1541-0420.2005.00503.x
[19] R开发核心团队(2015)R: 统计计算语言与环境维也纳:R统计计算基金会。
[20] Waiselvisz,JJ(2014)《马帕·达维奥伦西亚2014:Os Jovens do Brasil》(Map of Violencia 2014:the Youth of Brasil)。Braslia:巴西佛罗里达州/代表团主席Geral秘书处/青年国家秘书处/种族促进波兰秘书处。统一资源定位地址http://www.mapadaviolencia.org.br/pdf2014/Mapa2014Jovens Brasil.pdf(上次访问日期:2015年12月23日,葡萄牙语)。
[21] Zhu,C,Byrd,RH,Lu,P,Nocedal,J(1997)算法778:L-BFGS-B:大规模有界约束训练优化的Fortran子程序。ACM数学软件汇刊, 23 550-560. doi 10.1145/279232.279236。网址:http://[doi.acm.org/10.1145/279232.279236]·Zbl 0912.65057号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。