×

逆高斯分布的新视角及其在保险和经济数据中的应用。 (英语) Zbl 1516.62554号

概要:保险和经济数据通常是正数,我们需要在为其分布选择统计模型时考虑到这一特点。一个例子是逆高斯分布(IG),它是最著名和考虑过的正支持分布之一。为了增加IG分布在保险和经济数据中的使用,我们提出了一种方便的基于模型的参数化方法,从而得到重新参数化的IG(rIG)分布;它允许/简化了IG分布在各种统计分支中的使用,并且我们给出了一些示例。在非参数统计中,我们基于rIG核定义了一个平滑器。通过构造,估计器定义明确,不会将概率质量分配给不切实际的负值。我们采用似然交叉验证来选择平滑参数。在稳健统计中,我们提出了受污染的IG分布,这是rIG分布的一种重尾泛化,以适应轻微的异常值。最后,对于基于模型的聚类和半参数密度估计,我们给出了rIG分布的有限混合。我们使用EM算法获得了混合模型和污染模型参数的最大似然估计。我们使用身体伤害索赔的保险数据和意大利家庭收入的经济数据来说明模型。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 艾特肯,A.C.,代数和超越方程根的系列公式,Proc。罗伊。Soc.Edinb.公司。,45, 14-22 (1926) ·doi:10.1017/S0370164600024871
[2] 艾特金,M。;Wilson,G.T.,《混合模型、离群值和EM算法》,《技术计量学》,22,325-331(1980)·Zbl 0466.62034号 ·doi:10.1080/00401706.1980.10486163
[3] E·阿尔瓦雷斯。;加尔科纳·费尔南德斯,R.M。;Blanco-Encomienda,F.J。;穆尼奥斯,J.F.,《异常值对收入和生活条件的经济和社会调查的影响》,世界学术期刊。科学。,工程技术。,国际法学协会,行为。,教育部。,经济。,公共汽车。工业工程,8,3276-3280(2014)
[4] Amoh,R.K.,逆高斯分布混合物中参数的估计,Commun。统计理论方法,13,1031-1043(1984)·doi:10.1080/03610928408828738
[5] 巴格纳托,L。;Punzo,A.,单峰β和γ密度的有限混合物和k-bumps算法,计算。统计,28,1571-1597(2013)·Zbl 1306.65024号 ·doi:10.1007/s00180-012-0367-4
[6] 巴格纳托,L。;Punzo,A。;Zoia,M.G.,《多元轻量级正态分布及其在基于模型聚类中的应用》,加拿大。J.Stat.,45,95-119(2017)·Zbl 1462.62308号 ·doi:10.1002/cjs.11308
[7] 巴拉贝西,L。;Cerasa,A。;Cerioli,A。;Perrotta,D.,回火分布的新家族,电子。J.Stat.,103871-3893(2016)·Zbl 1357.62072号 ·doi:10.1214/16-EJS1214
[8] 巴拉贝西,L。;Cerasa,A。;佩罗塔,D。;Cerioli,A.,《利用Tweedie分布对国际贸易数据进行反欺诈和政策支持建模》,欧洲期刊Oper。决议,2481031-1043(2016)·Zbl 1346.62154号 ·doi:10.1016/j.ejor.2015.08.042
[9] 伯纳迪,M。;Maruotti,A。;Petrella,L.,损失分布的倾斜混合模型:贝叶斯方法,Insur。数学。经济。,51, 617-623 (2012) ·Zbl 1285.62027号 ·doi:10.1016/j.insmastheco.2012.08.002
[10] Böhning,D。;迪茨,E。;Schaub,R。;施拉特曼,P。;Lindsay,B.G.,单参数指数族密度混合物的似然比分布,Ann.Inst.Stat.Math。,46, 373-388 (1994) ·兹比尔0802.62017 ·doi:10.1007/BF01720593
[11] Carreira-Perpiñán,M.A.,混合高斯分布的模态发现,IEEE。事务处理。图案。分析。机器。智力。,22, 1318-1323 (2000) ·数字标识代码:10.1109/34.888716
[12] Carreira-Perpiñán,M.A.,《用概率模型和连续性约束重建序列数据》,载于《神经信息处理系统进展》,S.A.Solla,T.K.Leen和K.R.Müller,eds.,第12卷,麻省理工学院出版社,伦敦,2000年,第414-420页。
[13] 陈秀霞,利用伽玛核估计概率密度函数,《统计数学年鉴》。,52471-480(2000年)·Zbl 0960.62038号 ·doi:10.1023/A:1004165218295
[14] Cheng,R.C.H。;Amin,N.A.K.,《来源未知的逆高斯分布参数的最大似然估计》,《技术计量学》,23,257-263(1981)·Zbl 0469.62021号 ·doi:10.2307/1267789
[15] Chhikara,R.S.和Folks,J.L.,《逆高斯分布:理论、方法和应用》,《统计学:一系列教科书和专著》,Taylor&Francis,纽约,1988年·Zbl 0701.62009号
[16] Chotikapanich,D.和Griffiths,W.E.,《使用伽马密度混合估计收入分布》,载于《收入分布和洛伦兹曲线建模》,D.Chotikabanich编辑,《不平等、社会排斥和福利经济研究》,第16章,纽约斯普林格,2008年,第285-302页·Zbl 1151.91642号
[17] Choy,S.B。;Chan,J.S。;Makov,U.E.,使用比例混合分布对损失准备金数据进行稳健贝叶斯分析,J.Appl。统计,43,396-411(2016)·Zbl 1514.62490号 ·doi:10.1080/02664763.2015.063115
[18] Choy,S.T.B。;Chan,C.M.,保险应用中的比例混合分布,ASTIN Bull。,33, 93-104 (2003) ·Zbl 1098.62566号 ·doi:10.1017/S0515036100013325
[19] 库佩卡,G。;Ridolfi,A。;Idier,J.,Scand。《统计杂志》,30,45-59(2003)·Zbl 1034.62018年 ·doi:10.1111/1467-9469.00317
[20] 科威尔,F.A。;Victoria-Feser,M.-P.,不等式测度的稳健性,《计量经济学》,64,77-101(1996)·Zbl 0861.90029号 ·doi:10.2307/2171925
[21] 科威尔,F.A。;Victoria Feser,M.-P.,《存在污染数据的福利排名》,计量经济学,701221-233(2002)·Zbl 1121.91403号 ·数字对象标识代码:10.1111/1468-0262.00324
[22] Dagum,C.,《个人收入分配的新模型:规范和估计》,摘自《收入分配和洛伦兹曲线建模》,D.Chotikapanich主编,《平等、社会排斥和福利经济研究》第5卷,第1章,纽约斯普林格出版社,2008年,第3-25页·Zbl 1151.91644号
[23] Dang,U.J。;Punzo,A。;医学博士麦克尼古拉斯。;Ingrassia,S.公司。;Browne,R.P.,高斯加权模型的多元响应和简约性,J.Classif。,34, 4-34 (2017) ·Zbl 1364.62149号 ·doi:10.1007/s00357-017-9221-2
[24] Dasgupta,A。;Raftery,A.E.,通过基于模型的聚类检测杂波空间点过程中的特征,J.Am.Stat.Assoc.,93294-302(1998)·Zbl 0906.62105号 ·数字标识代码:10.1080/01621459.1998.10474110
[25] 戴维斯,L。;Gather,U.,《多个异常值的识别》,《美国统计协会期刊》,88,782-792(1993)·Zbl 0797.62025号 ·doi:10.1080/01621459.1993.10476339
[26] Day,N.E.,估计正态分布混合的成分,生物特征,56,463-474(1969)·Zbl 0183.48106号 ·doi:10.1093/biomet/56.3.463
[27] Dennis,J.E.J.(编辑),《非线性拟合算法》,北约高级研究研讨会:剑桥大学出版社,剑桥,1981年·Zbl 0545.65007号
[28] 德萨博,W.S。;Cron,W.L.,《聚类线性回归的最大似然方法》,J.Classif。,5, 249-282 (1988) ·Zbl 0692.62052号 ·doi:10.1007/BF01897167
[29] Devroye,L。;James,L.,《关于稳定定律的模拟和性质》,Stat.Methods Appt。,23, 307-343 (2014) ·Zbl 1332.65009号 ·doi:10.1007/s10260-014-0260-0
[30] 戴·D·K。;郭,L。;Sahu,S.K.,《确定混合物分布中成分数量的贝叶斯预测方法》,《统计计算》。,5, 297-305 (1995) ·doi:10.1007/BF00162502
[31] Dutang,C.和Charpentier,A.,CASdatasets:保险数据集(官方网站)。版本1.0-6(2016-05-28),2016年。
[32] 法托里尼,L。;Lemmi,A.,《达贡个人收入分配的随机解释:一个故事》,《统计学》,66,325-329(2006)·Zbl 1188.62362号
[33] Feser,M.P.V.,《个人收入分配模型的稳健估计》。研究论文DARP/4,伦敦经济和政治学院,伦敦,1993年。
[34] 福克斯,J.L。;Chhikara,R.S.,《逆高斯分布及其统计应用——综述》,J.Royal Stat.Soc.Ser。B(Stat.Methodol.),第40页,第263-289页(1978年)·Zbl 0408.62011号
[35] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,美国统计协会,97,611-631(2002)·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[36] Gelman,A。;Carlin,J.B。;斯特恩,H.S。;邓森,D.B。;Vehtari,A。;Rubin,D.B.,《贝叶斯数据分析》(2013),查普曼和霍尔/CRC统计科学文本。Taylor&Francis:Chapman&Hall/CRC统计科学文本。佛罗里达州博卡拉顿Taylor&Francis
[37] Grabchak,M.,《回火稳定分布:多尺度过程的随机模型》(2016),Springer Briefs in Mathematics。施普林格国际出版:施普林格数学简介。施普林格国际出版公司,巴塞尔·Zbl 1361.60003号
[38] Grün,B。;Leisch,F.,FlexMix第2版:具有相伴变量和可变及常数参数的有限混合物,J.Stat.Softw。,28, 1-35 (200810) ·doi:10.18637/jss.v028.i04
[39] Hathaway,R.J.,正态混合分布最大似然估计的约束公式,《美国统计年鉴》,第13卷,第795-800页(1985年)·Zbl 0576.62039号 ·doi:10.1214/aos/1176349557
[40] Hathaway,R.J.,一元正态混合的约束EM算法,J.Stat.Compute。模拟。,23, 211-230 (1986) ·doi:10.1080/00949658608810872
[41] Hennig,C.,《线性回归的不动点簇:计算和比较》,J.Classif。,19, 249-276 (2002) ·Zbl 1017.62057号 ·doi:10.1007/s00357-001-0045-7
[42] Ibragimov,M.、Ibragimo,R.和Walden,J.,《经济和金融中的重尾分布和稳健性》,统计学讲义第214卷。施普林格国际出版公司,纽约,2015年·Zbl 1397.62007号
[43] Ingrassia,S.公司。;Punzo,A.,回归混合的决策边界,J.Korean Stat.Soc.,45,295-306(2016)·Zbl 1341.62181号 ·doi:10.1016/j.jkss.2015.11.005
[44] Izenman,A.J.,《现代多元统计技术:回归、分类和流形学习》(2008),Springer:Springer,纽约·Zbl 1155.62040号
[45] Jeon,Y。;Kim,J.H.T.,保险损失数据的伽马核密度估计,保险。数学。经济。,53, 569-579 (2013) ·Zbl 1290.62099号 ·doi:10.1016/j.insmastheco.2013.08.009
[46] 约翰逊,N.L。;Kotz,S.,连续单变量分布,第1卷(1970),John Wiley&Sons:John Willey&Sons,纽约·Zbl 0213.21101号
[47] Keribin,C.,《mélange现代秩序的估计》,科学研究院-序列号。I-数学。,326, 243-248 (1998) ·Zbl 0954.62023号
[48] Keribin,C.,混合模型阶数的一致估计,Sankhyá:印度J.Stat.Ser。A、 62、49-66(2000)·Zbl 1081.62516号
[49] 克莱伯,C。;Kotz,S.,《经济学和精算科学中的统计规模分布》(2003),John Wiley&Sons:John Willey&Sons,纽约·Zbl 1044.62014年
[50] 克鲁格曼,S.A。;潘杰尔,H.H。;Willmot,G.E.,《损失模型:从数据到决策》(Loss Models:From Data to Decisions)(2012年),Wiley:Wiley,Hoboken,NJ·Zbl 1272.62002号
[51] Lee,S.C.K。;Lin,X.S.,《通过Erlang分布的混合建模和评估保险损失》,《北美精算师》。J.,14,107-130(2010)·doi:10.1080/10920277.2010.10597580
[52] Lumley,T。;Scott,A.、AIC和BIC,用于复杂调查数据建模,J.Surv。统计方法。,3, 1-18 (2015) ·doi:10.1093/jssam/smu021
[53] Maruotti,A。;Punzo,A.,具有协变量和离群值的多元纵向数据的基于模型的时变聚类,计算。统计数据。分析。,113, 475-496 (2017) ·Zbl 1464.62128号 ·doi:10.1016/j.csda.2016.05.024
[54] Maruotti,A。;拉波尼,V。;Lagona,F.,处理相关随机效应模型中的内生性和非负性:来自动态支出的证据,Biom。J.,58,280-302(2016)·Zbl 1381.62275号 ·doi:10.1002/bimj.201400121
[55] Mazza,A.和Punzo,A.,《特定年龄人口统计指标的离散贝塔核分级》,载于《统计建模和数据分析的新视角》,S.Ingrassia,R.Rocci和M.Vichi,eds.,《分类、数据分析和知识组织研究》,Springer-Verlag,柏林,2011年,第127-134页。
[56] Mazza,A.和Punzo,A.,《通过自适应离散贝塔核进行分级》,载于《分类和数据挖掘》,A.Giusti,G.Ritter和M.Vichi,eds.,《分类、数据分析和知识组织研究》,Springer-Verlag,柏林,2013年,第243-250页·Zbl 1451.68022号
[57] Mazza,A.和Punzo,A.,《使用变异系数进行自适应离散贝塔核分级》,载于《数据分析统计模型》,P.Giudici,S.Ingrassia和M.Vichi,eds.,《分类、数据分析和知识组织研究》,Springer International Publishing,Basel,2013年,第225-232页。
[58] Mazza,A。;Punzo,A.,DBKGrad:安R(右)离散贝塔核技术死亡率分级包,J.Stat.Softw。,57,代码段1-18(2014)·doi:10.18637/jss.v057.c02
[59] Mazza,A。;Punzo,A.,死亡率数据的双变量离散β核分级,寿命数据。分析。,21, 419-433 (2015) ·Zbl 1322.62128号 ·doi:10.1007/s10985-014-9300-1
[60] Mazza,A。;Punzo,A.,多变量污染正态回归模型的混合,《统计年鉴》第页·Zbl 1435.62238号 ·doi:10.1007/s00362-017-0964-y
[61] Miljkovic,T。;Grün,B.,使用混合分布建模损失数据,保险。数学。经济。,70, 387-396 (2016) ·Zbl 1373.62527号 ·doi:10.1016/j.insmateco.2016.06.019
[62] 莫加达姆,B。;Pentland,A.,对象表示的概率视觉学习,IEEE。事务处理。模式分析。机器。智力。,19696-710(1997年)·doi:10.1109/34.598227
[63] Nash,J.,关于最佳实践优化方法R(右)、J.Stat.Softw.、。,60, 1-14 (2014) ·doi:10.18637/jss.v060.2002
[64] Nolan,J.P.,稳定分布的参数化和模式,Stat.Probab。莱特。,38, 187-195 (1998) ·Zbl 1246.60028号 ·doi:10.1016/S0167-7152(98)00010-8
[65] Pasek,J.,《权重:加权和加权统计》。版本0.85(2016-02-12),2016年。
[66] Punzo,A.,《离散贝塔型模型》,收录于《分类作为研究工具》,H.Locarek-Junge和C.Weihs主编,《分类、数据分析和知识组织研究》,施普林格出版社,柏林,2010年,第253-261页。
[67] Punzo,A。;Maruotti,A.,聚类多元纵向观测:污染高斯隐马尔可夫模型,J.Compute。图表。Stat.,25,1097-1116(2016)·doi:10.1080/10618600.2015.1089776
[68] Punzo,A。;Mazza,A。;Maruotti,A.,用离群值拟合保险和经济数据:基于污染伽马分布有限混合的灵活方法,J.Appl。统计,45,2563-2584(2018)·Zbl 1516.62555号 ·doi:10.1080/02664763.2018.1428288
[69] Punzo,A。;Mazza,A。;McNicholas,P.,污染混合物:R(右)用于拟合多元污染正态分布的简约混合物的软件包,J.Stat.Softw。,85, 1-25 (2018) ·doi:10.18637/jss.v085.i10
[70] Punzo,A。;McNicholas,P.D.,多元污染正态分布的节俭混合物,生物。J.,58,1506-1537(2016)·Zbl 1353.62124号 ·doi:10.1002/bimj.201500144
[71] Punzo,A。;McNicholas,P.D.,通过污染高斯聚类加权模型进行回归分析中的稳健聚类,J.Classif。,34, 249-293 (2017) ·Zbl 1373.62316号 ·数字对象标识代码:10.1007/s00357-017-9234-x
[72] Punzo,A。;Zini,A.,紧区间上连续测度和混合测度的离散近似,Stat.Pap。,53, 563-575 (2012) ·兹比尔1254.62109 ·doi:10.1007/s00362-011-0365-6
[73] Rachev,S.T。;Kim,Y.S。;Bianchi,M.L。;Fabozzi,F.J.,《利维过程和波动性聚类的金融模型》(2011年),新泽西州霍博肯威利出版社·兹比尔1217.91003
[74] Raftery,A.E.,社会研究中的贝叶斯模型选择,社会学。Methodol.方法。,25, 111-164 (1995) ·doi:10.2307/271063
[75] R(右):统计计算的语言与环境(2018),R(右)统计计算基础:R(右)奥地利维也纳统计计算基金会
[76] 伦帕拉,G.A。;Derrig,R.A.,《通过EM算法对索赔严重性中的隐藏风险进行建模》,《北美法案》。J.,9,108-128(2005)·Zbl 1085.62515号 ·doi:10.1080/10920277.2005.10596206
[77] Ritter,G.,《稳健聚类分析和变量选择》(2015),CRC出版社:CRC出版社,博卡拉顿·Zbl 1341.62037号
[78] Schwarz,G.,《估算模型的维数》,《Ann.Stat.》,第6期,第461-464页(1978年)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[79] 塞德尔,W。;莫斯勒,K。;Alker,M.,《关于混合模型中似然比检验的警告说明》,《Ann.Inst.Stat.Math.》。,52, 481-487 (2000) ·Zbl 0960.62025号 ·doi:10.1023/A:100411419204
[80] Seshadri,V.,《逆高斯分布:统计理论与应用》(The Inverse Gaussian Distribution:Statistical Theory and Applications)(2012年),施普林格出版社:施普林格,纽约·Zbl 0942.62011号
[81] Silber,J.,《收入不平等衡量手册》(2012),Springer:Springer,纽约
[82] Subedi,S。;Punzo,A。;Ingrassia,S.公司。;McNicholas,P.D.,通过聚类加权因子分析仪进行聚类和分类,高级数据。分析。分类。,7, 5-40 (2013) ·Zbl 1271.62137号 ·doi:10.1007/s11634-013-0124-8
[83] Subedi,S。;Punzo,A。;Ingrassia,S.公司。;McNicholas,P.D.,基于稳健模型的聚类和降维的聚类加权t因子分析,统计方法。附录。,24, 623-649 (2015) ·Zbl 1416.62362号 ·doi:10.1007/s10260-015-0298-7
[84] Takeuchi,K.,《信息统计的分布和模型拟合的标准》,Suri-Kagaku(数学科学),153,12-18(1976)
[85] 田中,K。;Takemura,A.,当尺度参数呈指数小时,位置尺度分布的有限混合的最大似然估计器的强一致性,Bernoulli,121003-1017(2006)·Zbl 1117.62025号 ·doi:10.3150/bj/1165269148
[86] Titterington,D.M。;A.F.M.史密斯。;Makov,U.E.,《有限混合分布的统计分析》(1985),John Wiley&Sons:John Willey&Sons,纽约·Zbl 0646.62013.中
[87] Tweedie,M.C.K.,逆高斯分布的统计特性。一、 安。数学。统计,28,362-377(1957)·兹伯利0086.35202 ·doi:10.1214/aoms/1177706964
[88] van Praag,B。;Hagenaars,A。;van Eck,W.,《分类和观察误差对收入不平等计量的影响》,《计量经济学》,第51期,第1093-1108页(1983年)·doi:10.2307/1912053
[89] 文丘里尼,S。;Dominici,F。;Parmigiani,G.,《重尾分布的伽马形状混合物》,《Ann.Appl。Stat.,2756-776(2008)·Zbl 1400.62292号 ·doi:10.1214/07-AOAS156
[90] Verdinelli,I。;Wasserman,L.,使用吉布斯采样器对异常值问题进行贝叶斯分析,统计计算。,1, 105-117 (1991) ·doi:10.1007/BF01889985
[91] Weich,S。;Lewis,G。;Jenkins,S.P.,《英国的收入不平等和自测健康》,J.流行病学。Commun公司。健康,56,436-441(2002)·doi:10.1136/jech.56.6.436
[92] 雨刷器,M。;因苏阿,D.R。;Ruggeri,F.,《伽马分布与应用的混合》,J.Compute。图表。《统计》,第10卷,第440-454页(2001年)·doi:10.1198/106186001317115054
[93] Wu,C.J.,关于EM算法的收敛性,Ann.Stat.,11,95-103(1983)·Zbl 0517.62035号 ·doi:10.1214操作系统/117634060
[94] 姚,W。;Li,L.,一种新的回归模型:模态线性回归,Scand。《美国法律总汇》,41656-671(2014)·Zbl 1309.62119号 ·doi:10.1111/sjos.12054
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。