×

用于建模和预测死亡率的基于树的机器学习方法。 (英文) Zbl 1504.91242号

摘要:为了改进随机死亡率模型的预测,机器学习最近进入了死亡率文献。本文建议使用两种纯粹的基于树的机器学习模型:随机森林和梯度提升,基于不同的对数死亡率来生成更准确的死亡率预测。将这些预测与传统随机死亡率模型的预测以及随机森林和随机模型的梯度增强变量的预测进行了比较。比较基于模型置信集程序。结果表明,在大多数情况下,基于树的纯模型显著优于所有其他模型。为了解决与机器学习模型相关的缺乏可解释性的问题,我们演示了如何提取有关基于树的模型所揭示的关系的信息。为此,我们考虑了变量重要性、部分相关图和变量分割条件。样本内拟合的结果表明,基于树的模型对于检测传统方法无法识别的变量内部和变量之间的模式非常有用。

MSC公司:

91G05号 精算数学
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aburto,J.M.、Wensink,M.、Van Raalte,A.和Lindahl Jacobsen,R.(2018)《减少丹麦寿命不平等对预期寿命的潜在益处:国际比较和死因分析》。BMC公共卫生,18(1),831。doi:doi:10.1186/s12889-018-5730-0。
[2] Anderson,B.A.和Silver,B.D.(1989)《苏联死亡率的变化形式,1958-1985:对新旧证据的评估》。人口研究,43(2),243-265。doi:doi:10.1080/0032472031000144106。
[3] Bernardi,M.和Catania,L.(2018)R.国际计算经济学和计量经济学杂志的模型置信集包,8(2),144-158。doi:doi:10.1504/IJCEE.2018.091037。
[4] Blum,A.和Monnier,A.(1989)《苏联近期死亡率趋势:新证据》。《人口研究》,43(2),211-241。doi:doi:10.1080/0032472031000144096。
[5] Breiman,L.(2001)《随机森林》。机器学习,45,5-32。doi:doi:10.1023/doi:A:1010933404324·Zbl 1007.68152号
[6] Breiman,L.、Friedman,J.、Stone,C.J.和Olshen,R.A.(1984)分类和回归树。加利福尼亚州贝尔蒙特:华兹华斯国际集团·Zbl 0541.62042号
[7] Cairns,A.J.G.、Blake,D.和Dowd,K.(2006)《具有参数不确定性的随机死亡率的双因素模型:理论和校准》。《风险与保险杂志》,73(4),687-718。doi:doi:10.1111/j.1539-6975.2006.00195.x。
[8] Cairns,A.J.G.、Blake,D.、Dowd,K.、Coughlan,G.D.、Epstein,D.、Ong,A.和Balevich,I.(2009年)使用英格兰、威尔士和美国的数据对随机死亡率模型进行定量比较。北美精算杂志,13(10,1-35。doi:doi:10.1080/10920277.2009.10597538·Zbl 1484.91376号
[9] Cairns,A.J.G.、Blake,D.和Dowd,K.(2008)《死亡率风险的建模和管理:综述》。斯堪的纳维亚精算杂志,2-379-113。doi:doi:10.1080/03461230802173608·Zbl 1224.91048号
[10] Currie,I.D.(2006)用P样条曲线平滑和预测死亡率。在精算师学会发表的演讲。http://www.ma.hw.ac.uk/{}iain/research/talks.html(2020年3月11日访问)。
[11] Deng,H.(2019)用inTrees解释树集合。国际数据科学与分析杂志,7,277-287。doi:doi:10.1007/s41060-018-0144-8。
[12] Deprez,P.、Shevchenko,P.V.和Wüthrich,M.V.(2017)死亡率建模的机器学习技术。《欧洲精算杂志》,7(2),337-352。doi:doi:10.1007/s13385-017-0152-4·Zbl 1405.91254号
[13] Friedman,J.H.(2001)贪婪函数近似:梯度提升机。《统计年鉴》,29(5),1189-1232。doi:doi:10.1214/aos/1013203451·Zbl 1043.62034号
[14] Friedman,J.H.(2002)随机梯度助推。计算统计与数据分析,38(4),367-378。doi:doi:10.1016/S0167-9473(01)00065-2·Zbl 1072.65502号
[15] Fung,M.、Peters,G.和Shevchenko,P.(2017)使用国家空间框架进行死亡率建模的统一方法:特征描述、识别、估计和预测。精算科学年鉴,11(2),343-389。doi:doi:10.1017/S1748499517000069。
[16] Fung,M.、Peters,G.和Shevchenko,P.(2019),死亡率建模中的队列效应:贝叶斯状态空间方法。精算科学年鉴,13(1),109-144。doi:doi:10.1017/S1748499518000131。
[17] Greenwell,B.、Boehmke,B.、Cunningham,J.和Developers,Gbm(2020)Package‘Gbm’(版本2.1.8)。https://cran.r-project.org/web/packages/gbm/gbm.pdf(2021年10月18日访问)。
[18] Grönborg,N.S.、Lunde,A.、Timmermann,A.和Wermers,R.(2020)信心十足地挑选基金。《金融经济学杂志》。doi:doi:10.1016/j.jfineco.2020.07.003。
[19] Hainaut,D.(2018)死亡率预测的神经网络分析仪。阿斯汀公报,48(2),481-508。doi:doi:10.1017/asb.2017.45·Zbl 1390.91186号
[20] Hansen,P.R.、Lunde,A.和Nason,J.M.(2011)模型置信集。《计量经济学》,79(2),453-497。doi:doi:10.3982/ECTA5771·Zbl 1210.62030
[21] Hiam,L.、Harrison,D.、Mckee,M.和Dorling,D.(2018)为什么英格兰和威尔士的预期寿命“停滞”?流行病学与社区卫生杂志,72(5),404-408。doi:doi:10.1136/jech-2017-210401。
[22] Ho,J.Y.和Hendi,A.S.(2018)高收入国家预期寿命的近期趋势:回顾性观察研究。英国医学杂志,362,k2562。doi:doi:10.1136/bmj.k2562。
[23] (2020)加利福尼亚大学伯克利分校(美国)和马克斯·普朗克人口研究所(德国)。2020年3月29日下载的数据。www.motality.org。
[24] James,G.、Witten,D.、Hastie,T.和Tibshirani,R.(2013)《统计学习导论:R中的应用》,第1版,纽约:施普林格出版社。doi:doi:10.1007/978-1-4614-7138-7·Zbl 1281.62147号
[25] Laurent,S.、Rombouts,J.V.K.和Violante,F.(2011)关于多元GARCH模型的预测准确性。应用计量经济学杂志,27(6),934-955。doi:doi:10.1002/jae.1248。
[26] Lee,R.和Carter,L.R.(1992)《美国死亡率建模与预测》。美国统计协会期刊,87(419),659-675。doi:doi:10.1080/01621459.1992.10475265·Zbl 1351.62186号
[27] Levantesi,S.和Nigri,A.(2020)改进Lee-Carter死亡率预测的随机森林算法:对q-forward的影响。软计算,248553-8567。doi:doi:10.1007/s00500-019-04427-z·兹比尔1489.91224
[28] Levantesi,S.、Nigri,A.和Piscopo,G.(2020)《通过机器学习进行长寿风险管理:最新技术》,《保险市场和公司》,11(1),11-20。doi:doi:10.21511/ins.11(1).2020.02。
[29] Levantesi,S.和Pizzoruso,V.(2019)机器学习在死亡率建模和预测中的应用。风险,7(1),26。doi:doi:10.3390/risks7010026。
[30] Li,N.和Lee,R.(2005)一组人群的相关死亡率预测:Lee-Carter方法的扩展。人口统计学,42(3),575-594。doi:doi:10.1353/dem.2005.0021。
[31] Li,N.,Lee,R.和Gerland,P.(2013)扩展Lee-Carter方法,为长期预测建立死亡率下降年龄模式的轮换模型。人口统计学,50(6),2037-2051。doi:doi:10.1007/s13524-013-0232-2。
[32] Liaw,A.(2018)包“randomForest”(版本4.6-14)。https://cran.r-project.org/web/packages/randomForest/randomForest.pdf(2021年10月18日访问)。
[33] Liu,L.Y.、Patton,A.J.和Sheppard,K.(2015)有什么比5分钟房车更好的吗?跨多个资产类别的已实现度量的比较。《计量经济学杂志》,187(1),293-311。doi:doi:10.1016/j.jeconom.2015.02.008·Zbl 1337.62329号
[34] Medeiros,M.C.、Vasconcelos,G.F.R.、Veiga,A.和Zilberman,E.(2019)《数据丰富环境中的预测:机器学习方法的益处》。《商业与经济统计杂志》,1-22。doi:doi:10.1080/07350015.2016.1637745。
[35] Nigri,A.、Levantesi,S.和Marino,M.(2021)《预期寿命和寿命差距预测:长短记忆方法》。《斯堪的纳维亚精算杂志》,2021(2),110-133。doi:doi:10.1080/03461238.2020.1814855·Zbl 1468.91128号
[36] Nigri,A.、Levantesi,S.、Marino,M.、Scognamiglio,S.和Perla,F.(2019)深度学习综合Lee-Carter模型。风险,7(1),33。doi:doi:10.3390/风险710033。
[37] Oeppen,J.(2008)《多重减法生命表的一致预测:使用日本死因数据的测试》。2008年欧洲人口会议,欧洲人口研究协会。
[38] Plat,R.(2009)关于随机死亡率建模。保险数学与经济学,45(3),393-404。doi:doi:10.1016/j.insmateco.2009.08.006·Zbl 1231.91227号
[39] Renshaw,A.E.和Haberman,S.(2006)基于队列的死亡率降低因子Lee-Carter模型扩展。保险:数学与经济学,38(3),556-570。doi:doi:10.1016/j.insmathe.2005.12.001·Zbl 1168.91418号
[40] Richman,R.和Wüthrich,M.V.(2019)LeeCarter模型的神经网络扩展到多个人群。精算科学年鉴,1-21。doi:doi:10.1017/S1748499519000071。
[41] Schnürch,S.和Korn,R.(2021)使用神经网络对死亡率进行点和区间预测。ASTIN公告,1-28。doi:doi:10.1017/asb.2021.34·Zbl 1484.91404号
[42] Shang,H.L.和Haberman,S.(2020)退休人员死亡率预测:部分年龄段还是全年龄段模型?风险,8(3),69。doi:doi:10.3390/risks8030069。
[43] Villegas,A.M.、Kaishev,V.K.和Millossovich,P.(2018)StMoMo:随机死亡率建模的R包。统计软件杂志,84(3),1-38。doi:doi:10.18637/jss.v084.i03。
[44] Zhang,Y.和Haghani,A.(2015)改进旅行时间预测的梯度增强方法。交通研究C部分:新兴技术,58,308-324。doi:doi:10.1016/j.trc.2015.02.019。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。