×

稀疏集合方法:应用于新冠肺炎的短期预测。 (英语) Zbl 1489.62237号

摘要:自发表的开创性论文以来J.贝茨C.格兰杰[“预测组合”,Oper.Res.Quart.20,No.4,451-468(1969;doi:10.1057/jors.1969.103)]文献中提出了大量的集成方法,这些方法将不同的基回归量组合起来生成一个唯一的基回归值。so-obtained回归方法可能比其组成部分具有更好的准确性,但同时它可能会溢出,它可能会被精度较低的基本回归变量所扭曲,并且可能过于复杂,难以理解和解释。本文提出并研究了一种新的数学优化模型来构建稀疏集合,该模型权衡了集合的准确性和所使用的基回归量。后者由一个正则化项控制,该正则化项惩罚个人表现不佳的回归变量。我们的方法很灵活,可以结合人们对集合可能具有的理想属性,例如控制集合在关键记录组中的性能,或与集合中涉及的基本回归变量相关的成本。我们用新冠肺炎背景下产生的实际数据集来说明我们的方法。

MSC公司:

62J99型 线性推断、回归
68T05型 人工智能中的学习和自适应系统
90 C90 数学规划的应用
92天30分 流行病学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Achterberg,M。;普拉斯,B。;马,L。;特拉贾诺夫斯基,S。;Kitsak,M。;Van Mieghem,P.,比较几种基于网络的新冠肺炎预测算法的准确性,即将发表在《国际预测杂志》(2020)
[2] 安藤,T。;Li,K.C.,高维回归的模型平均方法,《美国统计协会杂志》,109,254-265(2014)·Zbl 1367.62209号
[3] 贝茨,J。;Granger,C.,《预测组合》,《运筹学季刊》,第20期,第451-468页(1969年)
[4] 贝尼特斯·佩尼亚,S。;布兰科罗,R。;Carrizosa,E。;Ramírez-Cobo,P.,支持向量机的成本敏感特征选择,计算机与运筹学,106,169-178(2019)·Zbl 1458.68158号
[5] 贝尼特斯·佩尼亚,S。;布兰奎罗,R。;Carrizosa,E。;Ramírez-Cobo,P.,《多成本场景下的支持向量机》,《数据分析和分类进展》,第13期,第663-682页(2019年)·Zbl 1474.62211号
[6] https://www.researchgate.net/publication/34103637_Cost-sensitive_probabilistic_predications_for_support_vector_machines。 ·Zbl 1458.68158号
[7] https://www.researchgate.net/publication/340716304_Short-Term_Prections_of_the_Evolution_of_COVID-19_in_Andalusia_An_Ensemblue_Method。
[8] Bertsimas,D。;Dunn,J.,《最佳分类树》,机器学习,1061039-1082(2017)·Zbl 1455.68159号
[9] Bertsimas,D。;金·A。;Mazumder,R.,《通过现代优化透镜选择最佳子集》,《统计年鉴》,44813-852(2016)·Zbl 1335.62115号
[10] https://www.researchgate.net/publication/341099512_On_Sparse_Optimal_Regression_Trees。
[11] 布兰科罗,R。;Carrizosa,E。;Molero-Río,C。;Romero Morales,D.,最优随机分类树的稀疏性,《欧洲运筹学杂志》,284255-272(2020)·Zbl 1441.62163号
[12] 布兰科罗,R。;Carrizosa,E。;Molero-Río,C。;Romero Morales,D.,最优随机分类树,计算机与运筹学,132105281(2021)·Zbl 1510.90306号
[13] 布兰科罗,R。;Carrizosa,E。;Ramírez-Cobo,P。;Sillero-Denamiel,M.R.,《成本敏感性约束套索》,《数据分析和分类进展》,第15期,第121-158页(2020年)·兹伯利07363868
[14] Breiman,L.,随机森林,机器学习,45,5-32(2001)·Zbl 1007.68152号
[15] Bühlmann,P.,《时间序列的引导》,《统计科学》,第17期,第52-72页(2002年)·Zbl 1013.62048号
[16] Carrizosa,E。;马丁·巴拉根,B。;Romero Morales,D.,《带测量成本的多组支持向量机:生物目标方法》,《离散应用数学》,156950-966(2008)·Zbl 1152.90536号
[17] Carrizosa,E。;马丁·巴拉根,B。;Romero Morales,D.,二值化支持向量机,《信息计算杂志》,22,154-167(2010)·兹比尔1243.62088
[18] Carrizosa,E。;马丁·巴拉根,B。;Romero Morales,D.,《在监督分类中检测相关变量和交互作用》,《欧洲运筹学杂志》,213260-269(2011)
[19] Carrizosa,E。;Molero-Río,C。;Romero Morales,D.,分类和回归树中的数学优化,TOP,29,5-33(2021)·Zbl 1467.90021号
[20] https://www.researchgate.net/publication/341042405_On_linear_regression_models_with_hierarchical_categorical_variables。
[21] Carrizosa,E。;Nogales-Gómez,A。;Romero Morales,D.,强烈同意还是强烈反对支持向量机中的评级特征,信息科学,329256-273(2016)
[22] Carrizosa,E。;Nogales-Gómez,A。;Romero Morales,D.,支持向量机中的聚类类别,Omega,66,28-37(2017)
[23] Carrizosa,E。;奥利瓦雷斯?奈达尔,A。;Ramírez-Cobo,P.,稀疏控制向量自回归模型,生物统计学,18,244-259(2017)
[24] Carrizosa,E。;奥利瓦雷斯?奈达尔,A。;Ramírez-Cobo,P.,《增强线性回归可解释性的新约束》,《统计与运筹学学报》,第44期,第67-98页(2020年)·Zbl 1442.62151号
[25] Carrizosa,E。;罗梅罗·莫拉莱斯(Romero Morales,D.),《监督分类和数学优化》,《计算机与运筹研究》,第40期,第150-165页(2013年)·Zbl 1349.68135号
[26] Christmann,A。;Hable,R.,关于支持向量机的bootstrap方法和相关的基于内核的方法的一致性,(Schölkopf,B.;Luo,Z.;Vovk,V.,经验推断:Festschrift纪念vladimir n.vapnik(2013),施普林格:施普林格柏林,海德堡),231-244·兹比尔1330.68249
[27] 达塔,S。;Das,S.,Near Bayesian支持向量机,用于错误分类成本相等或不等的不平衡数据分类,神经网络,70,39-52(2015)·Zbl 1394.68280号
[28] Deng,H.,《用入侵解释树集合》,《国际数据科学与分析杂志》,第7期,第277-287页(2019年)
[29] Efron,B.,预测、估计和归因,《美国统计协会杂志》,115636-655(2020)·Zbl 1445.62327号
[30] Fernández-Casal,R.(2020年)。COVID-19 github存储库。访问日期:9月。https://github.com/rubenfcasal/COVID-19。
[31] 弗洛雷斯·洛佩兹,R。;Ramon-Jeronimo,J.,《提高信贷风险评估中集成策略的准确性和可解释性》。相关调整的决策林提案,应用专家系统,42,5737-5753(2015)
[32] Fountoulakis,K。;Gondzio,J.,强凸正则化问题的二阶方法,数学规划,156189-219(2016)·Zbl 1364.90255号
[33] 弗里斯,M。;Bartz-Beielstein,T。;Bäck,T。;Naujoks,B。;Emmerich,M.,基于模型的全局优化中的加权集成,AIP会议记录(2019年)
[34] http://nbn-resolution.de/urn:nbn:de:hbz:832-cos4-3480。
[35] 盖恩斯,B.R。;Kim,J。;Zhou,H.,《约束套索拟合算法》,《计算与图形统计杂志》,27861-871(2018)·Zbl 07498997号
[36] 甘贝拉,C。;B.加达。;Naoum-Sawaya,J.,《机器学习的优化模型:一项调查》,《欧洲运筹学杂志》,290807-828(2021)·Zbl 1487.90004号
[37] http://www.gurobi.com。
[38] Härdle,W.,应用非参数回归,19(1990),剑桥大学出版社·Zbl 0714.62030号
[39] 哈斯蒂,T。;Tibshirani,R。;Wainwright,M.,《稀疏的统计学习:套索和概括》(2015),CRC出版社·Zbl 1319.68003号
[40] 斯塔顿血清研究所。(2020). COVID-19 SSI存储库。访问日期:9月。https://covid19.ssi.dk/overmagningsdata。
[41] Kedem,B。;Fokianos,K.,《时间序列分析回归模型》第488卷(2005年),John Wiley&Sons
[42] Koenker,R。;Hallock,K.,《量化回归》,《经济展望杂志》,15143-156(2001)
[43] Koenker,R。;Ng,P.,不平等约束分位数回归,Sankhyā:《印度统计杂志》,67,418-440(2005)·Zbl 1193.62023号
[44] Lee,Y。;Nelder,J。;Pawitan,Y.,《具有随机效应的广义线性模型:基于H似然的统一分析》,CRC出版社,153(2018)
[45] Liaw,A。;Wiener,M.,随机森林分类和回归,R News,2,18-22(2002)
[46] 马丁·巴拉根,B。;里洛,R。;Romo,J.,功能数据的可解释支持向量机,《欧洲运筹学杂志》,232,146-155(2014)
[47] Mendes-Moreira,J。;苏亚雷斯,C。;Jorge,A.M。;Sousa,J.F.D.,《回归的集合方法:一项调查》,ACM计算调查,45,1-40(2012)·Zbl 1293.68234号
[48] https://CRAN.R-project.org/package=e1071R包版本1.7-1
[49] Nikolopoulos,K。;普尼亚,S。;Schäfers,A。;奇诺波洛斯,C。;Vasilakis,C.,《大流行期间的预测和规划:新型冠状病毒的增长率、供应链中断和政府决策》,《欧洲运筹学杂志》,29099-115(2021)·Zbl 1487.90037号
[50] 任,Y。;张,L。;Suganthan,P.,《集成分类和回归——最新发展、应用和未来方向》,IEEE计算智能杂志,11,41-53(2016)
[51] Vapnik,V.,《统计学习理论的本质》(1995),斯普林格·弗拉格·Zbl 0833.62008号
[52] 张,L。;Zhou,W.D.,使用基于线性规划的加权组合方法的稀疏集合,模式识别,44,97-106(2011)·Zbl 1207.68332号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。