×

用机器学习方法预测抵押贷款早期拖欠。 (英语) Zbl 1487.91145号

摘要:本文研究了13种建模和预测抵押贷款早期拖欠概率的方法的性能。这些模型包括logit模型的变体、一些常用的机器学习方法以及集成模型的变体。我们发现,在风险分类方面,异质集成方法在训练、样本外和时间外数据集中领先于其他方法。尽管如此,各种预测准确性性能度量在这13种方法中产生了不同的排名,在训练、样本外和非时间数据中,没有一种方法在这一性能维度上始终占主导地位。最后,即使在培训数据中,预测准确性也是所有抵押贷款早期拖欠模型面临的主要挑战。

MSC公司:

91G40型 信用风险
62P05号 统计学在精算科学和金融数学中的应用
68T05型 人工智能中的学习和自适应系统

关键词:

神经网络;合奏
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 新墨西哥州亚当斯。;阿纳格诺斯托普洛斯,C。;Hand,D.,《测量分类性能H测量包》(2012),帝国理工学院:伦敦帝国理工大学,技术报告
[2] 阿多,P.M。;Guegan,D。;Hassan,B.,《使用机器和深度学习模型进行信用风险分析》(2018年),威尼斯Ca’Foscari大学,工作文件
[3] Altman,N.S.,《核和最近邻非参数回归简介》,《美国统计学家》,46,3,175-185(1992)
[4] Baesens,B。;Van Gestel,T。;Viaene,S。;斯蒂芬诺娃,M。;苏肯斯,J。;Vantheinen,J.,《为信用评分建立最先进的分类算法基准》,《运筹学学会杂志》,54,627-635(2003),&·兹比尔1097.91516
[5] Bishop,C.(1995年)。用于模式识别的神经网络。牛津大学出版社·Zbl 0868.68096号
[6] Breiman,L.,预测器集合的一些无穷大理论,预测者集合的一些无限大理论,577(2000),加州大学伯克利分校:加州大学伯克莱分校美国分校,技术报告577
[7] Breiman,L.,随机森林样本模型的一致性,随机森林的样本模型一致性,670(2004),加州大学伯克利分校:加州大学伯克莱分校美国分校,技术报告670
[8] Butaru,F。;陈,Q。;B.克拉克。;达斯,S。;Lo,A.W。;Siddique,A.,《信用卡行业的风险和风险管理》,《银行与金融杂志》,72218-239(2016)
[9] 卡鲁阿纳,R。;尼古列斯库·马齐尔(Niculescu-Mizil),A。;船员,G。;Ksikes,A.,从模型库中选择合奏,(第二十一届机器学习国际会议论文集,ACM,18(2004))
[10] Chen,T。;Guestrin,C.,XGBoost:一个可扩展的树增强系统,(第22届ACM SIGKDD知识发现和数据挖掘会议论文集(2016)),785-794
[11] 科尔特斯,C。;Vapnik,V.,支持向量网络,机器学习,20,3,273-297(1995)·兹比尔08316.8098
[12] 克鲁克,J.N。;Edelman,D.B。;Thomas,L.C.,《消费信贷风险评估的最新发展》,《欧洲运筹学杂志》,183,1447-1465(2007)·Zbl 1138.91493号
[13] 大卫·R·H。;Edelman,D.B。;Gammerman,A.J.,信用卡应用的机器学习算法,IMA商业与工业应用数学杂志,4,43-51(1992)
[14] 德赛,V.S。;克鲁克,J.N。;Overstreet,G.A.,信贷联盟环境中神经网络和线性评分模型的比较,《欧洲运筹学杂志》,95,24-37(1996)·Zbl 0955.90506号
[15] Ernst,D。;Wehenkel,L.,极端随机树,机器学习,63,3-42(2006)·Zbl 1110.68124号
[16] 菲茨帕特里克,T。;Mues,C.,《抵押贷款违约预测分类算法的实证比较:来自不良抵押贷款市场的证据》,《欧洲运筹学杂志》,249427-439(2016)·Zbl 1346.62103号
[17] 弗伦德,Y。;夏皮雷,R。;Abe,N.,《boosting简介》,《日本人工智能学会期刊》,14771-780(1999)
[18] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《统计学习的要素》,1337-387(2001),《统计学中的斯普林格系列》·Zbl 0973.62007号
[19] Friedman,J.H.,《贪婪函数近似:梯度提升机》,《统计年鉴》,29,5,1189-1232(2001)·Zbl 1043.62034号
[20] 加林多,J。;Tamayo,P.,《使用统计和机器学习进行信用风险评估:基本方法和风险建模应用》,计算经济学,第15期,第107-143页(2000年)·Zbl 0969.91006号
[21] Genuer,R。;波吉,J.-。医学硕士。;Tuleau,C.,《随机森林若干方法学见解》(2008),INRIA,研究报告RR-6729
[22] Hand,D.J.,《挖掘过去决定未来:问题和可能性》,《国际预测杂志》,g,25,441-451(2009)
[23] Hand,D.J.,《衡量分类器性能,ROC曲线下区域的连贯替代方法》,机器学习,77,103-123(2009)·Zbl 1470.62085号
[24] 哈斯蒂·T·J。;Tibshirani,R.J.,广义加性模型(1990),Chapman&Hall/CRC·Zbl 0747.62061号
[25] 肯尼迪,K。;Namee,B。医学博士。。;Delany,S.J.,《使用半监督分类器进行信用评分》,《运筹学学会杂志》,64,4,513-529(2013)
[26] Khandani,A.E。;Kim,A.J&Lo,A.W.,《通过机器学习算法的消费者信贷风险模型》,《银行与金融杂志》,34,11,2767-2787(2010)
[27] 科瓦姆,H。;塞勒莱特,N。;Aas,K。;Sjursen,S.,使用卷积神经网络预测抵押贷款违约,应用专家系统,102,207-217(2018)
[28] 莱斯曼,S。;Baesens,B。;Seow,H.-。五、。;Thomas,L.C.,《信用评分的标杆先进分类算法:研究更新》,《欧洲运筹学杂志》,247,124-136(2015)·Zbl 1346.90835号
[29] 李毅。;贝洛蒂,T。;Adams,N.,《长期机器学习表现》(论文发表于爱丁堡大学信用评分和信用控制会议(2017年))
[30] 李毅。;王,X。;Djehiche,B。;胡欣,《基于动态网络信息的信用评分》,《欧洲运筹学杂志》,第286期,第1103-1112页(2020年)·兹比尔1443.91314
[31] Martens,D。;Baesens,B。;Gestel,T.V。;Venthienan,J.,《使用支持向量机规则提取的综合信用评分模型》,《欧洲运筹学杂志》,1831466-1476(2007)·Zbl 1278.91177号
[32] Mullainathan,S。;Spiess,J.,《机器学习:应用计量经济学方法》,《经济展望杂志》,第31期,第2期,第87-106页(2017年)
[33] Nikolaou,N。;Edakunni,N。;Kull,M。;弗拉奇,P。;Brown,G.,《成本敏感型提升算法:我们真的需要它们吗》,《机器学习》,104,359-384(2016)·Zbl 1386.68136号
[34] 奥皮茨,D。;Maclin,R.,《流行集成方法:实证研究》,《人工智能研究杂志》,11,169-198(1999)·Zbl 0924.68159号
[35] 佩德雷戈萨,F。;瓦罗佐,G。;Gramfort,A。;米歇尔,V。;蒂里昂,B。;Grisel,O.,Scikit-lean:《Pytho中的机器学习》,《机器学习研究杂志》,第12期,第2825-2830页(2011年)·Zbl 1280.68189号
[36] Platt,J.,支持向量机的概率输出和与正则化似然方法的比较,大裕度分类器的进展,10,3,61-74(1999)
[37] 齐,M。;张,X。;赵欣,《不可观测系统风险因素与违约预测》,《银行与金融杂志》,第49期,第216-227页(2014年)
[38] Sirignano,J.A。;萨德瓦尼,A。;Giesecke,K.,《抵押风险深度学习》(2018年),伊利诺伊大学香槟分校,工作文件
[39] 托马斯,L.C。;克鲁克,J.N。;Edelman,D.B.,《信用评分及其应用》,《工业和应用数学学会》(2017年)·Zbl 1425.91002号
[40] 瓦里安,H.R.,《大数据:计量经济学的新技巧》,《经济展望杂志》,28,2,3-28(2014)
[41] Verbraken,T。;布拉沃,C。;韦伯,R。;Baesens,B.,《使用基于利润的分类方法开发和应用消费者信用评分模型》,《欧洲运筹学杂志》,238,505-513(2014)·Zbl 1338.91146号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。