×

信用评分的深度学习:做还是不做? (英文) Zbl 1487.91147号

总结:开发准确的分析性信用评分模型已成为金融机构的主要关注点。为此,提出了许多用于信用评分的分类算法。然而,在信用评分文献中,深度学习算法在分类中的应用在很大程度上被忽视。本研究的主要动机是考虑深度学习算法对信用评分的适用性。为此,构建了两种深度学习结构,即多层感知器网络和深度信念网络,以及与两种传统的信用评分方法和两种集成的信用评分方法的性能进行比较。然后使用一系列信用评分数据集和性能指标对模型进行评估。此外,在信用评分的背景下引入了贝叶斯统计测试程序,并将其与传统上被视为信用评分最佳实践的频率非参数测试程序进行了比较。这一比较将突出贝叶斯统计学程序的优点和可靠的实证结果。通过比较不同的信用评分分类算法得出了两个主要结论。首先,在本文所考虑的所有方法中,集成方法XGBoost是表现最佳的信用评分方法。其次,深度神经网络的性能并不优于浅层神经网络,而且构建起来的计算成本要高得多。因此,基于这种比较,深度学习算法似乎不是用于信用评分的合适模型,当分类性能是信用评分活动的主要目标时,XGBoost应该优先于此处考虑的其他信用评分方法。

MSC公司:

91G40型 信用风险
68T07型 人工神经网络与深度学习
62H30型 分类和区分;聚类分析(统计方面)
62P05号 统计学在精算科学和金融数学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 阿达迪,A。;Berrada,M.,《窥视黑匣子:可解释人工智能(XAI)的调查》,IEEE Access,652138-52160(2018)
[2] 阿多,P。;Guegan,D。;Hassani,B.,使用机器和深度学习模型进行信用风险分析,Risks,6,2,38(2018)
[3] Akkoç,S.,《传统技术、神经网络和用于信用评分分析的三阶段混合自适应神经模糊推理系统(ANFIS)模型的实证比较:土耳其信用卡数据案例》,《欧洲运筹学杂志》,222168-178(2012)
[4] Baesens,B.,《大数据世界中的分析:数据科学及其应用的基本指南》(2014),John Wiley&Sons
[5] Baesens,B。;Roesch,D。;Scheule,H.,《信贷风险分析:SAS(2016)中的计量技术、应用和示例》,John Wiley&Sons
[6] Baesens,B。;Van Gestel,T。;Viaene,S。;斯蒂芬诺娃,M。;苏肯斯,J。;Vantheinen,J.,《为信用评分建立最先进的分类算法基准》,运筹学学会杂志,54,6,627-635(2003)·兹比尔1097.91516
[7] Benavoli,A。;Corani,G。;德姆沙尔,J。;Zaffalon,M.,《改变的时间:通过贝叶斯分析比较多个分类器的教程》,《机器学习研究杂志》,18,1,2653-2688(2017)·Zbl 1440.62237号
[8] Benavoli,A。;科拉尼,G。;Mangili,F。;Zaffalon,M。;Ruggeri,F.,基于Dirichlet过程的Bayesian Wilcoxon签名秩检验,机器学习国际会议论文集,1026-1034(2014)
[9] 联邦储备系统理事会(2019年)。美联储统计数据发布。https://www.federalreserve.gov/releases/h8/current/default.htm。[在线;2019年2月28日访问]。
[10] Bradley,A.P.,《ROC曲线下面积在机器学习算法评估中的使用》,模式识别,30,7,1145-1159(1997)
[11] Breiman,L.,《随机森林,机器学习》,45,1,5-32(2001)·Zbl 1007.68152号
[12] 陈,S。;郭,Z。;Zhao,X.,用机器学习方法预测抵押贷款早期拖欠,《欧洲运筹学杂志》(2020年)
[13] Chen,T。;Guestrin,C.,XGBoost:一个可扩展的树增强系统,第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集,785-794(2016),ACM
[14] Corani,G。;Benavoli,A。;德姆沙尔,J。;Mangili,F。;Zaffalon,M.,《通过贝叶斯层次建模对分类器进行统计比较》,机器学习,106,11,1817-1837(2017)·兹比尔1440.62241
[15] Demšar,J.,《多数据集分类器的统计比较》,《机器学习研究杂志》,2006年1月7日至30日·Zbl 1222.68184号
[16] Deng,L.,深度学习架构、算法和应用的教程调查,APSIPA信号和信息处理交易,3(2014)
[17] Dua,D.和Graff,C.(2017年)。UCI机器学习库。http://archive.ics.uci.edu/ml。
[18] Durand,D.,《消费者分期付款融资中的风险因素》(1941年),国家经济研究局:纽约国家经济研究署
[19] 南卡罗来纳州加西亚。;费尔南德斯,A。;卢恩戈,J。;Herrera,F.,计算智能和数据挖掘实验设计中多重比较的高级非参数检验:功率的实验分析,信息科学,180,102044-2064(2010)
[20] 古德费罗,I。;Y.本吉奥。;A.Courville,《深度学习》(2016),麻省理工学院出版社·Zbl 1373.68009号
[21] 格陵兰,南部。;Senn,S.J。;Rothman,K.J。;Carlin,J.B。;普尔,C。;古德曼,S.N。;Altman,D.G.,《统计检验、p值、置信区间和功效:误解指南》,《欧洲流行病学杂志》,31,4,337-350(2016)
[22] Hamori,S。;卡瓦伊,M。;库姆,T。;村上,Y。;渡边捷昭,合奏学习还是深度学习?《违约风险分析应用》,《风险与财务管理杂志》,2018年第11、1、12期
[23] Haykin,S.,神经网络,2(1994),普伦蒂斯·霍尔:纽约普伦蒂斯霍尔·Zbl 0828.68103号
[24] 他,H。;张伟。;Zhang,S.,《信用评分的新型集成方法:不同失衡比率的适应》,《应用专家系统》,98,105-117(2018)
[25] Hinton,G.E.,训练受限玻尔兹曼机器的实用指南,神经网络:交易技巧,599-619(2012),施普林格
[26] 辛顿,G.E。;Salakhutdinov,R.R.,《用神经网络降低数据的维数》,《科学》,3135786504-507(2006)·Zbl 1226.68083号
[27] 霍兰德,M。;Wolfe,D.A。;Chicken,E.,非参数统计方法,751(2014),John Wiley&Sons·Zbl 1279.62006号
[28] 霍斯默,D.W。;莱梅肖,S。;Sturdivant,R.X.,应用逻辑回归,398(2013),John Wiley&Sons·Zbl 1276.62050号
[29] Hssina,B。;Merbouha,A。;埃齐库里,H。;Erritali,M.,《决策树ID3和C4.5的比较研究》,《国际高级计算机科学与应用杂志》,4,2(2014)
[30] 华,Y。;郭杰。;Zhao,H.,深度信念网络和深度学习,2014年智能计算和物联网国际会议论文集,1-4(2015),IEEE
[31] 黄,Y.-M。;洪,C.-M。;Jiau,H.C.,等级不平衡问题信用评估任务的神经网络和数据挖掘方法评估,非线性分析:现实世界应用,7,4,720-747(2006)·Zbl 1160.91368号
[32] Ioffe,S.和Szegedy,C.(2015)。批量归一化:通过减少内部协变量偏移来加速深度网络训练。arXiv预打印arXiv:1502.03167。
[33] 江,C。;王,Z。;Zhao,H.,预测驱动的混合治疗模型及其在信用评分中的应用,《欧洲运筹学杂志》,277,1,20-31(2019)·兹比尔1431.91413
[34] 克劳斯,M。;Feuerriegel,S。;Oztekin,A.,《商业分析和运营研究的深度学习:模型、应用和管理含义》,《欧洲运营研究杂志》,281,3628-641(2020)
[35] Kruschke,J.K.,《做贝叶斯数据分析:R和BUGS教程》(2011),学术出版社:学术出版社,马萨诸塞州伯灵顿·Zbl 1301.62001号
[36] Kruschke,J.K。;阿吉尼斯,H。;Joo,H.,《时代已经到来:组织科学中数据分析的贝叶斯方法》,《组织研究方法》,第15、4、722-752页(2012年)
[37] Kruschke,J.K。;Liddell,T.M.,《贝叶斯新统计:从贝叶斯的角度进行假设检验、估计、元分析和功效分析》,《心理学通报与评论》,25,1,178-206(2018)
[38] LeCun,Y。;Y.本吉奥。;Hinton,G.,《深度学习》,《自然》,521,7553,436(2015)
[39] Lesaffre,E。;Lawson,A.B.,贝叶斯生物统计(2012),John Wiley&Sons·Zbl 1282.62057号
[40] 莱斯曼,S。;Baesens,B。;Seow,H.-V。;Thomas,L.C.,《信用评分的标杆先进分类算法:研究更新》,《欧洲运筹学杂志》,247,1,124-136(2015)·Zbl 1346.90835号
[41] 洛佩斯,北。;Ribeiro,B.,《自适应多核机器的机器学习——实用方法》(2015),Springer
[42] 伦德伯格,S.M。;Lee,S.-I.,《解释模型预测的统一方法》,《神经信息处理系统进展学报》,4765-4774(2017)
[43] 罗,C。;Wu,D。;Wu,D.,《利用信用违约互换进行信用评分的深度学习方法》,《人工智能的工程应用》,65,465-470(2017)
[44] 马尔多纳多,S。;布拉沃,C。;López,J。;Pérez,J.,信用评分中基于利润的特征选择和SVM分类的集成框架,决策支持系统,104,113-121(2017)
[45] Mancisidor,R.A.、Kampfeyer,M.、Aas,K.和Jenssen,R.(2019年)。信用评分中拒绝推理的深度生成模型。arXiv预印本arXiv:1904.11376。
[46] Marqués,A。;加西亚,V。;Sánchez,J.S.,信贷风险评估的两级分类器集成,应用专家系统,39,12,10916-10922(2012)
[47] McCulloch,W.S。;Pitts,W.,《神经活动内在思想的逻辑演算》,《数学生物物理公报》,第5期,第4期,第115-133页(1943年)·兹比尔0063.03860
[48] 加拿大温哥华
[49] 穆罕默德,A.-r。;Dahl,G.E。;Hinton,G.,使用深度信念网络的声学建模,IEEE音频、语音和语言处理汇刊,20,1,14-22(2012)
[50] 穆罕默德,A.-r。;Sainath,T.N。;Dahl,G.E。;拉马巴德兰,B。;辛顿,G.E。;Picheny,M.A.,《使用区分特征进行电话识别的深度信念网络》。,ICASSP会议记录,5060-5063(2011)
[51] Munkhdalai,L。;Wang,L。;华盛顿州帕克市。;Ryu,K.H.,《高级神经网络方法及其对信用评分应用的解释》,《亚洲智能信息和数据库系统会议论文集》,407-419(2019),施普林格出版社
[52] Nuzzo,R.,《科学方法:统计误差》,《自然新闻》,5067487150(2014)
[53] 奥斯卡尔斯多蒂尔,M。;布拉沃,C。;沙罗特,C。;Vantheinen,J。;Baesens,B.,《大数据对信用评分的价值:使用手机数据和社交网络分析增强金融包容性》,应用软件计算,74,26-39(2019)
[54] 帕普斯科娃,M。;Hajek,P.,使用异构集成学习的两阶段消费者信贷风险建模,决策支持系统,118,33-45(2019)
[55] 里贝罗,M.T。;辛格,S。;Guestrin,C.,“我为什么要相信你?”解释任何分类器的预测,第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集,1135-1144(2016)
[56] 萨贝里,M。;Mirtalaie,M.S。;侯赛因,F.K。;阿扎德,A。;侯赛因,OK。;Ashjari,B.,基于粒度计算的信用评分建模方法,神经计算,122,100-115(2013)
[57] Schmidhuber,J.,《神经网络中的深度学习:概述》,神经网络,61,85-117(2015)
[58] 夏尔马,S。;阿格拉瓦尔,J。;Sharma,S.,《通过机器学习技术进行分类:基于各种熵的C4.5算法》,《国际计算机应用杂志》,82,16(2013)
[59] Spanoudes,P.,&Nguyen,T.(2017年)。客户流失预测的深度学习:基于抽象公司独立特征向量的无监督特征学习。arXiv预打印arXiv:1703.03869。
[60] Stevenson,M.、Mues,C.和Bravo,C.(2020)。文本对小企业违约预测的价值:一种深度学习方法。arXiv预打印arXiv:2003.08964。
[61] Sun,T。;Vasarhelyi,M.A.,《预测信用卡拖欠:深层神经网络的应用》,《会计、财务和管理中的智能系统》,25,4,174-189(2018)
[62] 斯沃齐尔,D。;Kvasnicka,V。;Pospichal,J.,多层前馈神经网络介绍,化学计量学和智能实验室系统,39,1,43-62(1997)
[63] 托马斯,L.C。;Edelman,D.B。;Crook,J.N.,《信用评分及其应用》(2002年),SIAM·Zbl 1001.91052号
[64] Tieleman,T。;Hinton,G.,讲座6.5-rmsprop:将梯度除以最近大小的运行平均值,《课程:机器学习的神经网络》,4,2,26-31(2012)
[65] Van Gestel,T。;Baesens,B。;Van Dijcke,P。;加西亚,J。;苏肯斯,J.A。;Vanthienen,J.,开发内部评级系统的过程模型:主权信用评级,决策支持系统,42,2,1131-1151(2006)
[66] Van Gestel,T。;Baesens,B。;Van Dijcke,P。;苏肯斯,J。;加西亚,J。;Alderweield,T.,《通过结合逻辑回归和支持向量机的线性和非线性信用评分》,《信用风险杂志》,1,4(2005)
[67] Van-Sang,H。;Ha-Nam,N.,基于特征选择方法的深度学习信用评分,《MATEC会议网络会议记录》,54(2016),EDP Sciences
[68] 韦伯拉肯,T。;布拉沃,C。;韦伯,R。;Baesens,B.,《使用基于利润的分类方法开发和应用消费者信用评分模型》,《欧洲运筹学杂志》,238,2,505-513(2014)·Zbl 1338.91146号
[69] 葡萄酒,O。;Ravuri,S.V.,《将多层感知器与深信度网络串联特性进行比较以实现稳健的ASR》,2011年IEEE声学、语音和信号处理国际会议论文集,4596-4599(2011),IEEE
[70] 王,C。;Han,D。;刘,Q。;Luo,S.,使用注意力机制LSTM对点对点贷款进行信用评分的深度学习方法,IEEE Access,72161-2168(2018)
[71] 王,M。;Yu,J。;纪政,基于叠加集成模型的个人信用风险评估,智能信息处理国际会议论文集,328-333(2018),施普林格
[72] Wasserstein,R.L。;Lazar,N.A.,《美国统计局关于p值的声明:背景、过程和目的》,《美国统计学家》,70,2,129-133(2016)·Zbl 07665862号
[73] 夏,Y。;刘,C。;李毅。;Liu,N.,使用贝叶斯超参数优化进行信用评分的增强决策树方法,应用专家系统,78,225-241(2017)
[74] 肖伟(Xiao,W.)。;赵(Q.Zhao)。;Fei,Q.,《消费者贷款信用评分管理中数据挖掘方法的比较研究》,《系统科学与系统工程杂志》,15,4,419-435(2006)
[75] 是的,I.-C。;Lien,C.-h.,《数据挖掘技术对信用卡客户违约概率预测准确性的比较》,《应用专家系统》,36,2,2473-2480(2009)
[76] Yu,L。;姚,X。;王,S。;Lai,K.K.,使用加权最小二乘支持向量机分类器进行信用风险评估,参数选择实验设计,应用专家系统,38,12,15392-15399(2011)
[77] 张,Z。;高,G。;Shi,Y.,使用带核、模糊化和惩罚因子的多准则优化分类器进行信用风险评估,《欧洲运筹学杂志》,237,1,335-348(2014)·Zbl 1304.91235号
[78] 周,L。;赖,K.K。;Yu,L.,信用评分的最小二乘支持向量机集成模型,应用专家系统,37,1,127-133(2010)
[79] 朱,B。;杨伟(Yang,W.)。;Wang,H。;Yuan,Y.,《消费者信用评分的混合深度学习模型》,2018年人工智能与大数据国际会议(ICAIBD)论文集,205-208(2018),IEEE
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。