×

银行业和金融业信贷评分和破产预测的适当机器学习技术:比较研究。 (英语) Zbl 1458.91215号

摘要:机器学习技术已经在银行和金融等多个领域成功应用。这些技术主要用于根据某个共同特征对数据进行预测、分类和划分为不同的组。在这项工作中,我们对金融和银行业中用于信用评分和破产预测的机器学习技术感兴趣。我们对银行和金融机构发布的多个数据集上的一系列机器学习技术进行了评估和比较,目的是为每个数据集选择最合适的方法。我们使用几个指标来评估所获得模型的性能。实证研究在德国、澳大利亚、日本、波兰、印度定性破产和台湾数据集上进行。此外,我们考虑了巨大的“给我一些信用数据集”。
机器学习方法为申请者和公司提供分数,并在决策中提供很大帮助。换言之,这些方法使我们能够区分好坏申请人或公司。数值研究表明,没有一种方法能够在所有数据集上始终优于其他方法。此外,在一些数据集上,所研究的方法之间也存在显著差异。对于德语和Give Me Some Credit数据集,与其他研究方法相比,贝叶斯网方法能够产生良好的分数。LogitBoost方法在波兰和澳大利亚数据集上都具有竞争力,而AdaBoost方法最适合于日本数据集。对于台湾数据集,与其他考虑的技术相比,随机森林方法的结果最好。然而,在印度定性破产数据集上,由于该数据集的性质,几乎所有方法都具有可比性。

MSC公司:

91G40型 信用风险
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] H.Abdou和J.Pointon,《信用评分、统计技术和评估标准:文献综述》,《会计、财务和管理智能系统》18(2-3)(2011),59-88。
[2] H.A.Abdou,《信贷评分的遗传编程:埃及公共部门银行案例》,《应用专家系统》36(2009),11402-11417。
[3] J.Abellan和C.J.Mantas,《改进破产预测和信用评分分类集合的实验研究》,《应用专家系统》41(2014),3825-3830。
[4] T.Bellotti和J.Crook,《信用评分和重要特征发现的支持向量机》,《应用专家系统》36(2009),3302-3308。
[5] L.Breiman、J.Friedman、R.Olshen和C.Stone,分类和回归树,加利福尼亚州贝尔蒙特市沃兹沃斯,1984年·Zbl 0541.62042号
[6] L.Breiman,Bagging predictors,机器学习24(2)(1996),123-140·Zbl 0858.68080号
[7] D.Boughaci和A.A.K.Alkhawaldeh,《信用评分合作分类系统》,载于:2017年《AUEIRC会议记录》,施普林格出版社,2017年出版。
[8] D.Boughaci和A.A.K.Alkhawaldeh,一种新的用于信用评分的变量选择方法,算法金融7(1-2)(2018),43-52,IOS出版社。
[9] D.R.Cox,二元序列的回归分析(讨论),J.Roy Stat.Soc.B20(1958),215-242,JSTOR·Zbl 0088.35703号
[10] V.Desay、J.N.Crook和G.A.Overstreet,信用合作社环境中神经网络和线性评分模型的比较,《欧洲运筹学杂志》95(1996),24-37·Zbl 0955.90506号
[11] Y.Freund和R.E.Schapire,《在线学习的决策理论概括及其在助推中的应用》,《计算机与系统科学杂志》55(1997),119·Zbl 0880.68103号
[12] N.Friedman、D.Geiger和M.Goldszmidt,贝叶斯网络分类器,《机器学习》29(1997),第131-163页·Zbl 0892.68077号
[13] J.Friedman、T.Hastie和R.Tibshirani,《加性逻辑回归:助推的统计学观点》,《统计年鉴》28(2)(2000),337-407·兹比尔1106.62323
[14] A.Milne、M.Rounds和P.Goddard,《使用量子退火器进行信用评分和分类的最佳特征选择》(2017年)https://1qbit.com/whitepaper/optime-featureselection-in-credit-scoring-class(https://1 qbit.com白皮书/优化功能选择-in-credit-scoring-classi)fication-using-quantum退火机/。
[15] D.J.Hand和W.E.Henley,《消费信贷评分中的统计分类方法》,《皇家统计学会杂志》,A辑(社会统计)160(1997),523-541。
[16] W.E.Henley和D.J.Hand,用于评估消费者信贷风险的k近邻分类器,《统计学家》45(1996),77-95。
[17] R.C.Holte,《非常简单的分类规则在最常用的数据集上表现良好》,《机器学习》11(1993),63-91·Zbl 0850.68278号
[18] T.K.Ho,《随机决策森林》,载于:《第三届文件分析和识别国际会议论文集》,魁北克省蒙特利尔,1995年8月14日至16日,第278-282页。
[19] J.Li,L.Wei,G.Li和W.Xu,《基于进化策略的多核多准则编程方法:信贷决策案例》,《决策支持系统》51(2011),292-298。
[20] L.J.Mester,信用评分有什么意义?,《商业评论》(1997年9月),3-16。
[21] M.Miller,Research confirms value of credit scoring,National Underwriter107(42)(2003),30。
[22] D.M.W.Powers,《评估:从精确性、召回和FMeasure到ROC、信息性、标记性和相关性》,《机器学习技术杂志》2(1)(2011),37-63。
[23] J.R.Quinlan,《简化决策树》,《国际机器研究杂志》(1987年),第221-234页。
[24] J.R.Quinlan,《C4.5:机器学习程序》,摩根·考夫曼,加州圣马特奥,1992年。
[25] J.Rennie、L.Shih、J.Teevan和D.Karger,《处理朴素贝叶斯分类法的不良假设》,载于:ICML2003。
[26] 弗兰克斯。罗森布拉特,《神经动力学原理:感知器和大脑机制理论》,斯巴达图书,华盛顿特区,1961年。
[27] V.Vapnik,统计学习理论,John Wiley and Sons,美国纽约,1998年·Zbl 0935.62007号
[28] 怀卡托知识分析环境(WEKA)3.9版。新西兰哈米尔顿怀卡托大学,软件可用网址:http://www.cs.waikato.ac.nz/~ml/weka/:访问日期:2017年11月。
[29] J.C.Wiginton,《消费者信贷行为的logit和判别模型比较注释》,《金融与定量分析杂志》15(1980),757-770
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。