×

基于Blinex损失的稳健成本敏感核方法及其在信用风险评估中的应用。 (英语) Zbl 1527.91174号

摘要:信用风险评估是财务分析中一个关键但具有挑战性的问题。它不仅可以帮助机构降低风险和确保盈利,还可以改善消费者的公平做法。人工智能技术等数据驱动算法将评估视为一个分类问题,旨在将交易分类为默认或非默认。由于非默认样本的数量远远超过默认样本,这是一个典型的不平衡学习问题,每个类或每个样本都需要特殊处理。提出了大量的数据级、算法级和混合方法,成本敏感支持向量机(CSSVM)是典型的算法级方法。基于对称和无界损失函数的最小化,CSSVM使用领域特定参数对少数实例的误分类代价施加更高的惩罚。然而,像误差测量这样的损失函数不能有明显的成本敏感性概括。本文提出了一种基于Blinex损失的稳健成本敏感核方法(CSKB),可用于信用风险评估。通过继承Blinex损失函数的优雅优点,即不对称性和有界性,CSKB不仅可以灵活地控制这两类的不同成本,而且还具有噪声鲁棒性。CSKB作为一种数据驱动的信用风险评估决策范式,可以实现金融机构和消费者的“双赢”局面。我们分别用Nesterov加速梯度算法和Pegasos算法求解线性和非线性CSKB。此外,从理论上分析了CSKB的泛化能力。在综合数据集、UCI数据集和信用风险评估数据集上的综合实验表明,CSKB在各种度量方面比其他基准方法更有利。

MSC公司:

91G40型 信用风险
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Barandela,R。;桑切斯,J.S。;加尔卡,V。;Rangel,E.,《课堂学习不平衡问题的策略》,模式识别,36,3,849-851(2003)
[2] Bartlett,P。;Mendelson,S.,《Rademacher和Gaussian复杂性:风险边界和结构结果》,《机器学习研究杂志》,3463-482(2003)·Zbl 1084.68549号
[3] Barua,S。;伊斯兰,M.M。;姚,X。;Murase,K.,MWMOTE-用于不平衡数据集学习的多数加权少数过采样技术,IEEE知识与数据工程汇刊,26,2,405-425(2012)
[4] 比亚克,K。;Thomas,L.C.,《使用贝叶斯方法对无担保零售贷款的LGD建模》,《运筹学会杂志》,66,2,342-352(2015)
[5] 卡兰通,R.J。;迪贝内代托,C.A。;Errunza,V.R.,《信用评估中离散变量选择的使用》,Omega,16,5,469-480(1988)
[6] 查拉,N.V。;鲍耶,K.W。;洛杉矶霍尔。;Kegelmeyer,W.P.,SMOTE:合成少数人过采样技术,《人工智能研究杂志》,16,321-357(2002)·Zbl 0994.68128号
[7] Chi,G。;Zhang,Z.,使用非参数方法的小企业多标准信用评级模型,可持续性,9,10,1834(2017)
[8] Chin,T.J。;Suter,D.,增量核主成分分析,IEEE图像处理汇刊,16,6,1662-1674(2007)
[9] 达塔,S。;Das,S.,Near Bayesian支持向量机,用于错误分类成本相等或不等的不平衡数据分类,神经网络,70,39-52(2015)·Zbl 1394.68280号
[10] Demšar,J.,多数据集分类器的统计比较,机器学习研究杂志,7,1-30(2006)·Zbl 1222.68184号
[11] Dong,Q。;龚,S。;朱,X.,通过少数类增量校正实现的非平衡深度学习,IEEE模式分析与机器智能汇刊,41,6,1367-1381(2018)
[12] Doumpos,M。;Figueira,J.R.,《企业信用评级建模的多标准超越方法:electre tri-nc方法的应用》,Omega,82,166-180(2019)
[13] 杜扎斯,G。;巴考,F。;最后,F.,通过基于k-means和SMOTE的启发式过采样方法改善不平衡学习,信息科学,465,1-20(2018)
[14] Falbo,P.,通过扩大的判别模型进行信用评分,Omega,19,4,275-289(1991)
[15] 弗朗西斯,R。;巴赫,D.H。;Horvitz,E.,《考虑分类器学习中的成本不对称》,《机器学习研究杂志》,7,1,1713-1741(2006)·兹比尔1222.68137
[16] 弗莱奈,B。;Verleysen,M.,《标签噪声存在下的分类:一项调查》,IEEE神经网络和学习系统汇刊,25,5,845-869(2013)
[17] 加拉尔,M。;费尔南德斯,A。;Barrenechea,E。;Bustince,H。;Herrera,F.,《阶级不平衡问题的集合综述:打包、提升和混合方法》,IEEE系统、人与控制论汇刊,C部分,42,4,463-484(2011)
[18] 南卡罗来纳州加西亚。;费尔南德斯,A。;Luengo,J。;Herrera,F.,计算智能和数据挖掘实验设计中多重比较的高级非参数检验:功率的实验分析,信息科学,180,102044-2064(2010)
[19] 顾,B。;Quan,X。;顾毅。;Sheng,V.S。;Zheng,G.,成本敏感铰链损失支持向量机的Chunk增量学习,模式识别,83,196-208(2018)
[20] Hajek,P.,《使用区间值模糊规则系统预测企业投资/非投资等级——跨区域分析》,应用软计算,62,73-85(2018)
[21] Han,H。;Wang,W。;Mao,B.,Borderline-SMOTE:非平衡数据集学习中的一种新的过采样方法,(智能计算国际会议论文集(2005),Springer),878-887
[22] 黄,R。;Chung,H。;Chu,C.,使用半参数方法预测发行人信用评级,《实证金融杂志》,17,1,120-137(2010)
[23] 艾伦迈尔,A。;Masnadi-Shirazi,H。;Vasconcelos,N.,成本敏感支持向量机,神经计算,343,50-64(2019)
[24] Ju,Y.H。;Sohn,S.Y.,《在不实现实际数据的情况下,基于新属性更新信用评分模型》,《欧洲运筹学杂志》,234,1,119-126(2014)·Zbl 1305.62362号
[25] 卡拉库拉斯,G。;Shawe-Taylor,J.,为不平衡训练集优化分类器,(神经信息处理系统的进展(1999)),253-259
[26] Kim,Y。;Sohn,S.Y.,信用评级过渡的随机效应模型,《欧洲运筹学杂志》,184,2,561-573(2008)·Zbl 1149.90370号
[27] Kim,H.S。;Sohn,S.Y.,基于技术信用的中小企业违约预测支持向量机,《欧洲运筹学杂志》,201,3838-846(2010)·Zbl 1173.90458号
[28] Kim,K.H。;Sohn,S.Y.,用于分类平衡多模态数据的具有成本敏感支持向量机的混合神经网络,神经网络,130,176-184(2020)
[29] 柯克帕特里克,S。;盖拉特,C.D。;Vecchi,M.P.,模拟退火优化,科学,2204598671-680(1983)·兹比尔1225.90162
[30] 克里希纳穆尔西,A。;阿加瓦尔,A。;黄,T.-K。;DauméIII,H。;Langford,J.,成本敏感分类的主动学习,《机器学习研究杂志》,20,65,1-50(2019)·Zbl 1489.68227号
[31] 莱斯曼,S。;Baesens,B。;Seow,H.-V。;Thomas,L.C.,《信用评分的标杆先进分类算法:研究更新》,《欧洲运筹学杂志》,247,1,124-136(2015)·Zbl 1346.90835号
[32] 罗,J。;Xin,Y。;Tian,Y.,无监督二次曲面支持向量机及其在信用风险评估中的应用,《欧洲运筹学杂志》,280,31008-1017(2020)·兹比尔1430.62138
[33] Malhotra,R。;Malhotra,D.K.,《利用神经模糊系统区分好学分和坏学分》,《欧洲运筹学杂志》,136,1,190-211(2002)·Zbl 1087.91515号
[34] Malhotra,R。;Malhotra,D.K.,使用神经网络评估消费者贷款,Omega,31,2,83-96(2003)
[35] 马修,J。;Pang,C.K。;罗,M。;Leong,W.H.,通过支持向量机核空间中的过采样对不平衡数据进行分类,IEEE神经网络和学习系统汇刊,29,9,4065-4076(2018)
[36] Min,J.H。;Lee,Y.,《信用评分的实用方法》,《应用专家系统》,35,4,1762-1770(2008)
[37] 内科伊梅尔,I。;LaiYuen,S.K.,不平衡数据集的自适应半无监督加权过采样(A-SUWO),应用专家系统,46,405-416(2016)
[38] Nguyen,T。;Le,T。;Nguyen,K。;德维尔,O。;蒙塔古,P。;Grundy,J.,用于二进制软件漏洞检测的深度成本敏感内核机(Pacifi-Asia知识发现和数据挖掘会议(2020),Springer),164-177
[39] 潘,Y。;张,L。;吴,X。;Skibniwski,M.J.,风险分析中的多分类信息融合,信息融合,60,121-136(2020)
[40] 齐克。;Yang,H。;胡,Q。;Yang,D.,一种新的自适应加权非平衡数据分类器,基于高维性质的改进支持向量机,基于知识的系统,185,文章104933 pp.(2019)
[41] 拉夫·L。;Vandermeulen,R。;戈尼茨,N。;Deecke,L.公司。;Siddiqui,S.A。;Binder,A.,深度一级分类,(机器学习国际会议(2018),PMLR),4393-4402
[42] 沙列夫·施瓦茨,S。;辛格,Y。;斯雷布罗,N。;Cotter,A.,Pegasos:支持向量机的原始估计子梯度解算器,《数学规划》,127,1,3-30(2011)·Zbl 1211.90239号
[43] Simon,H.A.,《社会科学中的有限理性:今天和明天》,《心理与社会》,第1期,第25-39页(2000年)
[44] 苏·W。;博伊德,S。;Candès,E.J.,《建模Nesterov加速梯度法的微分方程:理论与见解》,《机器学习研究杂志》,17,1,5312-5354(2016)·Zbl 1391.90667号
[45] Sutskever,I.、Martens,J.、Dahl,G.和Hinton,G.(2013)。关于初始化和动量在深度学习中的重要性。第30届机器学习国际会议论文集(第28卷)(第3期)(第1139-1147页)。
[46] Tang,J。;Tian,Y.,带非并行支持向量机的多核框架,神经计算,266226-238(2017)
[47] Tang,J。;田,Y。;刘,D。;Kou,G.,用于多视图学习的耦合特权内核方法,信息科学,481110-127(2019)·Zbl 1443.68157号
[48] Tang,J。;田,Y。;张,P。;Liu,X.,多视图特权支持向量机,IEEE神经网络和学习系统汇刊,29,8,3463-3477(2018)
[49] 陶,X。;李强。;郭伟。;Ren,C。;李,C。;Liu,R.,基于自适应成本权重的支持向量机非平衡数据分类成本敏感集成,信息科学,487,31-56(2019)
[50] 陶,X。;李强。;Ren,C。;郭伟。;何,Q。;Liu,R.,基于亲和力和类概率的不平衡数据集模糊支持向量机,神经网络,122,289-307(2020)
[51] Vapnik,V.N.,统计学习理论概述,IEEE神经网络汇刊,10,5,988-999(1999)
[52] 王,D。;陈,B。;Chen,J.,《消费者激励下的信用卡欺诈检测策略》,Omega,88,179-195(2019)
[53] 王,X。;Yang,Y。;陈,M。;王,Q。;秦,Q。;Jiang,H.,AGNES-SMOTE:基于层次聚类和改进SMOTE的过采样算法,科学规划,2020(2020)
[54] 吴杰。;蔡,Z。;Ao,S.,《用于分类的混合动态k近邻距离和属性加权法》,《国际计算机应用技术杂志》,43,4,378-384(2012)
[55] 吴杰。;蔡,Z。;曾S。;Zhu,X.,属性加权朴素贝叶斯分类的人工免疫系统,(国际神经网络联合会议论文集(2013),IEEE),1-8
[56] 吴杰。;蔡,Z。;Zhu,X.,朴素贝叶斯分类的自适应概率估计,(国际神经网络联合会议论文集(2013),IEEE),1-8
[57] Wu,G。;Chang,E.Y.,KBA:考虑不平衡数据分布的内核边界对齐,IEEE知识与数据工程汇刊,6786-795(2005)
[58] 夏,Y。;刘,C。;李毅。;Liu,N.,使用贝叶斯超参数优化进行信用评分的增强决策树方法,应用专家系统,78,225-241(2017)
[59] 肖,J。;周,X。;钟,Y。;谢林。;顾,X。;Liu,D.,客户信用评分的成本敏感半监督选择性集成模型,基于知识的系统,189,第105118条,pp.(2020)
[60] 是的,C.-C。;林,F。;Hsu,C.-Y.,一种混合KMV模型,用于信用评级的随机森林和粗糙集理论方法,基于知识的系统,33,166-172(2012)
[61] Yu,H。;Sun,C。;杨,X。;杨伟(Yang,W.)。;沈杰。;Qi,Y.,ODOC-ELM:用于分类不平衡数据的基于补偿的最优决策输出极端学习机,基于知识的系统,92,55-70(2016)
[62] 张,Z。;高,G。;Shi,Y.,使用带核、模糊化和惩罚因子的多准则优化分类器进行信用风险评估,《欧洲运筹学杂志》,237,1,335-348(2014)·Zbl 1304.91235号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。