德博克(Koen W.De Bock)。;克里斯托夫·库塞门特;斯特凡·莱斯曼 错误分类成本不确定时的成本敏感业务失败预测:异构集成选择方法。 (英语) Zbl 1441.91085号 欧洲药典。物件。 285,第2期,612-630(2020年)。 摘要:为了评估与客户、供应商、债务人或承包商等企业合作伙伴建立关系的相关风险,决策者通常会求助于业务失败预测模型。虽然大量文献关注于优化和评估新方法的分类准确性,但最近的研究已经承认存在与预测错误相关的不对称误分类成本,因此,提倡使用替代评估指标。然而,这些论文通常假设错误分类成本矩阵对于模型的培训和评估都是已知的和固定的,而实际上这些成本通常是不确定的。本文提出了一种基于异构集成选择和多目标优化的方法框架,用于成本敏感型业务失败预测,该方法能够在误分类成本水平上调节不确定性。该框架假定模型培训期间的成本未知,并在模型部署期间适应不同程度的不确定性。具体来说,部署NSGA-II是为了优化成本空间,从而产生一组Pareto-optimal集成分类器,使每个学习者在特定的成本比率范围内将预期的误分类成本降至最低。一组广泛的实验在多个数据集上评估了该方法,并针对反映模型部署期间成本比率已知程度的不同场景进行了评估。结果清楚地表明,在缺乏准确的误分类成本知识的情况下,我们的方法能够最小化成本。 引用于三文件 MSC公司: 91G45型 金融网络(包括传染、系统风险、监管) 62H30型 分类和区分;聚类分析(统计方面) 62P05号 统计学在精算科学和金融数学中的应用 68T05型 人工智能中的学习和自适应系统 关键词:商业失败预测;成本敏感型学习;集合选择;成本不确定性;多准则优化;NSGA-II公司 软件:4.5条;对;AdaCost公司;CSMES公司 PDF格式BibTeX公司 XML格式引用 \textit{K.W.De Bock}等人,《欧洲药典》。第285号决议,第2号,612--630(2020年;Zbl 1441.91085) 全文: 内政部 参考文献: [1] Abellán,J。;Castellano,J.G.,《信用评分集成方法中基本分类器的比较研究》,《应用专家系统》,73,1-10(2017) [2] 亚当斯,新墨西哥州。;Hand,D.J.,《当错误分配成本不确定时比较分类器》,模式识别,32,7,1139-1147(1999) [3] Altman,E.I.,《财务比率、判别分析和公司破产预测》,《金融杂志》,23,4,589-609(1968) [4] 贝克,B。;Heskes,T.,神经网络模型的聚类集合,神经网络,16,2261-269(2003) [5] Balcaen,S。;Ooghe,H.,《商业失败研究35年:经典统计方法及其相关问题概述》,《英国会计评论》,38,1,63-93(2006) [6] 鲍尔,J。;Agarwal,V.,风险模型是否优于传统破产预测方法?《综合测试》,《银行与金融杂志》,40,432-442(2014) [7] Bodnar,D.,《西欧破产人数呈上升趋势》(2019年),首席财务官 [8] Bou-Hamad,I。;拉罗基,D。;Ben Ameur,H.,具有时变协变量的离散时间生存树和森林:对破产数据的应用,统计建模,11,52429-446(2011)·Zbl 1420.62417号 [9] Breiman,L.,打包预测,机器学习,24,2,123-140(1996)·Zbl 0858.68080号 [10] Breiman,L.,《随机森林,机器学习》,45,1,5-32(2001)·Zbl 1007.68152号 [11] 布雷曼,L。;弗里德曼,J.H。;奥尔森,R.A。;Stone,C.J.,《分类和回归树》(1984),查普曼和霍尔/CRC·兹伯利0541.62042 [12] Brigham,E.F。;Gapenski,L.C.,《财务管理:理论与实践》(1994),德莱顿出版社:德莱顿出版公司,佛罗里达州奥兰多。 [13] Britto,A.S。;Sabourin,R。;Oliveira,L.E.,分类器的动态选择-综合评述,模式识别,47,11,3665-3680(2014) [14] 卡鲁阿纳,R。;Munson,A。;Niculescu-Mizil,A.,《充分利用集合选择》,(第六届数据挖掘国际会议论文集(2006年),IEEE计算机学会),828-833 [15] 卡鲁阿纳,R。;尼古列斯库·马齐尔(Niculescu-Mizil),A。;船员,G。;Ksikes,A.,从模型库中选择集成,(第21届机器学习国际会议论文集(2004),ACM),18-27 [16] 查特兰,C。;亚当·S。;Lecourtier,Y。;Heutte,L。;Paquet,T.,未知和/或演化错误分类成本问题的多模型选择框架,模式识别,43,3,815-823(2010)·Zbl 1187.68434号 [17] Chava,S。;Jarrow,R.A.,《破产预测与行业影响》,《金融评论》,第8537-569页(2004年)·兹比尔1059.91036 [18] 陈,A。;陈,N。;Ribeiro,B.,成本敏感型信贷风险评估分类器集成的比较研究,智能数据分析,19,1,127-144(2015) [19] 陈,C。;Liaw,A。;Breiman,L.,《使用随机森林学习不平衡数据》(2004),加州大学统计系:加州大学伯克利分校统计系,技术报告666 [20] 陈,N。;Ribeiro,B.,在成本敏感的破产预测中组合多个分类器的共识方法,(自适应和自然计算算法国际会议论文集(ICANNGA 2013)(2013),Springer Verlag),pp。 [21] Cheng,F。;Fu,G。;张,X。;邱,J.,用于优化ROC曲线下部分区域的多目标进化算法,基于知识的系统,170,61-69(2019) [22] Unternehmensisolvenzen in Europa-Jahr 2013/14(2014),信贷改革Wirtschaftsforschung [23] 克罗克斯,C。;Joossens,K。;Lemmens,A.,Trimmed bagging,计算统计与数据分析,52,1,362-368(2007)·Zbl 1452.62047号 [24] 达瓦洛斯,S。;Leng,F。;费罗兹,E.H。;曹,Z.,《设计基于if-then规则的异构破产分类器集成:遗传算法方法》,《会计、财务和管理智能系统》,21,3,129-153(2014) [25] De Bock,K.W.,Coussement,K.,&Lessmann,S.(2020年)。CSMES:成本敏感型多准则集合选择和其他分类器,用于未知成本条件下的成本敏感型学习(R包版本1.0)。恢复fromhttps://CRAN.R-project.org/package=CSMES。 [26] Deb,K。;普拉塔普,A。;阿加瓦尔,S。;Meyarivan,T.,一种快速的精英多目标遗传算法:NSGA-II,IEEE进化计算汇刊,6,2,182-197(2002) [27] Demšar,J.,多数据集上分类器的统计比较,机器学习研究杂志,7,1-30(2006)·Zbl 1222.68184号 [28] 迪米特拉斯,A.I。;Zanakis,S.H。;Zopounidis,C.,《以预测方法和工业应用为重点的商业失败调查》,《欧洲运筹学杂志》,90,3,487-513(1996)·Zbl 0907.90038号 [29] Domingos,P.,Metacost:使分类器具有成本敏感性的一般方法,(第五届ACM SIGKDD知识发现和数据挖掘国际会议论文集(1999),ACM),155-164 [30] dos Santos,E.M.,应用于分类器集成选择的进化算法,(第44届巴西运筹学研讨会/第16届拉丁美洲运筹学会议论文集(2012)) [31] 多斯桑托斯,E.M。;Sabourin,R。;Maupin,P.,选择分类器集合的动态生产过剩和选择策略,模式识别,41,10,2993-2009(2008)·Zbl 1151.68602号 [32] Doumpos,M。;雄配子体,K。;Galariotis,E。;马克里杜,G。;Zopounidis,C.,《欧洲能源部门的企业失败预测:多标准方法和国家特征的影响》,《欧洲运筹学杂志》,262,1,347-360(2017) [33] Doumpos,M。;Zopounidis,C.,《信用风险评估的模型组合:叠加泛化方法》,《运筹学年鉴》,151,1,289-306(2007)·兹比尔1132.91488 [34] Drummond,C。;Holte,R.,《成本曲线:可视化分类器性能的改进方法》,机器学习,65,1,95-130(2006) [35] Ekinci,A。;Erdal,H.I.,《预测银行破产:基础学习者、集成和混合集成》,计算经济学,49,4,677-686(2017) [36] 风扇,W。;Stolfo,S.J。;张杰。;Chan,P.K.,AdaCost:误分类成本敏感性提升,(第十六届机器学习国际会议(ICML’99)(1999),Morgan Kauffman),97-105 [37] 弗伦德,Y。;Schapire,R.E.,《新增压算法的实验》,(第十三届机器学习国际会议论文集(ICML 1996)(1996),摩根考夫曼:摩根考夫曼巴里,意大利),148-156 [38] Friedman,J.H.,《随机梯度增强》,计算统计与数据分析,38,4,367-378(2002)·兹比尔1072.65502 [39] Friedman,M.,《使用秩来避免方差分析中隐含的正态假设》,《美国统计协会杂志》,32,200,675-701(1937) [40] Frydman,H。;奥特曼,E.I。;Kao,D.-L.,《引入递归划分进行财务分类:财务困境案例》,《金融杂志》,40,1,269-291(1985) [41] 南卡罗来纳州加西亚。;费尔南德斯,A。;Luengo,J。;Herrera,F.,《计算智能和数据挖掘实验设计中多重比较的高级非参数测试:权力的实验分析》,信息科学,180,10,2044-2064(2010) [42] Hernández-Orallo,J。;弗拉奇,P。;Ferri,C.,《绩效指标的统一观点:将阈值选择转化为预期分类损失》,《机器学习研究杂志》,2012年10月13日,2813-2869·Zbl 1436.62260号 [43] Hernández-Orallo,J。;Flach,P.A。;Ramirez,C.F.,《Brier曲线:基于成本的分类器性能可视化》,(第28届国际机器学习会议论文集(2011年),585-592 [44] Ho,T.K.,构建决策林的随机子空间方法,IEEE模式分析和机器智能汇刊,20,8,832-844(1998) [45] 华,Z。;Wang,Y。;Xu,X。;张,B。;Liang,L.,基于支持向量机和逻辑回归集成的企业财务困境预测,专家系统与应用,33,2,434-440(2007) [46] 乔·H。;韩,I。;Lee,H.,使用基于案例的推理、神经网络和判别分析进行破产预测,《应用专家系统》,13,2,97-108(1997) [47] 约翰逊·R·A。;Raeder,T。;Chawla,N.V.,为假设场景优化分类器,(太平洋亚洲知识发现和数据挖掘会议论文集(PAKDD 2015)(2015),Springer International Publishing),264-276 [48] Kim,M.H。;Yoo,P.D.,金融破产预测的半参数模型方法,(2006年IEEE智能系统工程国际会议论文集(2006)),1-6 [49] Kirkos,E.,《智能破产预测的评估方法》,《人工智能评论》,第43、1、83-123页(2012年) [50] Ko,A.H.R。;Sabourin,R。;Britto,J.A.S.,从动态分类器选择到动态集成选择,模式识别,41,5718-1731(2008)·Zbl 1140.68466号 [51] 科莱,M。;莱蒙,M。;Tashjian,E.,传播痛苦?供应链中破产溢出的来源,《金融与定量分析杂志》,51,61955-1990(2016) [52] Kotsiantis,S。;Tzelepis,D。;库马纳科斯,E。;Tampakas,V.,破产预测的选择性成本投票,《国际基于知识和智能工程系统杂志》,11,2115-127(2007) [53] Kuncheva,L.I。;Rodriguez,J.J.,《关于轮换森林集合的实验研究》(《多分类器系统国际研讨会论文集》(MCS 2007)(2007),柏林春天:柏林春天——布拉格,捷克共和国),459-468 [54] Lanine,G。;Vennet,R.V.,《使用逻辑和特征识别模型预测俄罗斯银行业的故障》,《应用专家系统》,第30、3、463-478页(2006年) [55] 莱斯曼,S。;Baesens,B。;Seow,H.-V。;Thomas,L.C.,《信用评分的标杆先进分类算法:研究更新》,《欧洲运筹学杂志》,247,1,124-136(2015)·Zbl 1346.90835号 [56] 列夫斯克,J.-C。;杜兰德,A。;加涅,C。;Sabourin,R.,《在ROC空间中生成分类器集合的多目标进化优化》,(第14届遗传和进化计算年会论文集(2012),ACM:美国宾夕法尼亚州费城ACM),879-886 [57] 李,H。;Sun,J.,从敏感性、特异性、正负值看基于案例推理在中国商业失败预测中的表现,应用软计算,11,1,460-467(2011) [58] 李,H。;Sun,J.,《基于主成分案例的商业失败预测推理集成》,信息与管理,48,6,220-227(2011) [59] Li,J.,《检验多个假设的两步拒绝程序》,《统计规划与推断杂志》,138,6,1521-1527(2008)·Zbl 1131.62067号 [60] 李伟(Li,W.)。;丁·S。;陈,Y。;Yang,S.,中国对等贷款违约预测的异质集合,IEEE Access,654396-54406(2018) [61] Lin,F.Y。;McClean,S.,《预测企业失败的数据挖掘方法》,基于知识的系统,14,3,189-195(2001) [62] 刘晓云。;Zhou,Z.-H.,“以成本为间隔的学习”,(第16届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2010),ACM:ACM Washington,DC,USA),403-412 [63] Marginantu,D。;Dietterich,T.,修剪自适应增强,(第十四届机器学习国际会议论文集(ICML'97)(1997年),Morgan Kaufmann Publishers Inc),211-218 [64] Martin,D.,《银行倒闭的早期预警:逻辑回归方法》,《银行与金融杂志》,1,3,249-276(1977) [65] 马丁内斯·穆诺兹(Martinez-Munoz,G.)。;埃尔南德斯·洛巴托,D。;Suarez,A.,基于有序聚合的集成修剪技术分析,IEEE模式分析和机器智能汇刊,31,2245-259(2009) [66] McGurr,P.T。;DeVaney,S.A.,《预测零售企业的商业失败:使用混合行业模型的分析》,《商业研究杂志》,43,169-176(1998) [67] 奥尔森;James,A.,《财务比率与破产概率预测》,《会计研究杂志》,第18、1、109页(1980年) [68] 奥利米达,I。;Fernández,E.,《金融多准则决策的混合分类器:破产预测案例》,计算经济学,10,4,317-335(1997)·Zbl 0883.90046号 [69] 奥佐-阿奎兹,S。;温迪特,T。;Smith,R.,《通过优化精度-多样性权衡来修剪纠错输出代码》,机器学习,101,1,253-269(2015)·Zbl 1343.68203号 [70] 帕普斯科娃,M。;Hajek,P.,使用异构集成学习的两阶段消费者信贷风险建模,决策支持系统,118,33-45(2019) [71] 帕塔拉斯,I。;Tsoumakas,G。;Vlahavas,I.,通过强化学习修剪分类器集合,神经计算,72,7,1900-1909(2009) [72] Pendharkar,P.,基于遗传算法的人工神经网络分类器的误分类成本最小化适应度函数,运筹学学会杂志,60,8,1123-1134(2008)·Zbl 1168.92304号 [73] Pendharkar,P.C.,用于分类的阈值可变人工神经网络方法及其在破产预测问题中的应用,计算机与运营研究,32,10,2561-2582(2005)·Zbl 1081.62078号 [74] Provost,F。;Domingos,P.,基于概率排序的树归纳法,机器学习,52,3,199-215(2003)·Zbl 1039.68105号 [75] Provost,F。;Fawcett,T.,《不精确环境下的稳健分类》,机器学习,42,3,203-231(2001)·Zbl 0969.68126号 [76] Quinlan,R.,C4.5:《机器学习程序》(1993),摩根考夫曼出版社:摩根考夫曼出版社,加利福尼亚州圣马特奥。 [77] 检索自https://www.R-project.org。 [78] 拉维·库马尔,P。;Ravi,V.,《通过统计和智能技术预测银行和公司破产——综述》,《欧洲运筹学杂志》,第180、1、1-28页(2007年)·Zbl 1114.91305号 [79] 拉维,V。;Kurniawan,H。;泰国,P.N.K。;Kumar,P.R.,《银行绩效预测的软计算系统》,应用软计算,8,1,305-315(2008) [80] 罗德里格斯,J.J。;Kuncheva,L.I。;Alonso,C.J.,《旋转森林:一种新的分类器集成方法》,IEEE模式分析和机器智能汇刊,28,10,1619-1630(2006) [81] 罗斯,S.A。;韦斯特菲尔德,R.W。;约旦,B.D。;Roberts,G.S.,《公司财务基础》(2002年),McGraw-Hill Ryerson:加拿大多伦多McGraw-Hill Ryerson出版社 [82] Sun,J。;Li,H.,基于多分类器加权多数投票组合的上市公司财务困境预测,专家系统与应用,35,3181-827(2008) [83] Sun,J。;李,H。;黄,Q.-H。;He,K.-Y.,《预测财务困境和公司破产:从最先进的定义、建模、抽样和特征方法进行回顾》,《基于知识的系统》,57,41-56(2014) [84] Sun,L。;Shenoy,P.P.,《使用贝叶斯网络进行破产预测:一些方法学问题》,《欧洲运筹学杂志》,第180、2、738-753页(2007年)·Zbl 1123.90305号 [85] Sylvester,J。;Chawla,N.V.,《进化集成的创建和细化》(神经网络国际联合会议论文集,2006年)。IJCNN’06(2006),IEEE),5148-5155 [86] Tsai,C.-F.,破产预测中的特征选择,基于知识的系统,22,2,120-127(2009) [87] Verikas,A。;Kalsyte,Z。;巴考斯基,M。;Gelzinis,A.,《破产预测中基于混合和集成的软计算技术:一项调查》,《软计算》,第14期,995-1010页(2010年) [88] Viaene,S。;Dedene,G.,《重新审视成本敏感学习和决策》,《欧洲运筹学杂志》,166,1,212-220(2005)·Zbl 1066.90537号 [89] Wang,R.和Tang,K.(2012)。不确定成本的Minimax分类器。arXiv,1205.0406年。 [90] Weiss,G.M.,《稀有采矿:统一框架》,SIGKDD Explorations,6,1,315-354(2004) [91] Woloszynski,T。;Kurzynski,M.,动态集成选择分类器能力的概率模型,模式识别,44,10-11,2656-2668(2011)·Zbl 1218.68155号 [92] Woloszynski,T。;Kurzynski,M。;波德西亚德洛,P。;Stachowiak,G.W.,基于随机分类的动态集成选择能力度量,信息融合,13,3,207-213(2012) [93] 夏,Y。;刘,C。;Da,B。;谢凤,基于bstacking方法的新型异质集合信用评分模型,应用专家系统,93,182-199(2018) [94] 扎德罗兹尼,B。;Elkan,C.,《成本和概率都未知时的学习和决策》,(第七届ACM SIGKDD国际知识发现和数据挖掘会议论文集。第七届AC M SIGKDD国际知识发现与数据挖掘会议文献集,加利福尼亚州旧金山(2001),ACM),204-213 [95] 扎德罗兹尼,B。;Elkan,C.,《将分类器分数转换为准确的多类概率估计》,(第八届ACM SIGKDD国际知识发现和数据挖掘会议论文集。第八届AC M SIGKDD国际知识发现与数据挖掘会议文献集,加拿大艾伯塔省埃德蒙顿市(2002),ACM),694-699 [96] 赵,J。;巴斯托·费尔南德斯,V。;Jiao,L。;叶夫塞耶娃,I。;Maulana,A。;Li,R。;Bäck,T。;Tang,K。;T.M.Emmerich,M.,通过基于3D凸包的进化算法对分类器进行多目标优化,信息科学,367-368,80-104(2016) [97] 赵,J。;Jiao,L。;刘,F。;巴斯托·费尔南德斯,V。;叶夫塞耶娃,I。;夏,S。;T.M.Emmerich,M.,基于三维快速凸壳的进化多目标优化算法,应用软计算,67,322-336(2018) [98] Zhou,Z.-H.,《集成方法:基础和算法》(Ensemble methods:Foundations and algorithms)(2012年),查普曼和霍尔/CRC 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。