×

信用评分中特征选择的过滤方法和多种群遗传算法混合系统。 (英语) 兹比尔1377.62201

摘要:2007年金融危机爆发,银行业面临着巨大的信贷风险。因此,信用评分越来越受到人们的关注。银行拥有大量客户数据。利用这些数据,信用评分模型可以准确判断申请人的信用风险。但这些数据通常是高维的,并且具有一些不相关的特征。这些无关的特征将影响分类器的准确性。因此,特征选择是一个重要的课题。本文提出了一种基于滤波方法和多种群遗传算法-HMPGA的两阶段混合算法。在第一阶段,将包装器方法的思想引入到三种滤波方法中,以获取MPGA初始种群设置的一些重要先验信息。在第二阶段,它利用MPGA的全局优化和快速收敛特性来寻找最优特征子集。本文使用UCI数据库的两个真实信用评分数据集对HMPGA、MPGA和GA进行比较,验证了HMPGA,MPGA和GA获取的特征子集的准确性优于三种过滤方法。同时,通过非参数Wilcoxon符号秩检验证明HMPGA优于MPGA和GA。HMPGA不仅可以应用于信用评分的特征选择,还可以应用于更多的数据挖掘领域。

MSC公司:

62P05号 统计学在精算学和金融数学中的应用
62G10型 非参数假设检验
91G40型 信用风险

软件:

Matlab公司4.5条
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Oreski,S。;Oreski,D。;Oreski,G.,遗传算法和人工神经网络混合系统及其在零售信贷风险评估中的应用,专家系统。申请。,39, 12605-12617 (2012)
[2] Khandani,A.E。;amd Andrew W.Lo,A.J.K.,《通过机器学习算法的消费者信用风险模型》,J.Bank。,34, 2767-2787 (2010)
[3] Akko,S.,《传统技术、神经网络和用于信用评分分析的三阶段混合自适应神经模糊推理系统(anfis)模型的实证比较:土耳其信用卡数据案例》,欧洲J.Oper。研究,222168-178(2012)
[4] Danenas,P。;加斯瓦,G。;Gudas,S.,《使用基于支持向量的分类器开发信用风险评估模型》,Procedia Compute。科学。,4, 1699-1707 (2011)
[5] Finlay,S.,《多分类器体系结构及其在信用风险评估中的应用》,欧洲期刊Oper。第210368-378号决议(2011年)
[6] 蔡美忠。;林,S.-P。;Cheng,C.-C。;林永平,消费者贷款违约预测模型——dea-da和神经网络的应用,专家系统。申请。,36, 11682-11690 (2009)
[7] Sustersic,M。;Mramor,D。;Zupan,J.,《数据有限的消费者信用评分模型》,专家系统。申请。,364736-4744(2009年)
[8] Oreski,S。;Oreski,G.,《信贷风险评估中基于遗传算法的特征选择启发式算法》,专家系统。申请。,41, 2052-2064 (2014)
[9] Huang,J。;Wang,H。;Wang,W。;Xiong,Z.,《客户信用评估中特征选择的计算研究》,(2013年IEEE系统人与控制论国际会议论文集(2013)),2973-2978
[10] Chen,F.-L。;Li,F.-C.,特征选择方法与支持向量机在信用评分中的结合,专家系统。申请。,37, 4902-4909 (2010)
[11] Ping,Y。;Yongheng,L.,基于邻域粗糙集和支持向量机的混合信用评分分类器,专家系统。申请。,38, 11300-11304 (2011)
[12] 黄,C.-L。;陈,M.-C。;Wang,C.-J.,基于支持向量机的数据挖掘方法的信用评分,专家系统。申请。,33, 847-856 (2007)
[13] 贝洛蒂,T。;Crook,J.,《信用评分和重要特征发现的支持向量机》,专家系统。申请。,363302-3308(2009年)
[14] Quinlan,J.R.,《学习高效分类程序及其在国际象棋终局中的应用》(机器学习:人工智能方法,加利福尼亚州旧金山:Morgan Kaufmann(1983)),463-482
[15] 昆兰,J.R.,C4.5:机器学习课程(1993),摩根考夫曼:摩根考夫曼旧金山
[16] 布雷曼,L。;弗里德曼,J。;奥尔森,R。;Stone,C.J.,《分类和回归树》(1984),沃兹沃斯和布鲁克斯:沃兹沃思和布鲁克斯-蒙特雷·Zbl 0541.62042号
[17] Tuv,E。;鲍里索夫,A。;Runger,G.C。;Torkkola,K.,《用集合、人工变量和冗余消除进行特征选择》,J.Mach。学习。第10号决议,1341-1366(2009年)·Zbl 1235.62003号
[18] Peralta,B。;Soto,A.,在混合专家中嵌入本地特征选择,Inform。科学。,269, 176-187 (2014)
[19] Jin,C。;金,S.-W。;Qin,L.-N.,基于bpnn和pso混合算法的属性选择方法,应用。软计算。,12, 2147-2155 (2012)
[20] 佩泽拉,F。;Morganti,G。;Ciaschetti,G.,柔性车间调度问题的遗传算法,计算。操作。研究,35,3202-3212(2008)·Zbl 1162.90014号
[21] Talavera,L.,《分类聚类中特征选择的过滤器和包装器方法评估》,《计算讲义》。科学。,3646, 440-451 (2005) ·兹比尔1165.68432
[22] 陈永伟。;林春杰,将支持向量机与各种特征选择策略相结合,模糊软计算研究。,207, 315-324 (2006)
[23] Quinlan,J.R.,决策树归纳,马赫。学习。,1, 81-106 (1986)
[24] Shi,F。;Wang,H。;Yu,L。;胡凤,《Matlab中的30个智能算法案例》(2011),北京航空航天大学出版社:北京航空航天学院出版社
[25] 波茨,J。;吉登斯,T.D。;Yadav,S.,基于迁移和人工选择的改进遗传算法的开发和评估,IEEE Trans。系统。人类网络。,24, 73-86 (1994)
[26] 黄,M.-L。;洪,Y.-H。;Lee,W.M。;Bo Ru Jiang,R.K.L.,基于Svm-rfe的多类Svm分类器特征选择和田口参数优化,Sci。世界期刊,2014(2014),795624-795624
[27] Wang,J。;杜,H。;姚,X。;胡,Z.,基于网格搜索支持向量机的分类结构药代动力学关系(scpr)方法预测药物生物利用度,Ana。蜂鸣器。《学报》,601,156-163(2007)
[28] Kudo,M。;Sklansky,J.,为模式分类器选择特征的算法比较,模式识别。,33, 25-41 (2000)
[29] 加米西,P。;Benediktsson,J.A.,基于遗传算法和粒子群优化混合的特征选择,IEEE Geosci。遥感快报。,12, 309-313 (2015)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。