×

无监督二次曲面支持向量机及其在信用风险评估中的应用。 (英语) Zbl 1430.62138号

摘要:无监督分类是机器学习方法中一项非常重要的任务。虽然支持向量机(SVM)在监督分类中取得了很大的成功,但它很少用于未标记数据点的分类,这也带来了许多缺点,包括对非线性核和随机初始化敏感,计算成本高,不适合不平衡数据集。本文利用支持向量机的优点,克服基于支持向量机聚类方法的缺点,提出了一种全新的无需初始化的两阶段无监督分类方法:提出了一个新的无监督核二次曲面支持向量机(QSSVM)模型,以避免选择核和相关核参数,然后设计了golden-section算法,为平衡和非平衡数据生成合适的分类器。通过研究该模型的某些特性,开发了一种收敛的分解算法,以有效地实现该非凸QSSVM模型(从计算成本来看)。对人工和公共基准数据的数值测试表明,提出的无监督QSSVM方法优于众所周知的聚类方法(包括基于SVM的方法和其他最先进的方法),特别是在分类精度方面。此外,我们通过合并基于T检验的特征权重,将该方法扩展并应用于信用风险评估。基于基准个人信用数据和真实企业信用数据的有希望的数值结果有力地证明了所提方法的有效性、效率和可解释性,并表明了其在某些真实应用中的巨大潜力。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
90立方厘米20 二次规划
91G40型 信用风险

软件:

UCI-毫升
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] AghaeiRad,A。;陈,N。;Ribeiro,B.,《利用自组织映射的学习知识转移提高信用评分》,《神经计算与应用》,第28期,第1329-1342页(2017年)
[2] 安·W。;Liang,M.,基于类内离散度的模糊支持向量机在异常值或噪声分类问题中的应用,神经计算,110,101-110(2013)
[3] Astorino,A。;Fuduli,A.,半监督球形分离,应用数学建模,39,6351-6358(2015)·Zbl 1443.90009号
[4] Avriel,M。;王尔德,D.,对称斐波那契搜索技术的最优性,《斐波那奇季刊》,3265-269(1966)·Zbl 0144.40705号
[5] Bache,K.和Lichman,M.(2013)。UCI机器学习库。网址:http://archive.ics.uci.edu/ml; Bache,K.和Lichman,M.(2013)。UCI机器学习库。网址:http://archive.ics.uci.edu/ml
[6] 比西戈,M。;Figueiredo,M.,使用加权单类支持向量机的软聚类,模式识别,42,27-32(2009)·Zbl 1173.68623号
[7] 布兰奎罗,R。;Carrizosa,E。;Jimenez-Cordero,A。;Martin-Barragan,B.,《函数数据支持向量机的函数带宽核:交替优化算法》,《欧洲运筹学杂志》,275195-207(2019)·Zbl 1430.90450号
[8] 卡马斯塔,F。;Verri,A.,一种新的聚类核心方法,IEEE模式分析和机器智能汇刊,27801-805(2005)
[9] Chang,Y.,N维黄金分割搜索:其变体和局限性,第二届生物医学工程和信息学国际会议论文集(2009)
[10] 陈,Z。;风扇,Z。;Sun,M.,《使用多类型多路数据进行分类的多核支持张量机及其在交叉销售建议中的应用》,《欧洲运筹学杂志》,255,110-120(2016)·兹比尔1346.62158
[11] 科尔特斯,C。;Vapnik,V.,支持向量网络,机器学习,20,273-297(1995)·Zbl 0831.68098号
[12] Fung,G。;Mangasarian,O.,《通过绝对值不等式进行无监督和半监督分类》,《优化理论与应用杂志》,168551-558(2016)·Zbl 1343.90051号
[13] B.加达。;Naoum-Sawaya,J.,使用支持向量机进行高维数据分类和特征选择,《欧洲运筹学杂志》,265993-1004(2018)·Zbl 1381.62170号
[14] Kanungo,T。;蒙特,D。;内塔尼亚胡,N。;Piatko,C。;西尔弗曼,R。;Wu,A.,一种有效的k-means聚类算法:分析与实现,IEEE模式分析与机器智能汇刊,24881-892(2002)
[15] Kohonen,T.,拓扑正确特征图的自组织形成,生物控制论,43,59-69(1982)·Zbl 0466.9202号
[16] 库塔奈,F.N。;萨杰迪,H。;Khanbabaei,M.,用于信用评分的特征选择算法和集成学习分类器的混合数据挖掘模型,《零售与消费者服务杂志》,27,11-23(2015)
[17] 莱斯曼,S。;Baesens,B。;Seow,H。;Thomas,L.,《信用评分的标杆先进分类算法:研究更新》,《欧洲运筹学杂志》,247124-136(2015)·Zbl 1346.90835号
[18] 罗,J。;方,S.-C。;邓,Z。;郭,X.,二元分类的二次曲面支持向量机,《亚太运筹学杂志》,331650046(2016)·Zbl 1354.68225号
[19] 罗,J。;Hong,T。;Fang,S.C.,数据完整性攻击下负荷预测模型的基准稳健性,《国际预测杂志》,34,89-104(2018)
[20] 罗,J。;田,Y。;Yan,X.,基于模糊一类二次曲面支持向量机的聚类,软计算,215859-5865(2017)·兹伯利06864785
[21] 马尔多纳多,S。;佩雷斯,J。;Bravo,C.,《支持向量机基于成本的特征选择:在信用评分中的应用》,《欧洲运筹学杂志》,261656-665(2017)·Zbl 1403.90526号
[22] 马丁内茨,T。;Schulten,K.,用于矢量量化的Neural-gas网络及其在时间序列预测中的应用,IEEE神经网络汇刊,4558-569(1993)
[23] 纳泽米,A。;Heidenreich,K。;Fabozzi,F.J.,使用多因素支持向量回归改进公司债券回收率预测,《欧洲运筹学杂志》,271664-675(2018)·Zbl 1403.91369号
[24] Ng,A。;乔丹,M。;Weiss,Y.,《关于光谱聚类:分析和算法》,神经信息处理系统进展,14555-569(2001)
[25] Schaible,S。;Ibaraki,T.,分数编程,《欧洲运筹学杂志》,12325-338(1983)·Zbl 0529.90088号
[26] Schaible,S。;Shi,J.,分式编程:比率总和案例,优化方法与软件,18,219-229(2003)·Zbl 1070.90115号
[27] Thi,H。;Dinh,T.,《DC编程和DCA:三十年的发展》,《数学编程》,169,5-68(2018)·Zbl 1387.90197号
[28] Wang,H。;郑,B。;Yoon,S。;Ko,H.,一种基于支持向量机的乳腺癌诊断集成算法,《欧洲运筹学杂志》,267687-699(2018)·兹比尔1403.92109
[29] 严,X。;Bai,Y。;方,S.-C。;Luo,J.,一种用于半监督学习的无核二次曲面支持向量机,运筹学学会杂志,671001-1011(2016)
[30] 周,L。;赖,K。;Yen,J.,基于加权SVM的AUC最大化信用评分模型,《国际信息技术与决策杂志》,4677-696(2009)·Zbl 1186.91238号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。